Superb Curate
インテリジェントなデータキュレーションで簡単に
AIベースの製品とツールで、すべてのコンピュータビジョンデータセットを一元的に管理し、最も価値のあるデータをキュレーションし、ラベリング費用を最適化し、より良いモデルを構築します。
" まだ実績のないMLプロジェクトのリソースと、実用化に必要な質の高いデータ量のバランスを慎重に取るのは大変でしたが、Superb Curateがそれを変えてくれました。最初にラベル付けするインパクトのあるデータを自動キュレーションし、それを強力な検索と組み合わせることで、新しいオブジェクトクラスを大幅に速く追加できるようになりました。また、フィーチャーマップから一様にティーチングデータを抽出できることが証明されたため、再トレーニングの時間も短縮され、特徴に偏りのないデータ削減が可能になりました。"
Nippon Steel Corporation l Nobuyuki Tatemizo
Ph.D.Researcher
主な特長
自然言語や画像クエリを使用した強力なエンベディングを基にした検索を実行し、独自のデータセットやオープンソースデータセットから必要なデータを正確に見つけることができます。
モデルの予測値をアップロードして、推論結果とグランドトゥルースを視覚的に比較し、パフォーマンスの低いスライスを特定し、モデルを改善する可能性の高いデータをキュレーションします。
"AI主導のDataOps機能がSuperb Suiteに追加されたことで、プラットフォームはコンピュータビジョンデータの統合データ管理ソリューションへとさらに安全に移行することになります。データセットをキュレートして、提案された変更を見つける機能は、私たちにとって非常に強力なものになるでしょう。"
Blaine Bateman, Chief Data Scientist
オートキュートの仕組み
Superb Curateは、独自の高次元エンベッド生成アルゴリズムを提供し、教師なし学習により、画像やオブジェクトデータを視覚的類似性でクラスタリングします。このクラスターをもとに、キュレーションアルゴリズムがお客様のモデルニーズに最適なデータを自動的に選択します。
1. データアップロード
追加データを収集することなく(ランダムサンプリングと比較して)、オブジェクトクラス全体で15%以上の精度と再現性を向上させることができます。
2. 選択と実行
キュレーションする画像の名前、枚数、オブジェクトキュレーションの場合は対象とするクラスを選択し、キュレーションパラメーターを選択します。
3. Review Results
Curateは、アウトプットを新しいスライスとして自動的に保存し、詳細な分析とレポートを提供するため、詳細なクライテリアとデータ分布を確認することができます。
キュレーションの手法
データセットを最適に表現するバランスのとれたスライスを作成します。初期のトレーニングセットに適しています。
モデルの性能を検証するために使用できる、高品質の検証セットをキュレーションします。
まばらに点在する画像やオブジェクト、エッジケースの可能性が高いものを優先的に表示します。
誤ったラベルが貼られる可能性が高いデータを発見し、優先順位をつける。
