Superb Curate

インテリジェントなデータキュレーションで簡単に

AIベースの製品とツールで、すべてのコンピュータビジョンデータセットを一元的に管理し、最も価値のあるデータをキュレーションし、ラベリング費用を最適化し、より良いモデルを構築します。
curate-Data Management
icon-pie-chart-outline

データマネジメント

大量のデータを収集しながらアップロードし、パイプライン化することができます。

icon_file_raw

生データ

icon_file_raw

ラベル

icon_window_code_block

メタデータ

curate-Visualization & Analytics
icon_bar_chart

ビジュアライゼーション&アナリティクス

類似性や分布を評価

icon-gray-dot

エンベディングを使い、視覚的な類似性で分布を把握できます。

icon-gray-dot

アナリティクスを使って、メタデータやアノテーションによる分布を確認することができます。

curate-Query & Slice
icon_pie_chart

クエリ&スライス

メタデータとアノテーションの利用

icon-gray-dot

クエリで目的の条件に合うデータを簡単に見つけることができます。

icon-gray-dot

意味のあるデータを明確なスライスにグループ化できます

curate-Auto Curation
icon_filter_outline_on

オートキュレーション

高品質なエンベデッド付き

icon-gray-dot

バランスの良いトレーニングデータセットまたは検証データセットを自動作成。

icon-gray-dot

データセットのエッジケースやミスラベルを検出

" まだ実績のないMLプロジェクトのリソースと、実用化に必要な質の高いデータ量のバランスを慎重に取るのは大変でしたが、Superb Curateがそれを変えてくれました。最初にラベル付けするインパクトのあるデータを自動キュレーションし、それを強力な検索と組み合わせることで、新しいオブジェクトクラスを大幅に速く追加できるようになりました。また、フィーチャーマップから一様にティーチングデータを抽出できることが証明されたため、再トレーニングの時間も短縮され、特徴に偏りのないデータ削減が可能になりました。"

Nippon Steel Corporation l Nobuyuki Tatemizo

Ph.D.Researcher

より少ないデータでより優れたモデル性能を実現

curate_graph
15%

より良いモデル

追加データを収集することなく(ランダムサンプリングと比較して)、オブジェクトクラス全体で15%以上の精度と再現性を向上させることができます。

75%

ラベルコストの削減

性能を低下させることなく、一般的なデータの25%しか使用せずに、より確実なモデルを作成できます(オブジェクトクラス間のF-1の変化は0.5%以下)。

1

統合プラットフォーム

エンジニア、ラベラー、データチームが1つのプラットフォームで共同作業を行うことで、開発スピードの向上と開発の混乱を軽減し、より良い結果をもたらします。

主な特長

新しい画像やオブジェクトがアップロードされるたびに、高品質のエンベディングを自動生成するため、手動でのキュレーションやカスタムモデルなしでデータをクラスタリングすることができます。

画像とそれに付随するアノテーションやメタデータを含むデータを、収集後すぐに単一のプラットフォームにシームレスにアップロードし、パイプライン化します。

画像内にタグ付けされたメタデータやアノテーション情報を自由に組み合わせて、希望する条件に合致するデータを簡単に検索・グルーピングすることができます。

バランスの取れたトレーニングセットや検証セットの作成、エッジケースの検出、ミスラベルの発見など、モデルのニーズに合わせて最適なデータセットを自動的にキュレーションすることができます。

視覚的な類似性に基づいてクラスタ化された画像やオブジェクトの分布を2次元空間上で可視化し、データセットのパターンを理解し、異常値を見つけることができます。

メタデータ、アノテーションタイプ、オブジェクトクラスなどの分布を分析することで、データ内のトレンドやパターンを深く掘り下げることができます。

Superb Labelとシームレスに統合されます。最初にラベルを貼る価値の高いデータを特定し、ラベルにラベルバッチを送信し、ワンクリックでキュレートに再送信します。

自然言語や画像クエリを使用した強力なエンベディングを基にした検索を実行し、独自のデータセットやオープンソースデータセットから必要なデータを正確に見つけることができます。

モデルの予測値をアップロードして、推論結果とグランドトゥルースを視覚的に比較し、パフォーマンスの低いスライスを特定し、モデルを改善する可能性の高いデータをキュレーションします。

"AI主導のDataOps機能がSuperb Suiteに追加されたことで、プラットフォームはコンピュータビジョンデータの統合データ管理ソリューションへとさらに安全に移行することになります。データセットをキュレートして、提案された変更を見つける機能は、私たちにとって非常に強力なものになるでしょう。"
logo_autone

Blaine Bateman, Chief Data Scientist

オートキュートの仕組み

Superb Curateは、独自の高次元エンベッド生成アルゴリズムを提供し、教師なし学習により、画像やオブジェクトデータを視覚的類似性でクラスタリングします。このクラスターをもとに、キュレーションアルゴリズムがお客様のモデルニーズに最適なデータを自動的に選択します。
icon_upload

1. データアップロード

追加データを収集することなく(ランダムサンプリングと比較して)、オブジェクトクラス全体で15%以上の精度と再現性を向上させることができます。

icon_filter_outline

2. 選択と実行

キュレーションする画像の名前、枚数、オブジェクトキュレーションの場合は対象とするクラスを選択し、キュレーションパラメーターを選択します。

icon_bar_chart

3. Review Results

Curateは、アウトプットを新しいスライスとして自動的に保存し、詳細な分析とレポートを提供するため、詳細なクライテリアとデータ分布を確認することができます。

キュレーションの手法

データセットを最適に表現するバランスのとれたスライスを作成します。初期のトレーニングセットに適しています。

モデルの性能を検証するために使用できる、高品質の検証セットをキュレーションします。

まばらに点在する画像やオブジェクト、エッジケースの可能性が高いものを優先的に表示します。

誤ったラベルが貼られる可能性が高いデータを発見し、優先順位をつける。

curate_Curate what to label

こちらのお客様はSuperb AI でデータセットを作成しています

logo-samsung
logo-kakao
logo-nc
logo-lg
logo-hyundai
logo-evraz
logo-levatas
logo-rowbot
logo-phantomai
logo-overwatch

Give it a try

Join 5,000 machine learning teams already using Superb AI.