슈퍼브 큐레이트

스마트하고 간편하게 데이터 선별하기

컴퓨터 비전 데이터셋을 위한 모든 AI 기반 프로덕트와 툴이 한 곳에, 유의미한 데이터만을 큐레이션해 라벨링 비용은 절감하고 모델 성능은 개선하세요.
curate-Data Management
icon-pie-chart-outline

데이터 관리

대규모 데이터를 수집, 업로드하고 데이터 파이프라인을 관리하세요

icon_file_raw

원시 데이터(Raw Data)

icon_file_raw

라벨(Labels)

icon_window_code_block

메타데이터(Metadata)

curate-Visualization & Analytics
icon_bar_chart

시각화 및 애널리틱스

데이터 유사성과 분포도를 분석하세요

icon-gray-dot

임베딩으로 데이터의 분포도와 시각적 유사성을 분석하세요.

icon-gray-dot

애널리틱스로 메타데이터 및 어노테이션 별 분포도를 확인하세요.

curate-Query & Slice
icon_pie_chart

쿼리 및 슬라이스

메타데이터와 어노테이션을 사용해 데이터를 검색하고 선별하세요.

icon-gray-dot

쿼리로 원하는 조건의 데이터를 쉽게 탐색하세요.

icon-gray-dot

슬라이스로 유의미한 데이터를 그룹 별로 분리하세요.

curate-Auto Curation
icon_filter_outline_on

자동 선별

고품질 임베딩으로 데이터를 자동으로 큐레이션하세요.

icon-gray-dot

오토 큐레이트로 균형 잡힌 훈련용/검증용 데이터셋을 구축하세요.

icon-gray-dot

데이터셋 내 엣지 케이스나 라벨링 오류를 검출하세요.

“ML 프로젝트를 진행할 때 한정된 자원을 적재적소에 잘 사용하면서 동시에 모델을 상용화하기에 충분한 양의 고품질 데이터까지 확보하기는 정말 어려웠는데, Superb Curate를 만나고 제 생각이 바뀌었습니다. 우선적으로 라벨링해야 하는, 모델 성능 개선에 가장 유의미한 데이터를 자동으로 선별해 주는 데다, 강력한 검색 기능과 함께 사용하면 신규 객체 클래스를 훨씬 빠르게 추가할 수 있거든요. 또 특징맵(feature map)에서 훈련용 데이터를 균일하게 추출해 주어서 데이터가 편향될 일 없이 소량의 엄선된 데이터만으로도 원활하고 빠른 모델 재훈련이 가능했습니다.”

Nippon Steel Corporation l Nobuyuki Tatemizo

Ph.D.Researcher

더 적은 데이터로 더 나은 성능의 모델을 구축하세요

curate_graph
15%

모델 성능 개선

추가 데이터 수집 없이도 전체 객체 클래스에 대한 정밀도와 재현율을 (랜덤 샘플링 대비) 15% 이상 개선할 수 있습니다.

75%

라벨링 비용 절감

평소 사용하는 데이터의 25%만으로도 성능 저하 없이 강건한 모델을 구현할 수 있습니다(전체 오브젝트 클래스 F-1 점수 변동폭 0.05% 이하)

1

통합형 플랫폼

엔지니어, 라벨러, 데이터 팀이 하나의 플랫폼에서 협업하면서 팀 간 마찰은 줄어들고 개발 속도는 향상되는 시너지 효과를 확인할 수 있습니다.

핵심 기능

새로운 이미지나 객체가 업로드 될 때마다 자동으로 고품질 임베딩이 생성되어 직접 일일이 데이터를 선별하거나 커스텀 모델을 사용하지 않아도 데이터를 손쉽게 클러스터화 할 수 있습니다.

취득한 이미지 뿐 아니라 이미지에 태그된 어노테이션과 메타데이터까지 하나의 플랫폼에 빠르고 쉽게 업로드하여 편하게 데이터 파이프라인을 관리하세요.

이미지에 태그된 메타데이터나 어노테이션 정보를 조합해 원하는는조건의 데이터를 쉽게 탐색하고 그룹화하세요.

모델이 가장 필요로 하는 데이터만을 자동으로 큐레이션 할 수 있습니다. 균형 잡힌 학습용, 검증용 데이터셋을 큐레이션하고 엣지 케이스와 라벨링 오류를 손쉽게 발견하세요.

시각적인 유사성을 바탕으로 클러스터화 된 이미지나 오브젝트의 분포도를 2차원 공간에 시각화하여 데이터셋의 패턴을 파악하고 예외적인 데이터를 색출하세요.

메타데이터, 어노테이션 타입, 객체 클래스 등의 분포도를 분석해 데이터의 트렌드나 패턴을 더 심층적으로 분석하세요.

Superb Label과 연동해 완전한 워크플로우를 경험하세요. 한 번의 클릭으로 우선적으로 라벨링해야 하는 가장 중요한 데이터를 식별하고 라벨링 배치를 Label로 전송한 뒤 다시 Curate로 전송할 수 있습니다.

강력한 임베딩 기반 검색 기능으로 자연어나 이미지 쿼리를 통해 보유한 데이터나 오픈소스 데이터셋에서 정확히 원하는 데이터만을 추출하세요.

모델 예측 결과를 업로드해 인퍼런스 결과값을 정답 데이터와 시각적으로 비교하고, 성능이 저하되는 슬라이스를 파악하고, 가장 효과적으로 모델 성능을 개선할 수 있는 데이터만을 큐레이션하세요.

“원래도 아주 유용하게 사용하고 있었지만, AI 기반 데이터옵스 기능까지 추가되니 슈퍼브 플랫폼이 진정한 컴퓨터 비전 데이터용 통합형 데이터 관리 솔루션에 한 걸음 더 가까워진 것 같습니다. 특히 제가 바꾸고 싶은 부분을 알려주면 데이터셋을 자동으로 선별해 주는 기능은 정말 요긴할 것 같아요. 또 새로 출시되는 미스라벨 디텍션 기능까지 더하면 혼자서도 쉽고 빠르게 고품질 라벨링 데이터를 구축할 수 있을 겁니다.”
logo_autone

Blaine Bateman, Chief Data Scientist

오토 큐레이션이란?

슈퍼브 큐레이트는 독자적인 고차원 임베딩 생성 알고리즘과 비지도 학습을 통해 시각적 유사성을 바탕으로 이미지나 객체 데이터를 클러스터화합니다. 이 클러스터 정보를 바탕으로 큐레이션 알고리즘이 여러분의 모델 니즈에 가장 적합한 데이터를 자동으로 선별합니다.
icon_upload

1. 데이터 업로드하기

새로운 데이터를 업로드하거나 기존의 데이터를 사용할 수 있습니다. 임베딩 생성과 클러스터링 작업이 완료되면 사용하고자 하는 데이터셋이나 슬라이스를 선택하세요.

icon_filter_outline

2. 선택 후 실행하기

이름, 큐레이션하고 싶은 이미지의 양, (객체 큐레이션의 경우) 타겟 클래스를 선택해 큐레이션 파라미터를 설정하세요.

icon_bar_chart

3. 결과 살펴보기

자동 큐레이션이 완료되면 결과물이 새로운 슬라이스의 형태로 저장됩니다. 함께 제공되는 심도 있는 애널리틱스와 리포트를 확인해 어떤 기준과 분포도로 데이터가 큐레이션되었는지 자세히 확인하세요.

데이터 선별 방법

전체 데이터셋을 가장 잘 대변하는 균형 잡힌 슬라이스를 큐레이션합니다. 가장 처음 사용할 훈련용 셋으로 적합합니다.

모델 성능 검증을 위한 고품질의 검증용 셋을 큐레이션합니다.

엣지 케이스일 확률이 높은 희소한 이미지나 객체를 우선적으로 큐레이션합니다.

잘못 라벨링 되었을 가능성이 가장 높은 데이터를 찾아 우선적으로 큐레이션합니다.

curate_Curate what to label

엔지니어가 꿈꿔온 데이터셋을 함께 만들어가고 있습니다

logo-samsung
logo-kakao
logo-nc
logo-lg
logo-hyundai
logo-evraz
logo-levatas
logo-rowbot
logo-phantomai
logo-overwatch

지금 시작해보세요

5,000 + 머신러닝 팀이 우리와 함께 데이터를 관리하고 있습니다.