슈퍼브 큐레이트
스마트하고 간편하게 데이터 선별하기
컴퓨터 비전 데이터셋을 위한 모든 AI 기반 프로덕트와 툴이 한 곳에, 유의미한 데이터만을 큐레이션해 라벨링 비용은 절감하고 모델 성능은 개선하세요.
“ML 프로젝트를 진행할 때 한정된 자원을 적재적소에 잘 사용하면서 동시에 모델을 상용화하기에 충분한 양의 고품질 데이터까지 확보하기는 정말 어려웠는데, Superb Curate를 만나고 제 생각이 바뀌었습니다. 우선적으로 라벨링해야 하는, 모델 성능 개선에 가장 유의미한 데이터를 자동으로 선별해 주는 데다, 강력한 검색 기능과 함께 사용하면 신규 객체 클래스를 훨씬 빠르게 추가할 수 있거든요. 또 특징맵(feature map)에서 훈련용 데이터를 균일하게 추출해 주어서 데이터가 편향될 일 없이 소량의 엄선된 데이터만으로도 원활하고 빠른 모델 재훈련이 가능했습니다.”
Nippon Steel Corporation l Nobuyuki Tatemizo
Ph.D.Researcher
핵심 기능
강력한 임베딩 기반 검색 기능으로 자연어나 이미지 쿼리를 통해 보유한 데이터나 오픈소스 데이터셋에서 정확히 원하는 데이터만을 추출하세요.
모델 예측 결과를 업로드해 인퍼런스 결과값을 정답 데이터와 시각적으로 비교하고, 성능이 저하되는 슬라이스를 파악하고, 가장 효과적으로 모델 성능을 개선할 수 있는 데이터만을 큐레이션하세요.
“원래도 아주 유용하게 사용하고 있었지만, AI 기반 데이터옵스 기능까지 추가되니 슈퍼브 플랫폼이 진정한 컴퓨터 비전 데이터용 통합형 데이터 관리 솔루션에 한 걸음 더 가까워진 것 같습니다. 특히 제가 바꾸고 싶은 부분을 알려주면 데이터셋을 자동으로 선별해 주는 기능은 정말 요긴할 것 같아요. 또 새로 출시되는 미스라벨 디텍션 기능까지 더하면 혼자서도 쉽고 빠르게 고품질 라벨링 데이터를 구축할 수 있을 겁니다.”
Blaine Bateman, Chief Data Scientist
오토 큐레이션이란?
슈퍼브 큐레이트는 독자적인 고차원 임베딩 생성 알고리즘과 비지도 학습을 통해 시각적 유사성을 바탕으로 이미지나 객체 데이터를 클러스터화합니다. 이 클러스터 정보를 바탕으로 큐레이션 알고리즘이 여러분의 모델 니즈에 가장 적합한 데이터를 자동으로 선별합니다.
1. 데이터 업로드하기
새로운 데이터를 업로드하거나 기존의 데이터를 사용할 수 있습니다. 임베딩 생성과 클러스터링 작업이 완료되면 사용하고자 하는 데이터셋이나 슬라이스를 선택하세요.
2. 선택 후 실행하기
이름, 큐레이션하고 싶은 이미지의 양, (객체 큐레이션의 경우) 타겟 클래스를 선택해 큐레이션 파라미터를 설정하세요.
3. 결과 살펴보기
자동 큐레이션이 완료되면 결과물이 새로운 슬라이스의 형태로 저장됩니다. 함께 제공되는 심도 있는 애널리틱스와 리포트를 확인해 어떤 기준과 분포도로 데이터가 큐레이션되었는지 자세히 확인하세요.
데이터 선별 방법
전체 데이터셋을 가장 잘 대변하는 균형 잡힌 슬라이스를 큐레이션합니다. 가장 처음 사용할 훈련용 셋으로 적합합니다.
모델 성능 검증을 위한 고품질의 검증용 셋을 큐레이션합니다.
엣지 케이스일 확률이 높은 희소한 이미지나 객체를 우선적으로 큐레이션합니다.
잘못 라벨링 되었을 가능성이 가장 높은 데이터를 찾아 우선적으로 큐레이션합니다.
