'21년 인공지능 학습용 데이터 구축사업 2차 공모

댓글 0

판교핫뉴스

2021. 5. 11.

'21년 인공지능 학습용 데이터 구축사업 2차 공모

작성일 2021-05-11 부서 데이터진흥과

 

 

 

’21년 인공지능 학습용 데이터 구축사업 2차 공모

 

- 일자리 충격 완화를 위한 ’21년 추경의 일환으로 40종 추가 구축

 

- 건강관리(헬스케어), 재난·안전 등 6대 분야 25종 지정과제와 지역·

자유과제 15종 공모

 

- 크라우드소싱 방식을 통해 국민 누구나 데이터 구축에 참여 가능

 

□ 과학기술정보통신부(장관 최기영, 이하 ‘과기정통부’)는 인공지능(AI) 개발에 필수적인 양질의 인공지능 학습용 데이터를 크라우드소싱을 통해 대규모로 구축하여 개방하는 ‘인공지능 학습용 데이터 사업’의 2차 공모를 5월 12일(수)부터 시작한다고 밝혔다.

 

ㅇ 동 사업은 기업, 연구자, 개인 등이 시간 및 비용 문제*로 개별 구축하기 어려운 인공지능 학습용 데이터를 대규모로(’25년까지 1,300종) 구축하여 인공지능(AI) 허브(aihub.or.kr)를 통해 개방하는 사업이다.

 

* 인공지능 학습용 데이터 구축 과정(수집·가공·검수)은 대부분 대규모의 반복 수작업이 수반되어, 인공지능 개발 프로젝트의 80%를 차지

 

ㅇ 이번 추경사업은 인공지능 산업 발전 기반을 조기에 마련함과 동시에, 경력단절여성, 취업준비청년 등 국민 누구나 온라인·재택으로 데이터 구축에 참여할 수 있는 일자리를 제공하여 코로나19 지속으로 가중되고 있는 고용 충격을 완화하는 것을 목표로 한다.

□ 이번 추경사업을 통해 구축되는 인공지능 학습용 데이터 40종은 본예산 사업과 마찬가지로, 6대 핵심분야* 지정 공모과제(25종)와 자유 공모과제(지역과제 10종**, 자유과제 5종)로 구성된다. 

 

* ➀음성·자연어, ➁비전(영상·이미지), ➂헬스케어, ➃교통·물류, ➄농·축·수산, ➅ 재난·안전·환경

** 컨소시엄 구성 시 지자체, 지역소재 기업·기관 참여 필수

 

ㅇ 지정과제(25종)는 민간·공공을 아우르는 광범위한 수요조사(3~4월) 결과를 바탕으로 분야별 전문가로 구성된 과제기획위 검토를 거쳐 확정되었다.

 

□ 과기정통부는 동 사업 데이터 구축에 참여하고자 하는 국민들이 과제별 크라우드소싱 플랫폼의 일자리 정보를 한 곳에서 확인할 수 있도록 인공지능(AI) 허브 홈페이지(aihub.or.kr)에 제공할 예정이다.

 

□ 본 사업 공모와 관련된 상세한 안내는 과학기술정보통신부 홈페이지(www.msit.go.kr)와 한국지능정보사회진흥원 홈페이지(https://www.nia.or.kr)에 공지되며, 참여를 원하는 기관·기업은 과제별로 컨소시엄을 구성하여 지원하면 된다.

 

 

붙임 : ’21년 추경 인공지능 학습용 데이터 지정 공모과제 데이터 목록

 

 

붙임 ’21년 추경 인공지능 학습용 데이터 지정과제(25종) 목록

분야 순번 데이터명 개요 비고

음성· 자연어 1 산업정보 연계 주요국 특허 영-한 데이터 해외 주요국 특허의 주요 내용을 읽고 해당 산업 분야를 자동으로 생성하는 인공지능기술 개발을 위한 데이터

2 전문분야 영-한, 중-한 영어권·중화권 국가 식품 정보의 인공지능 번역 기술 및 서비스 개발을 위한 데이터

말뭉치(식품)

3 문학작품 낭송․낭독 음성 데이터 자연스러운 문학작품 낭독(오디오북 등) 개발을 위한 시, 소설, 희곡, 시나리오 낭송 음성 데이터

4 숫자가 포함된 패턴 발화 데이터 AI 콜센터, 보이스봇, 스피커 서비스 시 자주 발화되는 주소, 차량, 주문번호 등 숫자 포함 음성 인식률 향상을 위한 데이터

5 방송콘텐츠 한-중,한-일 번역 병렬 말뭉치 TV, 라디오 등 방송콘텐츠 자막 생성 및 번역을 위한 한-중, 한-일 병렬 데이터

비전 6 한국인 전신 형상 및 치수 측정 데이터(성인) 개인 맞춤 제품 설계, 치수 추정 등을 위한 한국인 형상 및 치수 데이터

(이미지·영상) 7 반려동물 피부질환 데이터 반려동물 피부 질환을 판정하는 AI 개발을 위한 피부 표면 이미지 데이터

8 반려동물 안구질환 데이터 반려동물 안구 질환을 판정하는 AI 개발을 위한 안구 표면 이미지 데이터

9 유동 인구 분석을 위한 CCTV 영상 데이터 지역 상권의 유동 인구 및 상권 특성 분석을 위한 CCTV 영상 데이터

교통· 10 차량 수리비 산출을 위한 차량파손 이미지 데이터 차량 예상 수리비 산출 서비스를 위한 자동차 외관 손상부품 이미지 데이터

물류 11 부품 품질 검사 영상 데이터(자동차) 자동차 부품 품질 검사 시스템을 위한 X-Ray, 현미경, 3D 스캔 이미지 및 부품, 결합체 데이터

12 부품 품질 검사 영상 데이터(선박·해양플랜트) 선박 및 해양플랜트 부품(밸브, 피팅, 플랜지 등)에 대한 도금, 용접 등 품질 검사를 위한 데이터

헬스 케어 13 순음청력검사결과 데이터 난청의 조기진단 보조 및 난청 질환 세부 분류를 위한 순음청력검사 데이터

14 영유아 행동 영상 데이터  영유아 발달분석을 위한 영상 내 주요 행동 및 행동 분류 데이터

15 폐경 후 여성 및 60대 이상의 남성의 골밀도(BMD) 데이터 노령화 대표 질환인 골다공증의 정밀한 진단을 위한 골밀도 데이터 

16 약품식별 인공지능 개발을 위한 경구약제 이미지 데이터 경구약제 오남용 방지 및 분류 AI 개발을 위한 알약 이미지 및 메타정보 데이터

농·축· 수산 17 지능형 스마트축사 데이터(육계, 산란계)  산란계, 육계의 사육, 농장관리 등 인공지능 서비스를 위한 데이터

18 지능형 스마트축사 데이터(젖소) 젖소의 사육, 농장관리 등 인공지능 서비스를 위한 데이터

19 고품질 과수 작물 생육 및 환경 통합 데이터 과수 작물의 재배환경, 질병 등을 인공지능을 통해 분석할 수 있는 영상 이미지 및 센서 데이터

20 지능형 스마트팜 통합 데이터(버섯) 버섯 생장 예측을 통한 인공지능 기반 고품질 생산관리를 위한 데이터 

21 지능형 곤충 사육 데이터  곤충 사육환경 예측을 통한 생산성 극대화, 고품질 생산 및 관리를 위한 데이터 

재난· 22 기상 정보 데이터 기상 예측, 대기 상태 예보 등을 위한 천리안 위성, 레이더 등 기상 데이터

안전· 23 공원 주요시설 및 불법행위 감시 공원, 접근금지구역 등에 설치된 시설물의 상태변화(파손 등)와 불법행위(취사, 텐트 설치 등) CCTV 영상 데이터 

환경 CCTV 영상 데이터

24 자연 및 인공적 발생 非언어적 소리 데이터 물체, 동물, 자연 등 다양한 환경에서 발생하는 非언어적 소리 데이터 

25 야생동물 활동 영상 데이터 국립공원 등 보호지역에 서식하는 야생동물을 무인센서카메라, CCTV, 드론 등으로 촬영한 영상 데이터