국내외 과학기술 정책에 대한 간략한 정보

단신동향
국내단신
인공지능 학습용 데이터, 역대 최대 규모로 개방한다 원문보기 1
- 국가 한국
- 생성기관 과학기술정보통신부
- 주제분류 핵심R&D분야
- 원문발표일 2023-04-30
- 등록일 2023-05-12
- 권호 238
○ 과학기술정보통신부와 한국지능정보사회진흥원은 ’22년도 「인공지능 학습용 데이터 구축사업」을 통해 구축한 학습용 데이터셋 310종을 7월 말까지 ‘AI허브’를 통해 순차적으로 개방할 계획을 발표
- 올해 개방하는 데이터는 총 310종으로 약 15억 건의 데이터 개방을 완료하면 ‘AI허브’ 이용자들은 총 691종, 약 26억 건의 데이터를 활용이 가능
- 올해는 대규모 개방인 점을 고려하여, 이용자들이 더 많은 데이터를 보다 빨리 활용할 수 있도록 품질검증 등을 먼저 마친 데이터를 우선 개방할 예정
○ 기업들과 연구자들이 새로운 데이터 확보에 어려움을 겪지 않도록 기존의 라벨링 데이터 중심의 사업을 개편하여, 초거대 인공지능 학습에 필요한 대규모 비라벨링 데이터와 한 번에 여러 가지 유형을 학습시킬 수 있는 다중임무형 라벨링 데이터 등 다양한 유형의 데이터를 지속 확보해 나갈 예정
- 올해 개방하는 데이터는 총 310종으로 약 15억 건의 데이터 개방을 완료하면 ‘AI허브’ 이용자들은 총 691종, 약 26억 건의 데이터를 활용이 가능
- 올해는 대규모 개방인 점을 고려하여, 이용자들이 더 많은 데이터를 보다 빨리 활용할 수 있도록 품질검증 등을 먼저 마친 데이터를 우선 개방할 예정
○ 기업들과 연구자들이 새로운 데이터 확보에 어려움을 겪지 않도록 기존의 라벨링 데이터 중심의 사업을 개편하여, 초거대 인공지능 학습에 필요한 대규모 비라벨링 데이터와 한 번에 여러 가지 유형을 학습시킬 수 있는 다중임무형 라벨링 데이터 등 다양한 유형의 데이터를 지속 확보해 나갈 예정