국내외 과학기술 정책에 대한 간략한 정보

단신동향
국내단신
독자 인공지능 기초모형(AI 파운데이션 모델) 확보를 위한 성능평가 데이터셋 구축 추진 원문보기 1
- 국가 한국
- 생성기관 과학기술정보통신부
- 주제분류 핵심R&D분야
- 원문발표일 2025-07-17
- 등록일 2025-07-28
- 권호 291
○ 과학기술정보통신부는 ‘독자 인공지능 기초 모형(AI 파운데이션 모델)’ 사업에서 개발된 AI 모형의 성능 평가를 위해 ‘성능 평가 데이터 모음(데이터셋) 구축 사업’ 수행기관 공모
- 그간 글로벌 빅테크 기업을 필두로 다양한 생성형 AI 서비스가 등장하였으나 성능평가에서 영어권의 평가지표가 활용되며 국내 서비스 이용 환경 반영에 난항
- 이에 우리나라 문화 등을 반영하고 국내외 다양한 AI 모형의 성능을 객관적으로 진단하기 위해 총 24억 원을 투입하여 고품질 성능평가 데이터셋 구축을 추진
- 올해는 먼저 3개 분야*의 데이터셋을 구축하고 향후 멀티모달, 에이전트 등 생성형 AI 모형의 다양한 영역을 평가하기 위한 데이터셋을 구축해 나갈 계획
* ①LLM의 수학 풀이 능력 평가 데이터, ②한국형 지식 평가를 위한 주제별 질의-정답 추론 데이터, ③장문 문맥에서 다양한 과업에 대한 성능평가 데이터
- 이번 사업을 통해 구축한 성능 평가 데이터셋은 향후 국내 AI 개발 기관이 활용할 수 있도록 공개하며 국내 AI 생태계 경쟁력 강화에 기여할 것으로 전망