본문으로 바로가기

국내외 과학기술 정책에 대한 간략한 정보

단신동향

해외단신

공개 데이터 규칙이 AI의 미래를 결정하는 방식 원문보기 1

  • 국가 미국
  • 생성기관 정보기술혁신재단
  • 주제분류 핵심R&D분야
  • 원문발표일 2026-03-13
  • 등록일 2026-03-24
  • 권호 307
○ 미국 정보기술혁신재단(ITIF) 산하 데이터 혁신 센터는 인터넷상에 공개된 데이터(Publicly Available Data)가 AI 모델 학습에 활용되는 과정에서 발생하는 개인정보 보호 문제와 혁신 사이의 갈등을 분석하고, 혁신 생태계를 보존하면서도 개인을 보호할 수 있는 실무적 정책 원칙을 제시하는 보고서를 발표
○ 인터넷상의 공개 웹사이트, 데이터베이스, 정부 기록 등은 AI 시스템이 언어를 이해하고 세상을 추론하며 정보를 검증하는 데 필수적인 지식 풀(knowledge pool)을 형성
- 미국은 기술적 장벽이 없는 한 공개 데이터의 자동 수집을 허용하는 경향이 있으나, 유럽연합(EU)은 공개 웹사이트의 정보라 할지라도 개인정보 처리에 엄격한 제한을 두며, 이러한 정책 차이는 향후 AI 개발 및 경제적 이익 확보의 향방을 결정짓는 주요 변수가 될 것으로 전망됨
- AI 시스템이 자율적으로 정보를 탐색하고 서비스와 상호작용하는 '에이전트형 AI(Agentic AI)'로 진화함에 따라, 공개 데이터 활용에 대한 투명성과 책임 소재 규명이 더욱 중요해지고 있음
○ ITIF는 혁신과 보호의 균형을 위해 다음과 같은 세 가지 핵심 원칙을 제안
- AI 모델 학습에 사용되는 데이터 수집 자체를 제한하기보다는, 민감한 개인정보 노출 등 AI 시스템의 유해한 결과물(결과)을 직접적으로 규제하고 해결해야 함
- AI 개발자가 자발적으로 투명성 관행을 준수하도록 유도하여 사용자가 자동화된 시스템과 상호작용하고 있음을 이해할 수 있게 하되, 기술 진화에 유연하게 대응할 수 있도록 해야 함
- 웹사이트의 로봇 배제 표준(robots.txt) 등 기계 판독이 가능한 옵트아웃(Opt-out) 신호를 준수하고, 데이터 준비 과정에서 자동화 도구로 민감 정보를 필터링하는 개발자에게는 법적 확실성을 보장해야 함

배너존

  • 케이투베이스
  • ITFIND
  • 한국연구개발서비스협회
  • 한국과학기술정보연구원