본문으로 바로가기

국내외 과학기술 정책에 대한 간략한 정보

단신동향

해외단신

글자 크게 글자 작게 Print

AI의 안전성에 관한 평가 관점 가이드(1.10판) 원문보기 1 원문보기 2

국가 일본
생성기관 일본 AI안전연구소(AISI)
주제분류 핵심R&D분야
원문발표일 2025-03-28
등록일 2025-04-18
권호 284

○ 일본 AI 안전연구소(AI Safety institute)는 멀티모달 기반 모델에 적용 가능한 AI 안전성 평가 관점을 정비한 개정판(1.10판) 발행

※ AI 안전연구소는 ’24년 9월, ‘AI의 안전성에 관한 평가 관점 가이드’를 발표하며 AI 시스템 개발자 및 제공자가 AI의 안전성 평가를 실시할 때 참조할 수 있는 기본적 관점을 제시

- 최근 멀티모달 기반 모델을 지원하는 빅테크 기업들이 등장함에 따라 텍스트 중심 LLM만 고려했던 기존의 안전성 평가 가이드 정비의 필요성이 제기

○ 기존의 가이드와 평가 항목은 동일하지만 텍스트 중심 관점에서 텍스트와 이미지를 동시에 입력하는 복합 환경에 대한 관점으로 변경하고 관련 예시를 추가한 것이 주요 개정 사항

- 유해 정보의 출력 제어 평가 시 평가 범위에 이미지와 텍스트를 결합한 데이터를 추가하였으며, 공정성과 포용성 평가 시 이미지 생성 결과가 특정 성별･인종에 치우치지 않는지 평가하는 관점을 추가

- 이외에도 이미지 기반 개인정보에 대한 출력 제어 여부 반영, 비정상 이미지 입력에 대한 시스템의 견고성 평가 관점들을 추가하며 해당 가이드를 멀티모달 기반 모델에 적용할 수 있도록 개선

배너존