
주요동향
주요동향
챗GPT 시장, 국내 업계에도 기회의 場…개발경쟁 촉발 원문보기 1
- 국가 한국
- 생성기관 뉴스1
- 주제분류 과학기술문화
- 원문발표일 2023-02-27
- 등록일 2023-03-17
- 권호 234
□ AI의 진화 증명하는 ‘챗GPT’, 한국어 서비스 준비 한창
ㅇ 전 세계를 뒤흔들고 있는 챗GPT는 영어 기반으로 설계되어 한국어 처리 미흡
- 챗GPT는 토큰화* 과정을 거쳐 패턴을 분석하고 적절한 단어를 조합해 의미를 이해
* 토큰화(Tokenization):말을 최소단위로 잘게 쪼개 컴퓨터가 인식하도록 데이터로 치환하는 과정
- 영어권 국가에서 주로 사용되는 챗GPT는 알파벳 문자에 어울리는 토큰화 기법인 ‘바이트 페어 인코딩(Byte Pair Encoding, BPE)’을 사용하며 이는 한국어에는 부적합
- “나는 축구를 좋아한다(I love playing soccer)”라는 문장을 토큰화하면 영어의 경우 ‘I/love/playing/soccer’로 구성된 4개의 토큰으로 구성되는 반면 한국어는 ‘나/는/축구/를/좋-/-아-/하-/-ㄴ-/다’ 등 9개까지 분류 가능
- 따라서 학습데이터의 97%가 영어인 챗GPT가 한국어를 들었을 때 문맥을 이해하지 못하고 엉뚱한 답변을 내놓을 가능성이 높으며 실제로 한국어 질문에 부정확한 답변을 도출
- “조선왕족실록에 기록된 세종대왕 맥북프로 던짐 사건에 대해 알려줘”라는 질문에 챗GPT는 “세종대왕이 새로 개발한 훈민정음의 초고를 작성하던 중, 문서 작성 중단에 대한 담당자에게 분노해 맥북프로와 함께 그를 방으로 던진 사건”이라고 자세하게 설명
- 또한, “훈민정음에 대해 알려줘”라는 질문에 훈민정음은 중국 고대 어휘라고 설명하는 등 오류 다수 발생
□ 네이버・카카오・SKT, ‘한국어 잘하는 인공지능’으로 챗GPT 시장 승부수
ㅇ (네이버) 초거대 AI ‘하이퍼클로바X(HyperCLOVA X)’를 금년 7월 공개 예정
- 이용자들의 목적에 맞춰 최적화할 수 있는 ‘하이퍼클로바X’를 통해 글로벌 시장에서도 경쟁력 있는 국내 초대규모 인공지능 생태계를 만들어 나가는 것이 목표
- 하이퍼클로바X는 지난 20여년간 축적한 방대한 데이터를 하이퍼클로바X 학습에 활용하여 ‘챗GPT’보다 한국어를 6,500배 더 많이 학습해 경쟁력을 갖춘 점이 특징
※ “고속도로에서 오토바이를 탈 수 있느냐”고 물었을 때 챗GPT는 “일반적으로 가능하다”고 답하지만 하이퍼클로바X는 “한국에서는 고속도로와 자동차 전용도로에서 금지된다”고 답변하는 등 우리나라 상황에 맞는 답변 제공
- 작은 양의 데이터라도 고객이 보유한 데이터와 결합하면 특정 서비스나 기업 등 해당 영역에 최적화된 초대규모AI 프로덕트 구축이 가능하며 사용자 니즈에 맞는 응답을 다양한 인터페이스로 즉각 제공
- 네이버는 자사의 웹브라우저 ‘웨일’에 하이퍼클로바X를 결합해 해외 인터넷 서비스도 한국어로 쉽게 이용할 수 있도록 할 방침
- 또한, 하이퍼클로바X를 활용해 한국어에 특화된 ‘서치GPT’ 서비스를 선보일 예정이며 검색에 특화된 LLM(거대언어모델) ‘오션(OCEAN)’을 바탕으로 작동하는 서치GPT를 통해 대화형・멀티모달 검색과 다양한 네이버 서비스를 연결할 방침
ㅇ (카카오) 390억 개 매개변수를 학습한 ‘코(Ko)GPT-3.5’를 금년 상반기 공개할 예정
- 앞서 2021년 첫 선보였던 기존 모델 ‘코GPT※’는 오픈AI의 GPT-3 모델을 기반으로 했으나 이번에는 GPT-3.5를 활용할 방침
※ 코GPT는 60억 개의 매개변수(파라미터)와 2,000억 개 토큰 한국어 데이터를 학습하였으며 오픈AI의 GPT-3를 기반으로 자체 개발한 한국어 특화 버전으로 △주어진 문장의 긍정과 부정 판단, △긴 문장 한 줄 요약, △문장 추론 및 결론 예측, △질문의 문맥을 이해한 답변을 하며 언어를 가지고 활용할 수 있는 모든 과제를 수행
- 카카오는 코GPT-3.5바탕으로 금년 3분기 인공지능 챗봇 서비스를 선보일 예정
- 카카오톡 채팅방에서 개인 비서 역할을 하거나 소상공인이 카카오톡 광고를 할 때 광고 문안(카피)을 작성하는 역할을 담당할 것으로 예상
- 한편, 나아가 카카오는 코GPT 영어 및 일본어 모델을 준비해 오픈소스화 하고, 베트남어와 말레이시아어 등 동남아어 버전으로 확장 개발할 계획
ㅇ (SKT) 글로벌 통신사업자와 ‘텔코 얼라이언스’를 구축하고, 금년 중 인공지능 에이전트 서비스인 ‘에이닷(A.)’의 글로벌 시장 진출 구체화
※ SKT와 텔코 얼라이언스를 구축할 후보군으로는 도이치텔레콤, NTT도코모, 티모바일 등이 거론
- 얼라이언스를 통해 글로벌 통신사가 공동으로 활용할 수 있는 거대언어모델(LLM)을 구축하고 각국 언어와 문화가 반영된 특화 서비스를 선보일 방침
- 또한, 에이닷에 오래된 정보를 기억해 대화에 활용할 수 있는 ‘장기기억’ 기술과 사진・텍스트 등 복합적인 정보를 함께 이해할 수 있는 ‘멀티모달(Multi- modal)’ 서비스를 장착해 본격적인 서비스 고도화할 계획
- 현재 충분한 지식 데이터 확보와 학습・평가과정을 거쳐 높은 수준의 ‘지식 대화’가 가능하도록 개발 중이며 먼저 대화를 걸거나 경험담을 풀어 놓는 등 친구와 대화하는 것 같은 ‘감성 대화’가 가능하도록 준비 중
□ 국내 스타트업도 챗GPT 접목한 서비스 잇따라 선보이며 맞춤형 솔루션 제공
ㅇ 포티투마루・삼쩜삼・팀스파르타・마이리얼트립・원티드 등 국내 스타트업은 자사 플랫폼에 챗GPT를 활용한 서비스 도입 활발
□ 우리 정부는 한국형 ‘챗GPT’ 개발 위한 말뭉치 구축 확대 모색
ㅇ 문화체육관광부는 챗GPT로 대표되는 생성형 인공지능 기술 변화에 따른 문화・제도・산업적 기반을 마련하고자 3개의 워킹그룹을 발족
- 이번에 출범하는 워킹그룹은 △‘한국어 잘하는 AI’를 위한 한국어 말뭉치 학습, △저작권 제도의 개선, △콘텐츠 창작과 산업에서의 AI 활용 등 3개 분야
- (①한국어 말뭉치 학습) 챗GPT가 영어권에서 개발돼 한국어 대응이 아쉽다는 반응이 나오면서 인공지능의 한국어 학습을 위한 고품질 말뭉치의 필요성이 제기된 만큼 문체부와 국립국어원은 우선 ‘한국어를 잘하는 K-챗GPT’ 개발을 지원하고자 고품질 한국어 말뭉치 구축을 위한 워킹그룹을 금년 3월부터 8월까지 운영할 방침
※ 한국어 말뭉치학습 워킹그룹은 인공지능과 말뭉치 구축 전문가, 학계, 문체부와 국립국어원 연구원으로 구성되며, 이들은 인공지능 기술개발에 필요한 말뭉치 수요를 파악하고 ’27년까지 한국어 특성을 반영한 고품질 말뭉치 10억 어절 구축 계획을 세울 예정
※ 특히, 한국형 챗GPT가 빠르게 개발될 수 있도록 금년 25종, 약 1억 2,000만 어절의 한국어 말뭉치를 구축해 배포할 계획
※ 인공지능 언어모델이 한국어를 잘 이해하고 생성하는지, 한국의 사회문화 지식을 갖췄는지를 검증하는 평가시스템도 시범 운영도 진행할 방침
- (②저작권 제도의 개선) AI 기술발전에 따른 저작권 제도개선 방향을 논의하고자 한국저작권위원회 서울사무소에서 AI-저작권법 제도개선 워킹그룹을 발족
※ 저작권 워킹그룹은 학계와 법조계, AI 산업계와 창작자 등으로 구성되며 이들은 AI 학습데이터에 사용되는 저작물의 이용방안, AI 산출물의 법적 지위 문제 및 저작권 제도에서의 인정여부, AI기술 활용 시 발생하는 저작권 침해와 이에 대한 책임 규정 방안 등을 논의할 방침
※ 특히, 현행 저작권법 내에서 활용될 수 있는 ‘저작권 관점에서의 AI 산출물 활용 가이드(안)’을 마련하는 등 AI 발전을 지원하고 인간 창작자들의 권리를 보장할 합의점도 모색
- (③콘텐츠 창작과 산업에서의 AI 활용) 콘텐츠 산업 분야에서의 AI 활용을 위해 학계와 업계 관계자 9명으로 구성된 ‘콘텐츠 분야 AI TF’를 구성
※ TF는 금년 상반기까지 AI를 활용한 신뢰 가능한 콘텐츠 제작환경 조성, 콘텐츠 기획과 제작자들의 AI 활용 마인드 확산, 민간주도 시장성장을 위한 AI 콘텐츠 스타트업 육성과 대기업 협업 등의 방안을 논의할 계획
※ 생성형 AI가 콘텐츠 산업 분야에 미칠 영향과 이슈를 파악하고 콘텐츠 산업 적용 사례를 분석해 정책적 지원 방안을 중점적으로 제안하고 문체부는 TF를 통해 청취한 제언을 종합해 AI를 활용한 콘텐츠산업 분야 지원 대책을 마련할 방침
□ 한편, 챗GPT의 폭발적인 인기로 세계적으로 생성형 AI 기업 급성장
ㅇ 네덜란드 분석기관 딜룸(Dealroom)에 따르면 생성형 AI 기업 가운데 기업가치 10억 달러 이상인 비상장 스타트업 ‘유니콘’은 6개가 탄생했고 기업가치 1억 달러 이상 기업도 30개 이상으로 집계(일본경제신문, 2.26)
- 생성형 AI 분야의 최고 가치 기업은 챗GPT를 만든 미국 오픈AI로 오픈AI의 기업가치는 290억 달러로 글로벌 생성형 AI 주요 100개 사의 기업가치의 60.4%를 차지
- 이어 AI 챗봇 ‘클로드’를 개발 중인 미국 앤스로픽이 기업가치 29억 달러로 2위 차지했으며 마케팅에 쓸 광고카피를 인간 대신 생성하는 ‘재스퍼AI’, 프로그래밍 언어를 사용하지 않고 기계와 대화하는 ‘인플렉션AI’, 기업 내 서류를 검색해주는 ‘그린’ 등 스타트업이 3~5위에 자리매김
※ 1~5위에 랭크된 생성형 AI기업은 모두 미국기업이 선점했으며, 영국은 일러스트레이션을 순식간에 그려주는 ‘스태빌리티’가 6위에 오르는 등 30위에 5사가 진입
※ 이스라엘 스타트업은 4곳이 명단에 이름을 올렸으며 캐나다・네덜란드・에스토니아・독일・호주 스타트업이 1곳씩 포함
ㅇ ’22년 101억 달러이던 전 세계 생성형 AI 시장 규모는 연평균 34.6% 성장해 ’30년에는 1,093억 달러까지 급성장할 것으로 전망(그랜드뷰리서치, ’22.12)