
주요동향
주요동향
이미지 인식 등 한층 고도화된 ‘GPT-4’…업계 도입 경쟁 활발 원문보기 1
- 국가 주요국
- 생성기관 Open AI
- 주제분류 핵심R&D분야
- 원문발표일 2023-03-14
- 등록일 2023-03-31
- 권호 235
□ 인간 수준의 AI 개발 노력의 이정표 ‘GPT-4’
ㅇ 오픈AI는 챗GPT(GPT-3.5) 출시 불과 4개월 만에 후속 버전인 GPT-4를 공개
- 챗GPT가 신드롬을 일으킨 가운데 새로운 버전 GPT-4까지 진일보
- GPT-4는 인식과 추론 능력이 향상되었으며 이미지도 인식할 수 있는 멀티모달 AI로 그림을 입력하고 그림 내용을 바탕으로 대화와 해석 가능
- 기본적으로 글 요약 능력은 우수하며 문장 답변 능력에 더해 상세한 영상 설명, 농담을 만들어 내는 유머 감각 등 새로운 기능으로 차별화
- 아직 한국어 품질은 완벽하지 않지만 기존 GPT-3.5 버전을 능가하면서 비약적으로 발전했으며 한국어뿐 아니라 상당수의 다른 국가 언어들도 GPT 3.5의 영어 수준을 능가
- GPT-4 테크니컬 리포트(GPT-4 Technical Report)에 따르면 각 언어별 평가 점수에서 한국어(77%)는 하위권이지만 GPT-3.5의 영어 성능(70.1%)을 추월
ㅇ 오픈AI 측은 교육 기술 기업 ‘듀오링고’, ‘칸아카데미’와 핀테크 스타트업 ‘스트라이프’ 등 다수의 기업・국가와 파트너십을 맺고 GPT-4를 적용
ㅇ 한편 전문가들은 여전히 윤리문제, 사회적 편견, 환각(Hallucination), 악의적인 프롬프트에 대해 한계점을 보유하고 있는 것으로 평가
- 기존 챗GPT 대비 입력값의 다양화(음성, 이미지 등) 및 성능 향상이 있으나, 미흡한 추론 및 부정확한(최신 정보 결여) 답변 생성
- GPT-4는 2021년 9월까지의 데이터를 학습했기 때문에 그 이후 사실관계 변화는 알지 못한다고 밝히며 추론의 오류를 범하거나 사용자의 명백한 거짓 진술을 쉽게 받아들이는 것도 한계
ㅇ 오픈AI는 챗GPT플러스 고객에게 GPT-4를 우선 공개했는데 폭발적인 인기로 서버 과열 등 문제가 발생하면서 현재 GPT-4에 질문을 3시간 당 25개로 제한
□ GPT-4 시대 맞이한 빅테크 ‘마이크로소프트・구글’ 경쟁 속도전
ㅇ (마이크로소프트) 2019, 2021년 오픈AI에 투자하고 2023년 검색엔진 ‘빙(Bing)’과 클라우드 서비스 ‘애저’에 챗GPT 탑재에 이어 오피스제품군(워드・엑셀 등)에 GPT-4 접목을 발표하는 등 전방위적으로 확대
- 3.16일(현지 시간) ‘AI와 함께하는 일의 미래(Future of Work with AI)’ 행사를 개최해 워드・엑셀・ PPT・아웃룩・팀스 등 MS 365 애플리케이션에 GPT-4 기반의 ‘코파일럿(Copilot) 기술을 적용한다고 발표
- 코파일럿은 이름 그대로 ‘부조종사’처럼 MS 365에서 제공하는 사무용 소프트웨어의 사용을 보다 간편하게 지원하는 AI 기술을 일컫는 말
- 코파일럿은 챗GPT와 유사하게 간단한 명령어 입력만으로 결과물을 얻을 수 있다는 것이 강점으로 워드, 엑셀, 파워포인트, 아웃룩, 팀즈 등 널리 쓰이는 생산성 소프트웨어에 챗GPT와 같은 AI 비서를 접목한 셈
- MS는 코파일럿을 자연어 명령으로 콘텐츠를 생성하도록 워드, 엑셀, 파워포인트, 아웃룩, 팀스 등 오피스 앱에 내장하거나, 기업 사용자를 위한 ‘비즈니스 챗’ 형태로 제공
- 워드를 사용할 때 글을 작성, 편집, 요약하고 창작할 수 있어 사용자는 글을 쓰고 편집하는 시간을 절약할 수 있고, 코파일럿이 초안을 수정, 재작성 하도록 해 아이디어를 발전시키는 역할도 가능
- MS는 코파일럿의 일부 기능을 시연했는데 이용자가 “이 문서를 10장짜리 파워포인트 자료로 만들어줘”라고 입력하자 수초 만에 PPT 파일을 생성하고, 엑셀에서 데이터를 분석해 시각화된 자료를 생성하거나 워드를 이용해 비즈니스 제안서를 작성
- 정확한 코파일럿 도입 시기와 가격 정보는 공개하지 않았으나 몇 달 안에 가능할 것이라고 밝혔으며 대기업 8곳을 포함해 20곳의 기업과 코파일럿을 테스트 중이라고 설명
- 사티아 나델라(CEO)는 “컴퓨팅과 상호작용하는 방식의 발전과정에서 중요한 발걸음을 내딛었으며 일하는 방식을 근본적으로 바꾸고 생산성 증대의 새 물결을 일으킬 것”이라며 기대감 표명
- 한편 오픈AI의 그림 생성형 AI인 ‘달리(DALL-E)’를 검색엔진인 빙에 적용한 ‘빙 이미지 크리에이터(Bing Image Creator)’를 출시(3.21)하는 등 자사 서비스에 속속 도입
ㅇ (구글) 워크스페이스(Workspace) 생산성 제품군에 챗GPT와 유사한 생성형 AI (Generative AI)를 통합하는 전면적인 업그레이드 발표(3.14)
※ 오픈 AI의 GPT-4 공개 당일이자, 마이크로소프트의 챗GPT 기반 오피스 제품군 발표에 앞서 전략을 선보인 것은 AI 시장 주도권을 빼앗기지 않겠다는 의도로 해석
- 생성 AI가 통합된 구글 워크스페이스는 △지메일에서 이메일 초안 작성, △‘독스’에서 문서 작성 및 수정지원, △‘스프레드시트’에서 수식생성 및 수식자동완성, 상황별 분류, △‘미트’에서 배경 생성 및 노트 캡처, △‘슬라이드’에서 텍스트, 이미지, 오디오 및 비디오 생성, △’챗’에서 작업을 완료하기 위한 워크플로우 활성화 등 기능 제공
- 이어 AI챗봇 바드(Bard)의 오류를 개선하고 보완하여 미국・영국 일부 이용자 대상으로 출시(3.21)
ㅇ (바이두) 3.16일 미국 오픈AI 챗GPT 대항마 ‘어니봇(Ernie Bot, 원신이옌)’ 공개행사(Baidu ERNIE Bot Press Conference)를 열고 유튜브를 통해 생중계
※ 바이두는 어니봇 ‘어니’는 바이두의 오픈소스 딥러닝 플랫폼인 패들패들(PaddlePaddle)에서 개발하였으며 ‘지식 통합을 통한 향상된 표현’을 의미
- 이번에 발표한 어니봇은 2021년 더욱 진화된 ‘어니3.0(ERNIE 3.0)’을 기반으로 언어 이해, 언어 생성, 텍스트-이미지 생성 등 작업 수행, 특히 중국어 방언 등 이해력이 높은 것이 특징
- 어니봇을 검색과 클라우드 컴퓨팅, 자율주행차 소프트웨어 등 주요 사업과 결합할 계획이며, 자동차 제조사와 뉴스사이트 등 제휴사들도 어니봇을 자사 비즈니스에 활용 구상
- 앞서 2월 중국 규제 당국은 이미 자국 기술 기업에게 AI 챗봇을 대중에게 공개하지 말 것을 요청한바, ‘어니봇’ 서비스는 제한적으로 이루어질 전망
- 또한 어니봇 공개행사에서 실시간으로 상호작용을 선보이는 것이 아닌 사전녹화된 시연을 공개해 기대에 미치지 못했다는 평가가 주류를 이루면서 주가는 10% 이상 하락
□ 국내 대기업・스타트업도 경쟁 가세
ㅇ 국내 업계는 챗GPT 열풍과 함께 한국어에 특화된 서비스 개발에 적극 나서고 있는데 이번 GPT-4의 한국어 성능이 진일보하면서 경쟁이 더욱 치열하게 전개 예상
- 네이버는 초거대 AI ‘하이퍼클로바X(HyperCLOVA X)’를 7월, 카카오는 390억 개 매개변수를 학습한 ‘코(Ko)GPT-3.5’를 금년 상반기 공개 예정
- SKT는 AI 에이전트 서비스 ‘에이닷(A.)’에 장기기억 기술을 도입하고 멀티모달 서비스 등 본격적인 서비스 고도화에 착수
ㅇ GPT-4 공개 이후 카카오가 ‘다다음(ddmm)’이라는 한국형 AI 챗봇 서비스를 베타 버전으로 출시(3.19)해 주목받았으나, 아직 추가 개선은 필요
- 다다음 서비스는 이용자의 다양한 질문과 요청을 AI 기술기반으로 답변해 주는 생성 AI 서비스로 △GPT 기반의 인공지능 생성 대화, △검색 결과를 활용한 자료 조사, △‘그려줘’라는 말을 통해 텍스트 투 이미지(Text to image)로 생성하는 것 등 가능
- 카카오는 최신 정보를 기반으로 정확한 답변하기 위해 노력하고 있으나 기술적 특성으로 인해 답변에 대한 정확도와 신뢰는 보장하지 않으며 일부 부적절한 표현도 포함될 수 있다고 설명
- 정확한 완성도와 품질을 갖추기까지 시간은 조금 더 필요한 것으로 예상
ㅇ 그 외 다수의 스타트업들이 챗GPT나 GPT-4를 자사의 기존 서비스에 연동해 다양한 AI 서비스 제공