
주요동향
주요동향
중국, 기업과 대학의 독자 기술력으로 생성AI 공개 등 협력 강화 원문보기 1
- 국가 중국
- 생성기관 지디넷코리아
- 주제분류 핵심R&D분야
- 원문발표일 2023-07-18
- 등록일 2023-09-08
- 권호 246
□ 차이나모바일, AI 초거대 모델 개발하며 오픈 협력 생태계 강화
ㅇ 중국 최대 통신사 차이나모바일은 AI 스마트 플랫폼 ‘지우톈(九天)’ 오픈 협력 생태계를 공개하고 자체적으로 개발한 AI 초거대 모델을 공공 및 민간 기업에게 서비스 제공
- 오픈 협력 생태계는 36개 파트너가 참여하며 9개의 대학과 연구기관, 17개의 AI 기초 소프트웨어 및 하드웨어 주요 기업, 1개의 3급 의료기관, 5개의 공기업, 4개의 산업 및 표준화 조직이 포함
- 지우톈은 두 가지 버전으로 나뉘며 지우톈 하이쑤안 행정 빅모델과 지우톈 고객 서비스 빅모델로 분류
- 행정 빅모델은 공공 업무 사안에 대한 이해 능력을 갖추고 있으며, 여러 차원의 정보 관련 기능을 보유해 복잡한 사안과 복잡한 프로세스에 대해 다중 상호작용이 가능한 점이 특징
□ 칭화대, 중국어・영어 대화 가능한 AI 챗봇 무료 배포
ㅇ 중국 칭화대학교 컴퓨팅 기술 성과 상용화 기업 ‘즈푸AI’와 칭화 KEG 실험실은 중국어-영어 대형언어모델인 ‘챗GLM-6B’와 ‘챗GLM2-6B’를 학술 연구 및 기업에 제공
- 챗GLM-6B는 일반언어모델(GLM) 아키텍처를 기반으로 62억 개의 매개변수를 가진 초거대 언어 AI
- 챗GLM-6B의 후속버전인 챗GLM2-6B는 GLM의 혼합목적함수를 기반으로 1조 4,000억 개의 중국어 및 영어 토큰 데이터 세트에 대하여 학습하고 모델 정렬을 수행했으며 추론 속도가 1세대에 비해 42% 증가하는 등 생성 속도 개선
- 콘텍스트 길이는 챗GLM-6B의 2K에서 32K로 늘렸으며 추론 속도와 리소스 효율성 측면에서 효율적 추론과 낮은 메모리 사용을 달성할 수 있는 멀티쿼리어텐션(Multi-Query Attention) 기술을 사용
- 특히, 챗GLM2-6B는 상하이교통대학 언어지능기술실험실이 운영하는 중국어 기초 모델 평가(Ceval) 키트에서 GPT4를 앞선 것으로 평가
ㅇ 두 모델은 올해 7월 초 기준 허깅페이스(Huggingface)에서 이미 다운로드양이 300만과 120만을 각각 넘어선 것으로 분석
※ 허깅페이스는 기계 학습을 사용하여 애플리케이션을 구축하기 위한 도구를 개발하는 미국 회사로 자연어 처리 애플리케이션용으로 구축된 변환기 라이브러리와 사용자가 기계 학습 모델 및 데이터 세트를 공유할 수 있는 플랫폼
□ 알리바바 클라우드, AI 이미지 생성 모델 ‘통이 완샹’ 공개
ㅇ 알리바바 클라우드는 AI 이미지 생성 모델인 ‘통이 완샹(Tonyi Wanxiang)’을 발표
- 통이 완샹은 중국어나 영어 텍스트 명령에 따라 수채화, 유화, 중국화, 애니메이션, 스케치, 평면 일러스트레이션, 3D 만화까지 다양한 스타일의 이미지를 생성
- 특히, 알리바바 클라우드가 보유한 지식 구조화, 시각 AI, 자연어 처리(NLP) 분야 기술을 기반으로 다국어 자료를 활용해 학습을 강화했으며 이를 바탕으로 정확하고 맥락에 맞는 이미지를 생성
- 또한, 신호 대비 잡음비(signal-to-noise ratio, SNR)를 기반으로 고해상도 확산 프로세스를 최적화해 구도의 정확도와 세부 선명도 간의 균형을 맞추는 동시에 깔끔한 배경을 지닌 고대비의 이미지를 생성
- 통이 완샹을 통해 고품질 생성 AI 이미지에 대한 접근성을 높이고 전자상거래, 게임, 디자인, 광고 등 다양한 분야에서 혁신적 AI 아트와 창의적 표현의 개발을 가능할 것으로 기대
ㅇ 올해 4월 대형언어모델(LLM) ‘통이치엔원(Tongyi Qianwen)’을 출시하며 자사의 다양한 비즈니스에 통합해 사용자 경험을 개선
- 통이치엔원은 알리바바클라우드의 지능형 어시스턴트인 팅우(Tingwu)에도 통합돼 어시스턴트가 높은 수준의 정확성과 효율성으로 멀티미디어 콘텐츠를 이해하고 분석할 수 있도록 돕는 대규모 언어 모델
- 통이치엔원이 출시된 이후 핀테크, 전자, 운송, 패션, 유제품 등 다양한 분야의 기업으로부터 30만 건 이상의 베타 테스트 요청을 받은 것으로 파악