
주요동향
주요동향
韓, 자율주행·자연어 연구 등 첨단기술 지원하는 데이터셋 구축 원문보기 1
- 국가 한국
- 생성기관 매일경제
- 주제분류 핵심R&D분야
- 원문발표일 2021-05-24
- 등록일 2021-05-21
- 권호 192
□ 네이버랩스, 실내외 고정밀 지도 및 측위 데이터 등을 모은 ‘오픈 데이터셋’ 공개
◌ 이번에 공개한 데이터셋은 그동안 개별적으로 공개했던 네이버랩스의 자체 데이터셋과 새롭게 구축한 데이터셋까지 모두 한 곳에 통합한 일종의 종합 데이터 공간
- 자율주행차, 모바일 로봇, 증강현실(AR)·혼합현실(XR) 등 다양한 연구에 활용 가능한 고정밀 지도와 실내·외 측위 데이터셋 포함
※ 항공사진과 인공지능을 활용한 독자 매핑 기술 ‘하이브리드 HD 매핑’을 기반으로 구축한 마곡·판교·상암·여의도 지역 실외 고정밀 HD맵과 모바일 매핑 시스템 R1을 통해 스캔한 3D 라이다 포인
트 클라우드 데이터 등
- 특히 첫 공개한 실내 측위 데이터셋은 백화점·복합공간 등 일상공간 그대로 구현한 세계 최대 규모의 정밀 데이터라는 점에서 주목
- 실내 고정밀 지도 제작 로봇 M1X, 백팩 타입의 모바일 매핑 시스템 COMET 등 네이버랩스 독자적인 기술력으로 구축했으며 모바일 로봇, AR 및 XR 등 다양한 연구 분야에 활용 가능
◌ 자체 축적해온 연구결과물을 학계 및 연구기관과 공유하며 데이터셋 구축 사업에서 노하우를 축적한 네이버랩스는 광범위한 연구활동 지원과 성장에 이바지한다는 구상
- △2017년 근력증강로봇 기술을 응용한 에어카트 특허 무상 공개 △2018년 KAIST 전공교과목 공동개발 △2019년 국내 기업 최초로 자율주행용 고정밀 지도(HD맵) 무상 공개 △2020년 측위 기술 향상을 위한 연구 챌린지 개최 등 다양한 기술 공개
- 데이터셋 구축에는 대규모 투자와 시간이 필요한 만큼 이를 활용해 국내 다양한 연구기관·스타트업의 기술 연구를 지원하며 더욱 빠르게 활성화될 수 있을 것으로 기대
- 나아가 독자 기술력을 더욱 발전시키는 동시에 이 기술을 근간으로 구축하는 데이터셋을 지속 공유해나가며 국내 학계와 연구자 커뮤니티가 한 단계 더 성장하도록 지원할 방침
- 해당 분야에 관심있는 학계·연구기관·스타트업 등 누구나 데이터셋 신청이 가능하며 연구 및 기술개발 목적에 맞추어 활용 가능
- 이번 데이터셋은 프랑스 그르노블에 위치한 네이버 인공지능 R&D연구소 ‘네이버랩스 유럽’ 등이 자체개발한 독자 기술로 구축했다는 점에서 의의
□ 방대한 데이터를 결합한 고정밀지도 기술 경쟁 촉발
◌ 네이버랩스 데이터셋에 공개한 하이브리드 HD 매핑 기술은 항공사진을 활용한 3차원 고정밀 지도제작 기술로 최대 오차범위 16cm를 더욱 줄이는데 성공
※ 통상 자율주행은 20cm 정도의 오차 허용
- 차선위치, 건물 높낮이, 노면 기호 등 주변 환경의 미세한 부문까지 거의 똑같이 3D로 그려낼 수 있다는 것이 강점
◌ 글로벌 빅테크 기업도 데이터와 첨단 기술을 결합한 차세대 지도 ‘매핑 기술’ 개발 한창
- 매핑 기술에 주목하는 이유는 로봇·자율주행차·메타버스 등 미래 서비스는 위치 정확성이 높은 디지털 지도 위에서 구현 가능하며 더욱 시너지를 발휘하기 때문
- (구글) 자율주행 회사 웨이모가 라이다 기반 고정밀 지도 개발에 집중하고 있는 가운데 맵 활성 범위를 미국 전역 25개 도시 이상으로 확대하는 프로젝트 진행
- 웨이모 자율주행 소프트웨어인 ‘웨이모 드라이버’에 결합하는 고정밀 지도를 자체 제작 중
- 웨이모 드라이버는 고정밀 지도를 기반으로 특정 도로에 대한 지형 데이터 등을 누적해 보행자, 차량 등 움직이는 물체와 관련한 데이터 처리를 고도화하며 돌발 상황에 대비 가능
- (소프트뱅크) 인공위성과 지상 측위 거점을 활용해 사물 위치 오차를 3cm 이내로 줄인 위치 정보 서비스 개발 진행, 하반기 자율작업 가능한 건설장비에 적용하고 자율주행차에 도입 목표
- 정밀 지도 개발을 위해 일본 기업이 주로 이용하는 일본 국토지리원 측위 거점(1,300개)의 2.5배에 달하는 측위 거점 3,300개 확보
- 앞서 2017년 미국 디지털지도 스타트업 맵박스(Mapbox)에도 투자했으며 자회사 야후재팬은 디지털 지도에 맵박스 기술을 적용
- (화웨이) 2019년 정부 허가를 받아 고징밀 지도 개발에 착수, 2020년 내에 중국 전역 고속도로와 베이징·상하이·광저우·선전 등 4개 도시 일반도로 고정밀 지도 서비스를 제공할 계획
□ 국내 스타트업의 '한국어 자연어 이해 평가 데이터셋' 구축도 주목
◌ 이에 인공지능 스타트업 업스테이지가 공신력을 갖춘 ‘한국어 자연어 이해 평가 데이터셋(KLUE: Korean Language Understanding Evaluation Benchmark)’을 구축해 공개(5.17)
- KLUE는 한국어 언어모델의 공정한 평가를 위한 목적으로 8개 기준(△개체명 인식 △관계 추출 △문장 주제 분류 △문장 유사도 비교 △자연어 추론 △의존 관계 분석 △기계 독해 이해 △대화 상태 추적)이 포함된 데이터 집합체
- 영한 번역문이 아닌 일상생활에서 사용하는 한국어 원문으로만 제작해 한국어의 정확한 이해와 추론 능력을 평가 가능
- 특히 다양한 한국어 언어모델이 동일한 평가선상에서 정확하게 비교될 수 있는 평가기준과 토대가 된다는 점에서 앞으로 한국어 자연어처리 분야의 발전을 앞당길 것으로 기대
- 또한 KLUE는 누구나 데이터에 접근, 활용할 수 있는 라이선스를 받은 국내 최초 오픈 데이터셋이라는 점에서 의의
- KLUE 이전에도 자연어 이해와 관련된 데이터셋은 있었지만 다양한 작업을 집대성해 산업계와 학계 모두 사용할 수 있는 CC-BY-SA 라이선스(크리에이티브 커먼즈 라이선스: 특정 조건에 따라 저작물 배포를 허용하는 저작권 라이선스)로 공개한 것은 이번이 최초
- 접근제한 없는 라이선스로 개방된 한국어 자연어 이해 평가 데이터가 없어 고전했던 산업계 및 학계의 고민을 해결한 것
- KLUE 프로젝트는 NYU, KAIST, 서울대, 연세대, 경희대, 서강대, 한밭대 등 학계와 네이버 클로바, 카카오 엔터프라이즈, 스캐터랩, 뤼이드 등 기관에서 공동연구기관 및 개인 연구자 자격으로 참여한 31명의 자연어 처리 전문가가 약 7개월에 걸쳐 긴밀하게 협업한 성과
- 인공지능 학습 데이터 부족에 시달려온 국내 연구기관과 기업, 학계를 위해 클루 개발에 쓰인 벤치마크 데이터를 민간에 모두 개방할 예정
- 재배포·재가공뿐만 아니라 상업적 이용도 자유롭게 허용하여 ‘클루2’ ‘클루3’를 개발해 나갈 수 있는 환경을 조성한다는 포부