본문으로 바로가기

국내외 과학기술정책에 대한 주요 정보

주요동향

주요동향

韓, 자율주행·자연어 연구 등 첨단기술 지원하는 데이터셋 구축 원문보기 1

  • 국가 한국
  • 생성기관 매일경제
  • 주제분류 핵심R&D분야
  • 원문발표일 2021-05-24
  • 등록일 2021-05-21
  • 권호 192

□  네이버랩스, 실내외 고정밀 지도 및 측위 데이터 등을 모은 오픈 데이터셋공개


이번에 공개한 데이터셋은 그동안 개별적으로 공개했던 네이버랩스의 자체 데이터셋과 새롭게 구축한 데이터셋까지 모두 한 곳에 통합한 일종의 종합 데이터 공간

 

- 자율주행차, 모바일 로봇, 증강현실(AR)·혼합현실(XR) 등 다양한 연구에 활용 가능한 고정밀 지도와 실내·외 측위 데이터셋 포함

  

항공사진과 인공지능을 활용한 독자 매핑 기술 하이브리드 HD 매핑을 기반으로 구축한 마곡·판교·상암·여의도 지역 실외 고정밀 HD맵과 모바일 매핑 시스템 R1을 통해 스캔한 3D 라이다 포인

클라우드 데이터 등


- 특히 첫 공개한 실내 측위 데이터셋은 백화점·복합공간 등 일상공간 그대로 구현한 세계 최대 규모의 정밀 데이터라는 점에서 주목


- 실내 고정밀 지도 제작 로봇 M1X, 백팩 타입의 모바일 매핑 시스템 COMET 등 네이버랩스 독자적인 기술력으로 구축했으며 모바일 로봇, AR XR 등 다양한 연구 분야에 활용 가능




3-1.PNG


체 축적해온 연구결과물을 학계 및 연구기관과 공유하며 데이터셋 구축 사업에서 노하우를 축적한 네이버랩스는 광범위한 연구활동 지원과 성장에 이바지한다는 구상


- 2017년 근력증강로봇 기술을 응용한 에어카트 특허 무상 공개 2018KAIST 전공교과목 공동개발 2019년 국내 기업 최초로 자율주행용 고정밀 지도(HD) 무상 공개 2020년 측위 기술 향상을 위한 연구 챌린지 개최 등 다양한 기술 공개

 

- 데이터셋 구축에는 대규모 투자와 시간이 필요한 만큼 이를 활용해 국내 다양한 연구기관·스타트업의 기술 연구를 지원하며 더욱 빠르게 활성화될 수 있을 것으로 기대


- 나아가 독자 기술력을 더욱 발전시키는 동시에 이 기술을 근간으로 구축하는 데이터셋을 지속 공유해나가며 국내 학계와 연구자 커뮤니티가 한 단계 더 성장하도록 지원할 방침


- 해당 분야에 관심있는 학계·연구기관·스타트업 등 누구나 데이터셋 신청이 가능하며 연구 및 기술개발 목적에 맞추어 활용 가능


- 이번 데이터셋은 프랑스 그르노블에 위치한 네이버 인공지능 R&D연구소 네이버랩스 유럽등이 자체개발한 독자 기술로 구축했다는 점에서 의의




□  방대한 데이터를 결합한 고정밀지도 기술 경쟁 촉발

네이버랩스 데이터셋에 공개한 하이브리드 HD 매핑 기술은 항공사진을 활용한 3차원 고정밀 지도제작 기술로 최대 오차범위 16cm를 더욱 줄이는데 성공


통상 자율주행은 20cm 정도의 오차 허용


- 차선위치, 건물 높낮이, 노면 기호 등 주변 환경의 미세한 부문까지 거의 똑같이 3D로 그려낼 수 있다는 것이 강점


로벌 빅테크 기업도 데이터와 첨단 기술을 결합한 차세대 지도 매핑 기술개발 한창




3-2.PNG



- 매핑 기술에 주목하는 이유는 로봇·자율주행차·메타버스 등 미래 서비스는 위치 정확성이 높은 디지털 지도 위에서 구현 가능하며 더욱 시너지를 발휘하기 때문


- (구글) 자율주행 회사 웨이모가 라이다 기반 고정밀 지도 개발에 집중하고 있는 가운데 맵 활성 범위를 미국 전역 25개 도시 이상으로 확대하는 프로젝트 진행


- 웨이모 자율주행 소프트웨어인 웨이모 드라이버에 결합하는 고정밀 지도를 자체 제작 중


- 웨이모 드라이버는 고정밀 지도를 기반으로 특정 도로에 대한 지형 데이터 등을 누적해 보행자, 차량 등 움직이는 물체와 관련한 데이터 처리를 고도화하며 돌발 상황에 대비 가능


- (소프트뱅크) 인공위성과 지상 측위 거점을 활용해 사물 위치 오차를 3cm 이내로 줄인 위치 정보 서비스 개발 진행, 하반기 자율작업 가능한 건설장비에 적용하고 자율주행차에 도입 목표


- 정밀 지도 개발을 위해 일본 기업이 주로 이용하는 일본 국토지리원 측위 거점(1,300)2.5배에 달하는 측위 거점 3,300개 확보


- 앞서 2017년 미국 디지털지도 스타트업 맵박스(Mapbox)에도 투자했으며 자회사 야후재팬은 디지털 지도에 맵박스 기술을 적용


- (화웨이) 2019년 정부 허가를 받아 고징밀 지도 개발에 착수, 2020년 내에 중국 전역 고속도로와 베이징·상하이·광저우·선전 등 4개 도시 일반도로 고정밀 지도 서비스를 제공할 계획



□  국내 스타트업의 '한국어 자연어 이해 평가 데이터셋' 구축도 주목


에 인공지능 스타트업 업스테이지가 공신력을 갖춘 한국어 자연어 이해 평가 데이터셋(KLUE: Korean Language Understanding Evaluation Benchmark)’을 구축해 공개(5.17)


- KLUE는 한국어 언어모델의 공정한 평가를 위한 목적으로 8개 기준(개체명 인식 관계 추출 문장 주제 분류 문장 유사도 비교 자연어 추론 의존 관계 분석 기계 독해 이해 대화 상태 추적)이 포함된 데이터 집합체


- 영한 번역문이 아닌 일상생활에서 사용하는 한국어 원문으로만 제작해 한국어의 정확한 이해와 추론 능력을 평가 가능


- 특히 다양한 한국어 언어모델이 동일한 평가선상에서 정확하게 비교될 수 있는 평가기준과 토대가 된다는 점에서 앞으로 한국어 자연어처리 분야의 발전을 앞당길 것으로 기대


- 또한 KLUE는 누구나 데이터에 접근, 활용할 수 있는 라이선스를 받은 국내 최초 오픈 데이터셋이라는 점에서 의의


- KLUE 이전에도 자연어 이해와 관련된 데이터셋은 있었지만 다양한 작업을 집대성해 산업계와 학계 모두 사용할 수 있는 CC-BY-SA 라이선스(크리에이티브 커먼즈 라이선스: 특정 조건에 따라 저작물 배포를 허용하는 저작권 라이선스)로 공개한 것은 이번이 최초


- 접근제한 없는 라이선스로 개방된 한국어 자연어 이해 평가 데이터가 없어 고전했던 산업계 및 학계의 고민을 해결한 것


- KLUE 프로젝트는 NYU, KAIST, 서울대, 연세대, 경희대, 서강대, 한밭대 등 학계와 네이버 클로바, 카카오 엔터프라이즈, 스캐터랩, 뤼이드 등 기관에서 공동연구기관 및 개인 연구자 자격으로 참여한 31명의 자연어 처리 전문가가 약 7개월에 걸쳐 긴밀하게 협업한 성과


- 인공지능 학습 데이터 부족에 시달려온 국내 연구기관과 기업, 학계를 위해 클루 개발에 쓰인 벤치마크 데이터를 민간에 모두 개방할 예정


- 재배포·재가공뿐만 아니라 상업적 이용도 자유롭게 허용하여 클루2’ ‘클루3’를 개발해 나갈 수 있는 환경을 조성한다는 포부



3-3.PNG






배너존