
주요동향
주요동향
주요국의 코로나19 관련 공공데이터 개방 현황 원문보기 1
- 국가 기타
- 생성기관 미국공공데이터포털
- 주제분류 핵심R&D분야
- 원문발표일 2020-04-09
- 등록일 2020-05-08
- 권호 166
세계 각국의 사활을 건 코로나19 극복 노력에서 ICT는 핵심적인 역할 수행 중
전파 현황 파악, 확진자 동선 추적, 각급학교 휴교에 따른 이러닝 서비스, AI 등 첨단 IT를 활용한 백신 및 치료제 개발 지원, 언택트 트랜드 대응 등 ICT의 역할은 전방위적
특히 팬데믹의 특성 상 공공부문 보유 데이터의 체계적・창의적 활용을 통한 신속하고 신뢰할 수 있는 정보 공유는 매우 중요하며, 이는 공공부문과 민간부문의 긴밀한 협력을 통해 실현 가능
최근 한국정보화진흥원은 코로나19 감염 확산에 대응한 주요국의 공공데이터 개방 현황을 조사・분석하여 보고서로 발표
- 보고서는 코로나19 감염 확산 관련 공공데이터 개방현황과 주요 질병관리・통제기관의 데이터 개방현황을 분석하고, 개방 데이터 활용사례도 제시
주요국이 공공데이터 포털을 통해 개방하는 데이터는 코로나19 환자 발생 관련 정보가 주를 이루며, 연구데이터 등은 민간 포털을 통해 공개
(프랑스) data.gouv.fr을 통해 코로나19 관련 24개 공공부문 제공 데이터(Public Data)셋과 11개 공익데이터(Public Interest Data, 공공부문 데이터를 토대로 민간부문 가공)셋을 제공(4.3일 기준)
※ data.gouv.fr에서 ‘covid-19’로 검색되는 전체 데이터셋은 451개(4.20일 기준)
- 공공부문 제공 데이터셋은 코로나19 관련 병원 데이터, 병원 응급 및 SOS의사 데이터, 도시랩에서 진행된 코로나19 선별검사 관련 데이터, 지역별 일일 사망자 수, 버스 추가서비스 정보 등
- 공익데이터는 코로나19 관련 주요 수치, 지역별 확진 사례, 이동제한기간 중 상점 위치 및 영업시간 표시 등
※ 프랑스에서는 공공 및 시민사회가 공공데이터 정책 참여, 기여공통리소스 (contributory common resource) 유지, 오픈소스 정보시스템 공동 운영 등에 적극 협력
- 데이터는 즉시 활용 가능하도록 CSV 파일로 개방
(이탈리아) 공공데이터 포털(dati.gov.it)을 통해 공공기관이 직접 제공하는 데이터셋은 없으며, 민간부문(개발자 및 시빅해킹 프로젝트 등)에서 정부 공식발표 데이터를 가공하여 재사용 가능한 형식으로 오픈데이터 제공
- 공공데이터 포털을 통한 주요 데이터셋으로는 Umberto Rosoni(개발자)가 제공하는 ‘베네토의 COVID-19 상황 모니터링’(총사례, 상세 자료) 등
※ dati.gov.it에서 ‘covid-19’로 검색되는 전체 데이터셋은 11개(4.20일 기준)
- 공공데이터 포털 외의 통로를 통해 개방되는 데이터셋으로는 Umberto Rosini가 시민보호청 데이터를 활용하여 국가・주・지역 별 코로나19 동향 및 봉쇄조치 정보를 GitHub에 공개
(미국) 공공데이터 포털(data.gov)을 통해 11개의 데이터셋(4.3일 기준)을 공개하고 있으며, 백악관 주도로 코로나19 퇴치 연구 지원을 위한 대규모 연구 데이터셋(CORD-19)을 semanticscholar 홈페이지를 통해 개방
- data.gov를 통해 지역별・연령별 코로나19 확진자 및 사망자 관련 데이터 등을 다양한 오픈포맷(CSV, RDF, JSON)으로 개방
※ 주요 데이터셋으로는 코로나19 잠정 사망자 수(질병통제예방센터), 워싱턴주 코로나19 사례(워싱턴주), 워싱턴주 실업보험 청구 및 수당(워싱턴주), Unacast 코로나19 사회적 거리두기 스코어
보드(수폴스 시 지리정보시스템) 등
- 질병통제예방센터(CDC)는 질병데이터포털(data.cdc.gov)을 통해 질병 관련 다양한 오픈데이터 제공
※ ‘Data Catalog’ 탭에 질병 관련 데이터셋을 카테고리 및 형식 별로 865건 제공(2020.3.23. 기준). 개방 데이터셋의 약 93%(802개)는 CSV, JSON, XML, RDF 등 기계판독 가능 형식으로 제공
※ CDC가 후원하는 개발자 커뮤니티(CDC Open Technology)를 운영하여 데이터 활용성을 제고하고, Open CDC Hackathon을 개최하여 데이터 활용을 통한 획기적인 보건 솔루션 개발을
모색
- CORD-19 데이터셋은 알렌AI연구소(Allen Institute for AI), 마이크로소프트, MIT 등과의 협력하에 개방하고 있는데, 44,000개 이상의 기계판독 가능 형태의 코로나 바이러스 관
련 학술논문과 기사 등
※ 마이크로소프트의 큐레이션 도구 활용 및 알렌AI연구소의 기계판독 가능 형태로 변환 등
(대한민국) 공공데이터포털(data.go.kr)을 통해 관련 부처 및 공공기관 공동으로 공적 마스크 판매, 국민안심병원・선별진료소 데이터 등을, 민간포털을 통해 연구지원 데이터셋 등을 공개
- 공공데이터포털을 통한 주요 공개데이터는 행안부・보건복지부・NIA・건강보험심사평가원(공동)의 공적 마스크 판매, 국민안심병원 및 선별진료소 정보, 국가평생교육진흥원의 온라인 공개강좌 목록 등
※ data.go.kr에서 ‘코로나’로 검색되는 전체 데이터셋은 14개(4.20일 기준)
- 학계・민간은 정부 개방 데이터 등을 재가공하여 코로나 확산 방지 연구에 필요한 데이터 제공
※ 한양대 김지후 연구원 등은 질병관리본부의 확진자 동선 데이터에 위도・경도 등 지리정보를 추가하여 특정 집단의 감염경로, 감염차수 등 세분화된 정보를 캐글(Kaggle)에 제공하고, AI
전문기업인 마인즈랩은 코로나19 환자경로 시각화 데이터셋을 GitHub에 공개
기타 국가들도 확진자 현황을 중심으로 코로나19 관련 데이터셋을 개방
- (EU) 세계 각국의 코로나19 일일 상황 데이터를 활용하여 확진자 현황, 지리적 분포, 역할곡선 등에 관한 정보를 제공하고, 지리적 분포 데이터를 CSV, JSON 등 즉시 활용 가능 형태의 데이터로 제공
- (AU, 아프리카연합) 아프리카 전역의 코로나19 확산 대응 및 연구를 위해 WHO, 질병통제예방센터 등의 데이터를 활용한 아프리카 각국의 확진환자 위치 및 증상 관련 데이터를 CSV파일로 공개하고, 국가별 확진자 상황판을 GitHub에 공개
-(영국) 잉글랜드공중보건국(Public Health England)이 도시별 코로나19 상황판(확진자 현황, 역학 곡선 등)을 운영 중이며, 상황판에 활용되는 모든 데이터를 XLSX 형식으로 개방하고, 조달플랫폼 기업인 OpenOpps는 코로나19 관련 긴급 구매 시 활용하도록 국가별 공공부문의 최근 계약체결 공급업체 정보를 개방
-(우크라이나) 코로나19 관련 긴급계약 체결 후 국가조달시스템에 관련 데이터(구매물품명, 개수, 체결 업체, 가격 등)를 오픈 API 형식으로 개방
-(대만) 대만 질병통제센터(Taiwan CDC)는 CDC 오픈데이터포털(data.cdc.gov.tw)을 통해 305개의 질병 관련 데이터셋을 제공(covid-19로 검색되는 전체 데이터셋은 4개, 4.20일)
※ 기계 판독 가능한 오픈 포맷(CSV, JSON 등)으로 제공하며, 전염병 통계시스템, GitHub 공개, 경진대회 등을 통한 활용 활성화 도모
코로나19 오픈 데이터 활용 사례
(프랑스) 코로나19 진행상황, 입원 관련 모니터링 대시보드 및 코로나19로 의심되는 입원데이터의 지도 표시를 위한 파이썬 코드 등으로 활용
(이탈리아) 시민보호청은 복지부 제공 데이터를 활용하여 국가・주・지역 별 코로나19 진행상황 및 격리조치 지역에 대한 모니터링 대시보드를 제공
(미국) 정부 발표자료 및 데이터를 활용하여 공공 및 민간에서 코로나19 진행상황에 대한 시각화 서비스 제공
- 뉴욕타임즈는 비행노선 데이터와 지리위치코드 등을 활용, 중국에서 전세계로의 감염 경로에 대한 시각화 기능 제공
- 존스홉킨스대학은 WHO, EU, 미국, 중국, 캐나다, 이탈리아 등 세계에서 공식적으로 발표된 코로나19 감염사례 수에 근거하여 대시보드를 제공
(대한민국) 오픈데이터를 활용, 민간부문이 150개 이상 지역의 마스크 재고수량 파악가능한 앱 및 웹서비스를 출시, 질병관리본부는 환자정보를 한눈에 파악할 수 있는 시각화 기능 제공, 중앙응급의료센터는 지역별 가용 병상 수, 음압병상 수 등의 정보 제공