국내외 과학기술 정책에 대한 간략한 정보

단신동향
해외단신
중국, 컴퓨터로 한자를 처리하는 새로운 코드 기술 개발 원문보기 1
- 국가 중국
- 생성기관 중국과학기술정보연구소
- 주제분류 핵심R&D분야
- 원문발표일 2006-04-14
- 등록일 2006-04-20
- 권호
중국 과학자들이 컴퓨터를 이용해 찾기 어렵고 일상적으로 잘 사용하지 않는 한자(漢字)를 효과적으로 처리할 수 있는 새로운 ‘코드 기술’을 독자적으로 연구 개발하여 이슈가 되고 있다. 이번에 독자적으로 개발된 새로운 한자 코드 기술은 ‘4자 절(四字節)’ 코드 핵심기술로서, 동 기술을 이용하게 되면 중국 고전 서적 출판 중에서 존재하는 여러 가지 어려운 한자 처리를 효과적으로 진행할 수 있을 뿐만 아니라 호적, 은행, 세관, 항공사 등 분야 업무에서 부딪치게 되는 성명, 지명 중의 여러 가지 어려운 한자 처리를 효과적으로 진행할 수 있게 된다.
이번에 개발된 새로운 ‘한자 코드 기술’은 ‘북경 시대 한당(時代瀚堂) 과학기술 유한회사’ 연구 개발자들이 독자적으로 연구 개발에 성공한 기술로서, 71,500자에 달하는 한자를 입력, 모니터링, 편집, 검색, 자문, 관리할 수 있다. 하지만 전통적인 ‘2자 절(二字節)’ 코드 기술은 27,500자의 한자만 처리할 수 있었다.
과거 ‘설문해자(設文解字)’ 등 전통적인 문화 고전 서적(典籍)에 대해서는 촬영 방법으로 인쇄하여 출판할 수 밖에 없었으며 이런 방법으로 출판된 서적은 현대인들의 책을 읽는 습관에 맞지 않은 문제점이 존재하였다. 고전 서적 연구 학자들은 어려운 한자나 일상적으로 잘 사용하지 않는 한자를 컴퓨터로 처리해야 하는 상황에 부딪치게 되면 어떻게 해야 할지 방법을 찾지 못해 어려운 상황에 처해 있을 때가 많았다. 하지만 현재는 ‘4자 절’ 코드 기술을 이용하여 컴퓨터에 입력하고 처리하여 ‘설문해자’를 출판할 수 있게 됨으로써 출판사와 독자들에게 큰 편리를 가져다 줄 수 있게 되었다.
‘4자 절’ 코드 기술에 기반하여 ‘북경 시대 한당 과학기술 유한회사’는 ‘용어한당(龍語瀚堂)’이라고 명명한 고전 서적 데이터베이스를 구축하였다. 이 데이터베이스는 문자 서적 유형 데이터베이스, 은주금(殷周金)문 베이스, 음운(音韵) 베이스, 중국 간백(簡帛) 베이스, 갑골문(甲骨文) 베이스 등 13개 유형의 구체적인 자(子) 베이스를 포함하고 있는데 수백만 개에 달하는 데이터가 기록되어 있다. 이런 데이터베이스를 응용하여 ‘중국 사회과학 문헌 출판사’는 중국 최초의 자서(字書)인 ‘설문해자’를 출판하였으며 ‘북경 시대 한당 과학기술 유한회사’와 ‘중국 사회과학 문헌 출판사’는 공동으로 ‘강희자전(康熙字典)’을 출판하였다.
현재 ‘용어한당’의 고전 서적 데이터 베이스는 중국의 청화대학, 북경대학 등 100여 개 대학의 중문(中文) 학부, 역사 학부, 고고(考古) 학부 및 국내외 부분적인 한학(漢學) 연구 기관에서 폭 넓게 응용되고 있다
* kosen21 참조
이번에 개발된 새로운 ‘한자 코드 기술’은 ‘북경 시대 한당(時代瀚堂) 과학기술 유한회사’ 연구 개발자들이 독자적으로 연구 개발에 성공한 기술로서, 71,500자에 달하는 한자를 입력, 모니터링, 편집, 검색, 자문, 관리할 수 있다. 하지만 전통적인 ‘2자 절(二字節)’ 코드 기술은 27,500자의 한자만 처리할 수 있었다.
과거 ‘설문해자(設文解字)’ 등 전통적인 문화 고전 서적(典籍)에 대해서는 촬영 방법으로 인쇄하여 출판할 수 밖에 없었으며 이런 방법으로 출판된 서적은 현대인들의 책을 읽는 습관에 맞지 않은 문제점이 존재하였다. 고전 서적 연구 학자들은 어려운 한자나 일상적으로 잘 사용하지 않는 한자를 컴퓨터로 처리해야 하는 상황에 부딪치게 되면 어떻게 해야 할지 방법을 찾지 못해 어려운 상황에 처해 있을 때가 많았다. 하지만 현재는 ‘4자 절’ 코드 기술을 이용하여 컴퓨터에 입력하고 처리하여 ‘설문해자’를 출판할 수 있게 됨으로써 출판사와 독자들에게 큰 편리를 가져다 줄 수 있게 되었다.
‘4자 절’ 코드 기술에 기반하여 ‘북경 시대 한당 과학기술 유한회사’는 ‘용어한당(龍語瀚堂)’이라고 명명한 고전 서적 데이터베이스를 구축하였다. 이 데이터베이스는 문자 서적 유형 데이터베이스, 은주금(殷周金)문 베이스, 음운(音韵) 베이스, 중국 간백(簡帛) 베이스, 갑골문(甲骨文) 베이스 등 13개 유형의 구체적인 자(子) 베이스를 포함하고 있는데 수백만 개에 달하는 데이터가 기록되어 있다. 이런 데이터베이스를 응용하여 ‘중국 사회과학 문헌 출판사’는 중국 최초의 자서(字書)인 ‘설문해자’를 출판하였으며 ‘북경 시대 한당 과학기술 유한회사’와 ‘중국 사회과학 문헌 출판사’는 공동으로 ‘강희자전(康熙字典)’을 출판하였다.
현재 ‘용어한당’의 고전 서적 데이터 베이스는 중국의 청화대학, 북경대학 등 100여 개 대학의 중문(中文) 학부, 역사 학부, 고고(考古) 학부 및 국내외 부분적인 한학(漢學) 연구 기관에서 폭 넓게 응용되고 있다
* kosen21 참조