제품
»제품»Rosette 언어 처리 플랫폼»인명·지명 번역기

지원 플랫폼

Windows, Linux, Solaris, AIX, HPUX, Mac OS 등

Rosette 인명·지명 번역 시스템

외국어 인명·지명을 정확도 높은 영어로 번역

인명, 지명, 조직명은 주로 문서 내에서 볼 수 있는 가장 중요한 정보입니다. 하지만 외국어를 영어로 번역하는 것은 상당히 어려운 작업입니다. 가장 강력한 높은 단가의 "기계 번역" 시스템도 많은 인명·지명을 정확하게 번역하는데 어려움이 있습니다. 왜 이렇게 힘든 작업일까요?

  • 각 이름 중, 어떤 단어가 표기상 (즉, 음역)번역되어야 하며 어떤 단어가 의미론적으로 번역되어야 합니까?北京国家体育场 단어의 경우, 전체를 표기상으로 번역하거나 (베이징 구오지아 티유창) 전체를 의미론상으로 (북쪽 도시 국립 경기장)으로 번역하기 보다 첫째 단어는 표기상으로 번역하고 마지막 두 단어는 의미상으로 번역하기를 선호합니다 (베이징 국립 경기장).
  • 각 언어별로 번역에 대한 불일치 규정이 적용되고 있을 수 있습니다. 예를 들면, “Fuji”“Huzi” 는 잘 알려진 일본의 유명한 산 이름이며 두가지 철자가 모두 통용됩니다. 우크라이나 수도의 철자가 “Kiev” 또는 “Kyiv” 로 표기되어야 하는 문제는 외교적 문제로 이어졌습니다.
  • 이와 같이 일반적인 관행과 통상적인 관념의 문제가 조직의 기준과 상충될 수 있는 것입니다. 예를 들면, 이라크의 이전 통치자의 이름은 언론에서 “Saddam Hussein”으로 표기됩니다. 하지만 CIA 정보국의 공식적인 철자는 “Saddam Husayn”입니다.
  • 외국어 이름은 해당 언어인 محمود احمدی‌نژاد (Mahmoud Ahmadinejad)로 표기되거나, 또는 외국어 알파벳으로 جورج دبليو بوش (George W. Bush) 표기될 수도 있습니다.

인명·지명은 금융, 법률, 정보, 국경 수비, 소송 지원을 포함하여 다양한 직업군에 따라 개별적으로 분석되어야 합니다. 또한 관련 전문가들을 지원하고 정보 추출, 미디어 조작, 디지털 포렌식, 문서 분류와 같은 업무를 수행하는 정보 시스템을 통해 분석되어야 합니다. 하지만 전통적인 기계 번역 (MT) 시스템들은 이러한 업무의 기대에 미치지 못합니다.

RNT Sample RNT Sample

Rosette 솔루션

Rosette® 인명·지명 번역 시스템 (RNT) 은 외국어 인명·지명을 수용하고, 다양한 어플리케이션 사용에 적합한 정확하고 표준이 되는 영어 번역을 생성합니다. 특징적인 기능에는 다음이 포함됩니다:

  • 외국어 이름에 빈번히 나타나는 "전통적 철자"의 생성
  • "인식할 수 없는", 즉 어떤 외국어 인명·지명 카탈로그에도 나타나지 않는, 인명·지명의 강력한 프로세싱
  • 외국어 알파벳을 영어로 번역하기 위한 복잡한 음역 기준의 어플리케이션 (예, 지형학상의 인명·지명에 대한 미국보드)
  • 아랍어의 부분적 음성화 또는 중국의 단어 분절과 같이 원어에서의 인명·지명 철자에 대한 모호성의 자동적 해결

RNT 는 아랍어, 페르시아어, 파슈토어, 우르두어, 다리어, 한국어, 중국어, 일본어, 태국어, 러시아어로 인명·지명을 번역합니다.

기술의 원리

RNT는 한 개의 API를 통해 다국어 인명·지명의 번역을 제공합니다. 번역을 위한 인명·지명이 주어졌을 때, RNT는 우선 사전을 확인합니다. 사전에서 인명·지명을 찾을 수 없으면 언어별 알고리즘을 기준으로 분석됩니다. 예를 들면, 중국어 인명·지명은 표의 문자에서 음성학적 표기로 변환됩니다. “무성” 아랍어 인명·지명 (예, 단모음이 없는 경우)은 다양한 사용자 선택의 표준 시스템을 기준으로 음성학적 번역이 가능하도록 자동적으로 유성화가 이루어집니다.

번역 예문

다음의 예문은 인명·지명의 기원에 따라 아랍어와 영어 간의 인명·지명 번역이 이루어지는 RNT의 기능을 보여주고 있습니다.

음역 유형입력출력
  • 인명
  • 아랍어 기원
  • 포워드 음역
أبو يوسف يعقوبAbu Yusif Ya’qub
  • 인명
  • 영어 기원
  • 반대 음역
جون كينيديJohn Kennedy
  • 지명
  • 아랍어 기원
  • 포워드 음역
باقة الشرقيةBaqah Al-Sharqiyyah
  • 지명
  • 영어 기원
  • 반대 음역
ديزني لاندDisneyland (디즈니랜드)
  • 지명
  • 영어 기원
  • 반대 음역
كاليفورنيا or كاليفرنيا California (캘리포니아)
  • 지명
  • 영어 기원
  • 반대 음역
البيت الأبيضThe White House (백악관)
  • 조직명 약자
  • 영어 기원
  • 반대 음역
بي بي سيBBC

추출과 번역의 조합

RNT는 문서상의 주요 인명·지명의 번역을 위해 통계학적 또는 규정상의 MT 시스템보다 월등히 정확한 Rosette 키워드 추출 시스템 (REX)과 조합될 수 있습니다이와 같은 접근 방법은 전체 문단과 문서의 번역이 필요한 시스템의 출력물을 개선하기 위해 사용될 수 있습니다.

RNT Sample

이용가능한 언어

RNT는 다음과 같은 언어를 지원합니다. 다른 언어는 맞춤식 개발을 통해 추가하실 수 있습니다.

  • 아랍어
  • 중국어 (간체자)
  • 중국어 (번체자)
  • 근대 페르시아어
  • 일본어
  • 한국어 (개발 중)
  • 러시아어
  • 파슈토어
  • 우르두어

지원 표기체계

RNT는 다음과 같은 쓰기 시스템을 지원합니다. 맞춤식 개발을 통해 추가적인 쓰기 시스템 지원이 가능합니다.

العربية아랍어, 다리어, 근대 페르시아어, 파슈토어, 우르두어
漢字중국어 hanzi, 일본어 kanji, 한국어 hanja
かな일본어 히라가나
カナ일본어 카타카나
한글한국어 한글 (개발 중)