인명, 지명, 조직명은 주로 문서 내에서 볼 수 있는 가장 중요한 정보입니다. 하지만 외국어를 영어로 번역하는 것은 상당히 어려운 작업입니다. 가장 강력한 높은 단가의 "기계 번역" 시스템도 많은 인명·지명을 정확하게 번역하는데 어려움이 있습니다. 왜 이렇게 힘든 작업일까요?
인명·지명은 금융, 법률, 정보, 국경 수비, 소송 지원을 포함하여 다양한 직업군에 따라 개별적으로 분석되어야 합니다. 또한 관련 전문가들을 지원하고 정보 추출, 미디어 조작, 디지털 포렌식, 문서 분류와 같은 업무를 수행하는 정보 시스템을 통해 분석되어야 합니다. 하지만 전통적인 기계 번역 (MT) 시스템들은 이러한 업무의 기대에 미치지 못합니다.
Rosette® 인명·지명 번역 시스템 (RNT) 은 외국어 인명·지명을 수용하고, 다양한 어플리케이션 사용에 적합한 정확하고 표준이 되는 영어 번역을 생성합니다. 특징적인 기능에는 다음이 포함됩니다:
RNT 는 아랍어, 페르시아어, 파슈토어, 우르두어, 다리어, 한국어, 중국어, 일본어, 태국어, 러시아어로 인명·지명을 번역합니다.
RNT는 한 개의 API를 통해 다국어 인명·지명의 번역을 제공합니다. 번역을 위한 인명·지명이 주어졌을 때, RNT는 우선 사전을 확인합니다. 사전에서 인명·지명을 찾을 수 없으면 언어별 알고리즘을 기준으로 분석됩니다. 예를 들면, 중국어 인명·지명은 표의 문자에서 음성학적 표기로 변환됩니다. “무성” 아랍어 인명·지명 (예, 단모음이 없는 경우)은 다양한 사용자 선택의 표준 시스템을 기준으로 음성학적 번역이 가능하도록 자동적으로 유성화가 이루어집니다.
다음의 예문은 인명·지명의 기원에 따라 아랍어와 영어 간의 인명·지명 번역이 이루어지는 RNT의 기능을 보여주고 있습니다.
| 음역 유형 | 입력 | 출력 |
|---|---|---|
| أبو يوسف يعقوب | Abu Yusif Ya’qub |
| جون كينيدي | John Kennedy |
| باقة الشرقية | Baqah Al-Sharqiyyah |
| ديزني لاند | Disneyland (디즈니랜드) |
| كاليفورنيا or كاليفرنيا | California (캘리포니아) |
| البيت الأبيض | The White House (백악관) |
| بي بي سي | BBC |
RNT는 문서상의 주요 인명·지명의 번역을 위해 통계학적 또는 규정상의 MT 시스템보다 월등히 정확한 Rosette 키워드 추출 시스템 (REX)과 조합될 수 있습니다이와 같은 접근 방법은 전체 문단과 문서의 번역이 필요한 시스템의 출력물을 개선하기 위해 사용될 수 있습니다.
RNT는 다음과 같은 언어를 지원합니다. 다른 언어는 맞춤식 개발을 통해 추가하실 수 있습니다.
RNT는 다음과 같은 쓰기 시스템을 지원합니다. 맞춤식 개발을 통해 추가적인 쓰기 시스템 지원이 가능합니다.
| العربية | 아랍어, 다리어, 근대 페르시아어, 파슈토어, 우르두어 |
| 漢字 | 중국어 hanzi, 일본어 kanji, 한국어 hanja |
| かな | 일본어 히라가나 |
| カナ | 일본어 카타카나 |
| 한글 | 한국어 한글 (개발 중) |