Rosette® 인명·지명 조합 시스템 (RNI)은 다양한 언어로 표기된 인명·지명을 하나의 유니버설 색인(universal index)에서 검색 및 매칭하는 작업을 수행합니다. 예를 들어 “Mao Zedong”을 검색하면 영어로는 “Mao Ze Dong” 또는 “Mao Tse Tung”을 표시하고, 중국어 간체자로는 毛泽东, 중국어 번체자로는 毛澤東, 또는 아랍어로 ماو تسي تونغ 를 표시합니다.
수십 억 가지의 철자 변환을 포함하는 리스트에 의한 레거시 솔루션(legacy solutions) 방식과는 달리, RNI는 각 인명·지명 컴포넌트의 본질적 구조를 분석하고, 고급 언어학 알고리즘을 이용한 수준 높은 방식의 비교 기능를 수행합니다. 이러한 방식을 통해 "긍정 오류"와 (잘못된 결과를 다수 검색) "부정 오류"(결과 없음 또는 관련된 매칭의 검색 실패)의 가능성을 줄일 수 있습니다.
RNI는 인명, 장소, 조직명 등 다양한 유형의 인명·지명을 인덱싱하고, 감시 리스트 관리, 부정 검출, 돈세탁, 공간정보 분석, 다국어 데이터 분류와 같은 어플리케이션으로 통합되도록 설계되었습니다.
문화에 따라 정식 이름 외에 별명, 가명과 같은 여러 요소를 포함될 경우 고난위도의 검색 및 매칭 기능이 요구됩니다. 아래는 존칭어, 이름, 성(姓), 부칭 (x의 아들, y의 부친), 소속 부족, 출생지 등을 조합 사용하는 아랍어 인명의 사례입니다.
| 존칭 | 이름 | 부칭 | 성(姓) |
|---|---|---|---|
| Al-Sheikh | Abdullah | Bin Hassan | Al-Ashqar |
| الشيخ | عبد الله | بن حسن | الأشقر |
위의 인명은 다음과 같은 다양한 형식으로 표현될 수 있습니다.
RNI는 영어로도 인명·지명이 다양하게 표기될 수 있음을 인식합니다.
| William Johnson | “Bill Johnson” 또는 “W. Johnson” |
| 毛泽东 | “Mao Zedong” 또는 “Mao Tse Tung” |
| مقتدى الصدر | “Mouqtada Alsader” 또는 “Muktada el‐Sader” |
RNI는 다음과 같은 인명·지명 일치의 문제점을 해결합니다.
RNI와 Rosette 인명- 지명 번역 시스템 (RNT)을 함께 적용함으로써 정부, 기관, 업계 기준에 부합한 인명- 지명 번역 리스트를 생성할 수 있습니다.
RNI는 어떤 형태의 인명·지명 데이터베이스와 통합될 수 있습니다. 사용자의 데이터는 보존한 채로 데이터베이스 내의 일치하는 인명·지명에 포인터(pointer)만을 지정합니다. 인명·지명의 컴포넌트 전체가 일치하지 않는 경우, RNI는 입력된 인명·지명과 부분적인 일치를 이루는 엔트리를 정렬합니다. 데이터베이스가 업데이트될 때마다 RNI의 인덱스도 자동 업데이트되도록 설정할 수 있습니다.
일치하는 인명·지명은 0%- 100%의 신뢰도에 의한 스코어(confidence-ranked score)를 동반해 어플리케이션으로 리턴됩니다. 매칭 최하 임계점을 설정해 리턴값의 신뢰성을 높일 수 있습니다. RNI의 API를 사용해 특정한 개인과 장소를 확인할 수 있도록 인물간 관계, 지역적 위치와 같은 관련 정보에 접근할 수 있습니다.
RNI의 다국어 인명·지명 인덱스는 다국어의 인명·지명 검색이 가능하도록 귀사의 데이터베이스에 일치되는 기록과
연결됩니다.
RNI는 다음의 표기체계(writing system)를 지원합니다. 맞춤식 개발을 통해 추가적인 표기체계 지원이 가능합니다.
| العربية | 아랍어, 다리어, 근대 페르시아어, 파슈토어, 우르두어 |
| 漢字 | 중국어 hanzi, 일본어 kanji, 및 한국어 한자 |
| かな | 일본어 히라가나 |
| カナ | 일본어 카타카나 |
| 한글 | 한국어 한글 (개발 중) |
| 라틴어 | 영어, 프랑스어, 독일어, 스페인어, 포르투갈어, 등. |