솔루션
»솔루션»아파치 루씬(Lucene)/솔라(Solr)

Rosette 지원 언어

  • 그리스어
  • 네덜란드어
  • 노르웨이어
  • 덴마크어
  • 독일어
  • 라트비아어
  • 러시아어
  • 루마니아어
  • 말레이어
  • 불가리아어
  • 세르비아어
  • 스웨덴어
  • 스페인어
  • 슬로바키아어
  • 슬로베니아어
  • 아랍어
  • 알바니아어
  • 에스토니아어
  • 영어
  • 우르두어
  • 우크라이나어
  • 이탈리아어
  • 인도네시아어
  • 일본어
  • 중국어간체자
  • 중국어번체자
  • 체코어
  • 카타로니아어
  • 크로아티아어
  • 타이어
  • 터키어
  • 파슈토어
  • 페르시아어
  • 포르투갈어
  • 폴란드어
  • 프랑스어
  • 핀란드어
  • 한국어
  • 헝가리어
  • 히브리어

아파치 루씬/솔라 기반을 위한 Rosette

루씬/솔라 검색을 위한 언어 지원

베이시스 테크놀러지의 Rosette은 아파치 루씬/솔라에 기업 수준의 언어 분석을 제공합니다. 다양한 언어로 제공되는 심층적 언어 프로세스와 정확한 검색을 위해 선도 기관들은 당사의 서비스를 이용합니다. 언어학적 플러그인은 40개 이상의 아시아, 유럽, 중동 지역의 언어별로 최고급의 검색 결과를 제공합니다.

대형 웹 검색 엔진이 선택한 언어학

당사의 텍스트 분석 검색 플랫폼은 아시아 지역의 언어 텍스트 구문, 형태학적 분석을 통한 인덱싱 개선, 보다 정확한 검색 결과 도출을 위한 언어별 특징의 적용을 위해 구글, 야후, 빙을 포함한 주요 검색 엔진에 의해 사용되고 있습니다. 기업 고객들은 Rosette의 아파치 루씬/솔라 커넥터와 함께 검색 기반의 어플리케이션, 기업 검색, 적용을 위해 이와 같은 툴의 장점을 이용하고 있습니다.

언어별 고유 특징에 대한 해결책

세계의 모든 언어는 각각의 특징적인 면이 있으며 언어별로 정확한 검색 결과 도출을 위해 필요한 검색 엔진의 구체적인 특징을 이해할 필요가 있습니다. Rosette은 텍스트의 토큰화, 형태소 분석 실행, 키워드 추출, 이름 변형 검색 등을 위해 어휘 데이터, 발견론적 규칙, 통계학적 모델을 최적 조합한 알고리즘을 적용합니다. 당사는 지속적으로 언어학적 분석에 대한 새로운 접근 방법을 평가하며 고객이 최고 품질의 서비스를 받을 수 있도록 정기적으로 버전을 새로 공개하여 기술적 또는 어휘 데이터를 업데이트하고 있습니다.

단일 언어 기술로 다수의 언어에 대응

루씬/솔라 검색을 위한 유럽, 아시아, 중동 언어 지원에 필요한 다양한 자료가 있습니다. 하지만 다양한 언어의 적용을 위해서는 다양한 실행 수준과 특징을 제공하는 많은 공급 기업과 모듈이 필요합니다. Rosette은 단일 API를 통해 다양한 언어별 검색 속도와 정확한 결과를 제공합니다. 1-40개 언어별로 제공되는 플러그인 기능은 이용자들에게 편의성을 제공합니다. 베이시스 테크놀러지는 지난 15년간 전 세계의 고객을 대상으로 지원 서비스를 제공해 왔습니다.

Rosette Solr Diagram

신뢰할 수 있는 속도와 정확성

당사의 소프트웨어는 40개 이상의 언어별로 높은 수준의 검색 서비스를 제공하기 위해 Rosette을 선택한 주요 웹 기업 검색 제공업체들의 광범위한 테스트 과정을 거쳤습니다. 당사의 기술은 전체적으로 최적화되어 있으며 루씬/솔라 환경에서도 확장성이 높습니다. 더 나아가 당사의 기술 스탭들은 검색 언어와 관계없이 고객 지원 서비스를 제공하고 있습니다.

수 시간 내에 평가 및 사용

당사의 소프트웨어는 솔라 분석기의 토크나이저 클래스로 루씬/솔라에 적용되어 빠르고 편리하게 다국적 언어 검색 기능을 설치하실 수 있습니다. 솔라 접속을 위해서는 schema.xml 파일의 수정이 필요합니다. 지금 바로 평가판을 요청하십시오..

Rosette은 다음과 같은 언어학적 혜택을 제공합니다:

  • 55개 언어 및 45개 인코딩으로 언어·인코딩 판별: 다국어 문서 인덱싱
  • 띄어쓰기가 없는 구절의 정확한 분절 처리 —중국어, 일본어, 한국어, 아랍어
  • 분리된 복합어로 새로운 하부 복합어 생성 —예를 들면, 독일어, 네덜란드어, 한국어
  • 관련 질의어 확장의 리콜(recall) 및 정밀도(precision) 향상을 위한 기본화
  • 정밀도와 리콜 기능의 개선을 위한 품사 태깅
  • 키워드 추출은 검색 결과내 핵심 인명 또는 키워드에 대한 다중 검색(faceted search)이 가능하도록 키워드를 검색합니다.
RBL Segmentation, POS Tagging, and BNP Extraction Sample