언어 처리 플랫폼

diagram-Rosette-BigText-KO

구조화되지 않은 텍스트로부터 의미와 진정한 가치 획득

현대의 기업은 통찰력과 의사 결정에 대혁신을 가져다 줄 빅 데이터에 관해 잘 알고 있지만, 정작 빅 데이터의 최대 80%가 빅 텍스트(Big Text)로 표현되고 있다는 사실은 잘 알고 있지 못합니다. 빅 텍스트는 문서, 웹 페이지 및 데이터베이스에서 찾을 수 있는 방대한 양의 “구조화되지 않은” 텍스트 덩어리로 빅 데이터의 모든 특징, 즉 3개의 V[볼륨(Volume), 속도(Velocity) 및 다양성(Variety)]를 모두 지닙니다. 빅 텍스트는 또한 다국어로 이루어져 있으며 복잡성과 어려움을 내포한 수많은 언어와 스크립트를 포괄합니다.

구조화되지 않은 텍스트가 갖는 본질적인 특성으로 인해, 표준 기업 데이터 솔루션들은 이러한 정보의 보고를 활용할 수 있는 능력이 크게 제한되어 있습니다.
Rosette®는 엔터프라이즈 어플리케이션에서 사용할 수 있도록 제작된 소프트웨어 컴포넌트 제품군입니다. 이 제품군은 언어학적 분석, 통계 모델링 및 기계 학습을 이용하여 빅 텍스트를 정확하게 처리함으로써, 중요한 정보와 이용 가능한 데이터를 보여줍니다.

각 컴포넌트는 언어, 문서 또는 이름을 처리하기 위한 강력한 도구입니다. 모든 컴포넌트를 함께 사용할 경우, 사용자에게 보다 나은 의사 결정과 진정한 가치를 얻을 수 있도록 유용한 정보를 전달해 주는 매우 강력한 솔루션이 탄생합니다. 정부, 금융, 전자증거개시(E-Discovery), 검색, 소셜 미디어 등의 분야에 분포하는 전세계의 자사 고객들은 빅 텍스트 분석 및 변환에 Rosette을 활용하고 있습니다.

55

개의
지원 언어

구글은 최고의 한국어, 중국어 및 일본어 검색 엔진을 만드는데 필요한 아시아 언어학 기술을 제공하기 위해 베이시스 테크놀로지를 선택했습니다. 이러한 선택은 구글이 전세계 인터넷 사용자가 가장 선호하는 검색 엔진으로 자리매김하는데 있어 핵심적인 역할을 했다고 할 수 있습니다.

Susan Wojcicki

Google’s Director of Product Management

주요 기능

  • 단순 API
  • 뛰어난 확장성과 처리량
  • 강력한 지원
  • 간편한 설치
  • 유연성 및 사용자 지정 가능
  • 통합: Java, C++, 또는 웹 서비스
  • 플랫폼: Unix, Linux, Mac, PC(64 또는 32비트)

주요 고객사

oracle logogoogle logoamazon.com logoairbnb logoFujitsulogo-hitachi-webLogo_DS_CMYK_WhiteBgPrintlogo-Netbase_Resonant-weblogo-attivio

문제점

Big Text

특징
  • 빅 데이터의 80%를 차지
  • 구조화되지 않음
  • 다국어
  • 방대한 분량

ROSETTE 컴포넌트 솔루션

언어 및 인코딩 식별

높은 정밀도로 수많은 언어 검색

사람, 장소 및 조직의 이름에 태크 지정

수많은 변형 간에 이름 일치

외국어 이름을 영어로 번역

결과

Sorted Languages, Better Search, Names of Entities, Matched Identities, Translated Names, Structured Text


더 자세한 정보를 원하시면 본 양식을 작성해 주십시오.

This is a unique website which will require a more modern browser to work! Please upgrade today!