전자증거개시(E-Discovery)

Automatically discover names of people , places , and organizations to build connections across millions of unstructured multilingual documents.

영어를 넘어선 다국어로의 전자증거개시 영역의 확대

현재와 같은 글로벌화의 시대에서는, 외국에서 작성되거나 외국어로 쓰여진 문서가 법률 조사에 있어 깊게 연관되는 경우가 매우 많습니다. 또한, 국경을 넘어선 법정 소송이 빈번해 짐으로 인해, 법률팀이 자국어 이외의 언어로 작성된 수천 건의 문서들을 선별하고 평가하며 분석해야 할 상황에 수시로 처하게 됩니다.

이에 따라, 다국어 전자증거개시에 대한 중요성의 증가는 법조인과 그들의 테크놀로지 파트너에게 새로운 도전 과제를 발생시키게 되었습니다. 전자증거개시는 이미 복잡한데다 외국어나 다른 문자로 쓰여진 문건의 경우 그 복잡성이 기하급수적으로 증가하게 되는 것이 사실이기 때문입니다. 따라서, 치밀한 자료의 조사는 의뢰인에게 가장 최선의 결과를 제공해야 하는 법조인에게는 어느 때보다 중요한 부분이 되었습니다.

법률 기술의 진보

베이시스 테크놀로지는 법조계가 다국어 전자증거개시로 인해 겪는 어려움을 해결할 수 있도록 도와줍니다. 본사의 기술은 종합적인 전자증거개시 솔루션을 제공함으로써 테라바이트(terabyte) 규모의 비구조화된 다국어 문서에 뭍혀 있는 증거를 정확하고 신속하게 또한 비용 효율적으로 발견하게 해 줍니다.

당사가 제공하는 솔루션은 업계 내에서 가장 진보된 언어 소프트웨어를 통해 가능하며, 이러한 소프트웨어는 업계 선도의 다국어 검색 엔진과 정보 검색 어플리케이션의 핵심으로 사용되어지고 있습니다. 저희의 다국어 전자증거개시 솔루션은 수백 개의 기업과 정부 환경에서 성능이 입증된 언어 처리 플랫폼인 Rosette®을 기반으로 하고 있습니다.

전자증거개시 어플리케이션의 다국어화

업계 선도인 본사의 언어 처리 소프트웨어는 데이터 마이닝, 검토 분석 및 법조팀이 사용하는 기타 증거개시 어플리케이션과도 쉽게 통합된다는 장점을 가지고 있습니다. Rosette API를 어플리케이션에 연동함으로써, 사용자는 주요 유럽, 아시아 및 중동 언어까지 지원되는 고유한 전자증거개시 제품들을 즉시 사용할 수 있게 됩니다. 이를 통해 법조계에 종사하는 전문가들은 비교 불가한 정확성과 효율성을 가지고 다국어 문서를 검토할 수 있습니다.

제품 강점

  • 테라바이트(terabyte) 규모의 비구조화 다국어 문서에 뭍혀 있는 증거 발견
  • 언어에 관계없이 증거개시 가능
  • 모든 관련된 다국어 문서 생성
  • 아시아, 유럽 및 중동 언어를 포함한 55개의 언어 지원

다국어 전자증거개시(E-Discovery)의 3단계

단계 1: 문서 내의 언어와 인코팅을 식별한 다음 유니코드로 변환
컴포넌트: Rosette 언어 판별 모듈(RLI)

언어 판별 모듈은 문서 내에 존재하는 언어와 문자 인코딩 시스템을 식별해 내어 문서의 텍스트 콘텐츠를 필터링하고 처리할 수 있도록 해줍니다. 추출된 텍스트는 유니코드로 변환되어 디스커버리 및 정보 검색 애플리케이션이 언어에 구애받지 않고 단일 데이터 표현에 액세스할 수 있도록 해줍니다. Rosette Language Boundary Locator(RLBL)라고 불리는 모듈을 사용하여 혼합 언어 문서를 여러 영역으로 분할하여 각 영역에 대해 언어별 처리가 수행될 수 있습니다. 언어 판별 모듈은 짧은 텍스트 문자열을 제시한 경우라도 높은 정확성으로 55개 언어를 식별해 냅니다.

2 단계: 언어 지능을 적용하여 단어 형태, 품사 및 문장 구조 식별
컴포넌트: Rosette 기본언어 분석 모듈(RBL)

기본언어 분석 모듈은 문서를 검사하고 완전한 기본언어 분석을 수행하여 텍스트를 정확하게 필터링하고 분석하며 검색할 수 있도록 해줍니다. 기본언어 분석 모듈은 유럽, 아시아 및 중동 언어로 작성된 문서 내에서 품사, 문장 경계, 단어의 분리, 토큰, 그 외 기타 언어적 구성 요소를 식별해 냅니다. 기본언어 분석 모듈의 기술과 언어 데이터는 10년 이상 동안의 개발과 웹 및 엔터프라이즈 검색 엔진에서의 사용을 통해 얻어진 결과물입니다.

3단계: 관심 항목 추출(사용자가 모르고 있던 항목까지 포함)
컴포넌트: Rosette 엔티티 추출 모듈(REX)

엔티티 추출 모듈은 구조화되어 있지 않은 텍스트를 정밀 조사하고 향후 분석을 위해 문서의 실제 의미를 갖게 하는 사람, 장소, 날짜 및 기타 항목을 식별해 냅니다. 엔티티 추출 모듈은 일반 용어뿐만 아니라 특정 이름, 전화 번호, 이메일 주소 등과 같은 사용자 지정 엔터티를 찾아냅니다. 통계 모델링을 통해 단순히 가능성 목록을 참조하여 특정한 변형을 간과하는 위험을 초래하는 것이 아니라 엔터티가 문서 내에 실제로 존재하는지 여부를 확인하는 데 도움을 얻을 수 있습니다. 바로 그 결과가 사용자가 알고 있는 것뿐만 아니라 모르고 있었던 것까지 찾을 수 있게 해주는 엔터티 추출 기술입니다.

시스템 사양

Rosette은 휴대가 가능하고 확장성이 높은 소프트웨어 개발자 키트(SDK)로 랩톱 PC에서 초당 수천 개의 문서를 처리하는 멀티 CPU 서버에 이르기까지 다양한 플랫폼에서 구동됩니다.

완벽하게 문서화된 API가 제공되며 C, C++, Java 및 그 외 언어로 작성된 어플리케이션을 통해 액세스할 수 있습니다. 테스트 목적으로 명령줄 인터페이스를 이용할 수도 있습니다.

SDK는 Apple MacOS, Microsoft Windows, Sun Solaris 및 다양한 Linux 배포판 용을 지원합니다.

제품 추가 정보

전자증거개시(E-Discovery)에 대한 더 자세한 내용을 보시려면, 전자증거개시 솔루션 브리프나 전자증거개시를 위한 Rosette 백서에서 확인하실 수 있습니다.


제품 관련 문의

전자증거개시(E-Discovery)에 대한 더 많은 정보를 원하시는 고객님께서는 아래 사항을 기재해 주시면, 담당자를 통해 연락 드리도록 하겠습니다.

더 자세히 알아보기

데이터시트 다운로드

This is a unique website which will require a more modern browser to work! Please upgrade today!