자동 언어 식별기
언어 식별기에 대한 정보
소개
언어 식별기는 자동 분류기입니다. 텍스트와, 이전에 입력한 참조용 텍스트와의 유사성을 계산합니다.
기술
좌표로 표시되는 바이트 순서의 통계적 속성을 사용하여 텍스트의 다차원적인 표현( Vector Space Model)을 생성합니다. 이전에 입력된 참조용 텍스트에서도 동일한 작업을 수행합니다. 입력된 텍스트는 다차원 공간에서 명확한 위치를 갖습니다. 가장 가까운 곳에 위치한 참조용 텍스트가 가장 유사한 참조용 텍스트입니다.
왜 이것을 개발했을까요?
이 기술은 웹에서 번역가에게 유용한 정보를 추출하는 스파이더의 필수 기술입니다.
예제 문서를 제공함으로써 문서가 어느 범주에 속하는지 쉽게 분류할 수 있는 자동 분류기입니다. 저희도 문서를 분류하고 이해하지 못하는 언어로 작성된 텍스트의 주제를 식별하는 데 사용하고 있습니다.
사용해보고 싶어요!
이 기술에 관심이 있으시면 Translated Labs에서 자세히 알아보고 자연어 처리에 관한 당사의 서비스를 확인하세요.
더 잘 할 수 있습니다!
당사는 글로벌 마인드를 지닌 뛰어난 엔지니어를 상시 채용하고 있습니다.
이러한 애플리케이션을 개선할 능력이 있다고 생각한다면 연락해주세요.
당사의 실험을 확인하세요
Translation Party
무한 루프처럼, 영어 문장을 일본어로 번역한 다음 다시 영어로 번역하면 어떻게 될까요? 한 번 해보세요! 그리고, 잊지 말고 재미있는 결과를 친구들과 꼭 공유해보세요.
더 알아보기