Automatic Language Identifier

Информация о Language Identifier

Описание

Language Identifier — это автоматический классификатор. Он рассчитывает сходство документа с ранее загруженными справочными текстами.

Технология

Создается n-мерное представление текста(векторно-пространственная модель) с использованием в качестве координат статистических свойств последовательностей байтов, найденных в тексте. Та же операция выполняется с ранее загруженными справочными текстами. В n-мерном пространстве вставленный текст будет иметь точное положение. Справочный текст, расположенный к нему ближе всего, будет наиболее на него похожим.

Почему мы разработали это приложение?

Технология является неотъемлемой частью программы глобального поиска, способной извлекать из Интернета полезную для наших переводчиков информацию.

Приложение может использоваться в качестве автоматического классификатора для определения категории документа путем анализа документов-образцов. Поэтому мы также используем его для классификации нашей корреспонденции и определения темы письменного текста на языке, который не понимаем.

Мне это нужно!

Если вас заинтересовала эта технология, узнайте больше о Translated Labs и наших услугах по обработке естественного языка.

Я могу лучше!

Мы находимся в постоянном поиске первоклассных инженеров, мыслящих глобально.
Свяжитесь с нами, если считаете, что можете улучшить любое из этих приложений.

Свяжитесь с нами

Ознакомьтесь с нашими экспериментами

Spoken Language Identifier

Spoken Language Identifier автоматически определяет язык произнесенного текста. Технология может использоваться для классификации записей длиной от 1 секунды до 1 минуты. В настоящее время поддерживается 8 языков.

Узнайте больше или получите API
Terminology Extractor

Этот инструмент автоматически извлекает техническую терминологию из письменного текста.Он помогает переводчикам выявлять трудности в документе и упрощает процесс создания глоссариев.

Узнайте больше или получите API
Readability Analyzer

Письменная информация, особенно в Интернете, должна быть легко читаемой и хорошо структурированной.Это приложение поможет вам понять степень удобочитаемости текста и при необходимости внести изменения.

Узнайте больше или получите API
Language Identifier

Language Identifier автоматически определяет язык письменного текста. Его также можно использовать для определения темы письменного текста на языке, который вы не понимаете.

Узнайте больше
Semantic Relationships

Что общего у слов "самолет", "птица" и "вертолет"?Это приложение осуществляет поиск семантических связей в тексте, анализируя статистические свойства слов.

Узнайте больше
Translation Party

Что произойдет, если вы переведете английское предложение на японский, а затем снова на английский, как если бы это был бесконечный цикл? Попробуйте прямо сейчас! И не забудьте поделиться забавными фразами с друзьями.

Узнайте больше