自動言語識別

言語識別子に関する情報

はじめに

言語識別子は、自動分類子です。あるテキストと、以前に挿入した参照テキストとの類似性を計算します。

テクノロジー

これは、テキストに出現するバイトシーケンスの統計的特性を座標として使用して、テキストのn次元の表現を作りだします（ベクトル空間モデル）。以前に挿入した参照テキストに対して同じ操作を実行します。n次元空間では、挿入したテキストは正確な位置で示されます。それに最も近い参照テキストが、最もよく似ているということになります。

なぜこれを開発したのか？

このテクノロジーは、翻訳者にとって有用な情報をWebから抽出できるスパイダーの不可欠な部分です。

自動分類子として、サンプルドキュメントを提供することで、ドキュメントがどのカテゴリに属するかを簡単に示すことができます。このような機能により、メールなどのやり取りを分類し、理解できない言語で書かれたテキストのトピックを特定するためにも使用しています。

是非使用したい！

このテクノロジーにご興味を持ってくださった場合には、 Translated Labs と自然言語処理に関する当社のサービスの詳細をお読みください。

力をお貸しください！

Translatedでは、グローバルな視点を持つ優れたエンジニアを常時募集しています。
当社アプリのさらなる向上に貢献できるとお考えの方は、ぜひご応募ください。

お問い合わせ

私たちの実験をご覧ください

音声言語識別

音声言語識別は、音声として発せられた言語の種類を自動的に判定します。1秒から1分までの録音を分類することができます。現在8言語に対応しています。

もっと詳しくまたは APIを入手

用語抽出

専門的な内容の文書から専門用語を自動的に抽出するツールです。翻訳者が文書内の難関点を特定し、用語集をスムーズに作成するのに役立ちます。

もっと詳しくまたは APIを入手

可読性アナライザー

ウェブサイトをはじめとする書面情報は、読みやすく、すっきりとした構成が求められます。可読性アナライザーは、テキストの読みやすさや改善の必要性を教えてくれます。

もっと詳しくまたは APIを入手

言語識別

言語識別は、書面に記載された文章の言語を自動的に判定します。また、理解できない言語で書かれた文章のトピックを識別するのにも役立ちます。

もっと詳しく

意味的関係

飛行機、鳥、ヘリコプターという単語の共通点は何か？このアプリケーションは、単語の統計的性質を分析することで、文中の単語どうしの意味的関係を検索します。

もっと詳しく

Translation Party

英文を日本語に翻訳し、それをまた英語に翻訳し直す。それが無限ループのように続くとどうなるでしょう？ぜひ、お試しを！面白い結末を、ぜひお友達にシェアしてくださいね。

もっと詳しく