Semantic relationships(意味的関係)

意味的関係の検索に関する情報

はじめに

このアプリケーションは、単語の統計的性質を分析することで、文中の単語どうしの意味的関係を検索します。

これは規則に基づくのではなく、関係を考慮せず、同じフレーズに2つの単語が出現する確率に基づいています

テクノロジー

これは、隣に出現する単語の統計的特性を座標として使用して、単語のn次元の表現を作りだします(PLSA)。このデモは、欧州議会の討論をコーパスとして使用しています。

なぜこれを開発したのか?

このテクノロジーは、ウェブから翻訳された用語を抽出できる、より複雑なプロジェクトに不可欠な部分です。

たとえば、ウェブ上で「Metallizzazione」の英語訳を見つけたい場合、この情報を抽出できるバイリンガルサイトを見つけるのは困難です。しかし、Googleで検索すると、「Metallizzazione」について語っているイタリア語のページが50,000件以上見つかるでしょう。これらのページから、「Metallazzione」は 「vuoto」、「impianto」、「vernice」、「finitura」、「metallo」と意味的に関係があり、これらについては英語の翻訳を簡単に見つけることができます。この時点で、「vacuum」、「plant」、「paint」、「metal」に共通するものを検索すると、その答えが 探していた「Metallization」の翻訳であることがわかります!

是非使用したい!

このテクノロジーにご興味を持ってくださった場合には、Translated Labs と自然言語処理に関する当社のサービスの詳細をお読みください。

力をお貸しください!

Translatedでは、グローバルな視点を持つ優れたエンジニアを常時募集しています。
当社アプリのさらなる向上に貢献できるとお考えの方は、ぜひご応募ください。

お問い合わせ

私たちの実験をご覧ください

Spoken Language Identifier(音声言語識別)

Spoken Language Identifierは、音声として発せられた言語の種類を自動的に判定します。1秒から1分までの録音を分類することができます。現在8言語に対応しています。

もっと詳しく または APIを入手
Terminology Extractor(用語抽出)

専門的な内容の文書から専門用語を自動的に抽出するツールです。翻訳者が文書内の難関点を特定し、用語集をスムーズに作成するのに役立ちます。

もっと詳しく または APIを入手
Readability analyzer(可読性アナライザー)

ウェブサイトをはじめとする書面情報は、読みやすく、すっきりとした構成が求められます。Readability analyzerは、テキストの読みやすさや改善の必要性を教えてくれます。

もっと詳しく または APIを入手
Language Identifier(言語識別)

Language Identifierは、書面に記載された文章の言語を自動的に判定します。また、理解できない言語で書かれた文章のトピックを識別するのにも役立ちます。

もっと詳しく
Semantic relationships(意味的関係)

飛行機、鳥、ヘリコプターという単語の共通点は何か?このアプリケーションは、単語の統計的性質を分析することで、文中の単語どうしの意味的関係を検索します。

もっと詳しく
Translation Party(翻訳パーティー)

英文を日本語に翻訳し、それをまた英語に翻訳し直す。それが無限ループのように続くとどうなるでしょう?ぜひ、お試しを!面白い結末を、ぜひお友達にシェアしてくださいね。

もっと詳しく