Readability analyzer(可読性アナライザー)

読みやすさ分析に関する情報

はじめに

単語の長さとフレーズの長さは、特定のテキストの読みやすさと理解のしやすさに影響します。通常、単語は短いものの方が一般的です(ジップの法則)。短い文章は、理解するために抽象化能力があまり必要ではありません。読みやすさ分析は、テキストを改善し、分かりやすさを高めるのに役立ちます。

なぜこれを開発したのか?

読みやすさの指標は、与えられたテキストがどれくらい理解しやすいかを示します。よく書けたテキストは、効果的で、理解しやすく、素早く読むことができます。この指標は、翻訳者と校正者の作業を最適にスケジュールするために、テキストの複雑さを理解するのに役立ちます。これまで以上に、書かれた情報は、特にインターネットにおいて直接的で、適切に構造化されている必要があります。この分析は、両方の目的を達成するのに役立ちます。

テクノロジー


読みやすさ

読みやすさは、Gulpease指標を使用して計算されます。この指標は、イタリア語、英語、フランス語で実装されています。ドイツ語とスペイン語では、読みやすさの指標のみが機能します。目的の言語がまだサポートされておらず、このテクノロジーにご興味がある場合は、ご遠慮なくお問い合わせください

用語

与えられた文書中の単語の頻度と1言語に対して1億単語のコーパスの間のポアソン統計、最尤推定 、および対数逆文書頻度を使用します。単語が特定の順序で出現してある用語となる可能性を考慮するため、確率的な品詞タガーを使用しています。相対エントロピーを最小限に抑えることで、単語のn-gramを作り出します。詳細については、用語抽出をご覧ください。

力をお貸しください!

Translatedでは、グローバルな視点を持つ優れたエンジニアを常時募集しています。
当社アプリのさらなる向上に貢献できるとお考えの方は、ぜひご応募ください。

お問い合わせ

私たちの実験をご覧ください

Spoken Language Identifier(音声言語識別)

Spoken Language Identifierは、音声として発せられた言語の種類を自動的に判定します。1秒から1分までの録音を分類することができます。現在8言語に対応しています。

もっと詳しく または APIを入手
Terminology Extractor(用語抽出)

専門的な内容の文書から専門用語を自動的に抽出するツールです。翻訳者が文書内の難関点を特定し、用語集をスムーズに作成するのに役立ちます。

もっと詳しく または APIを入手
Readability analyzer(可読性アナライザー)

ウェブサイトをはじめとする書面情報は、読みやすく、すっきりとした構成が求められます。Readability analyzerは、テキストの読みやすさや改善の必要性を教えてくれます。

もっと詳しく または APIを入手
Language Identifier(言語識別)

Language Identifierは、書面に記載された文章の言語を自動的に判定します。また、理解できない言語で書かれた文章のトピックを識別するのにも役立ちます。

もっと詳しく
Semantic relationships(意味的関係)

飛行機、鳥、ヘリコプターという単語の共通点は何か?このアプリケーションは、単語の統計的性質を分析することで、文中の単語どうしの意味的関係を検索します。

もっと詳しく
Translation Party(翻訳パーティー)

英文を日本語に翻訳し、それをまた英語に翻訳し直す。それが無限ループのように続くとどうなるでしょう?ぜひ、お試しを!面白い結末を、ぜひお友達にシェアしてくださいね。

もっと詳しく