可读性分析器

关于可读性分析器

简介

词汇的生僻程度和句子的长度影响着既定文本的阅读理解难度。简短的词汇通常更为常见(齐夫定律)。较短的句子对抽象理解能力的要求往往较低。可读性分析可用于改善文本,提高其可读性。

开发该技术的理由?

可读性指数可以告诉我们理解既定文本的难易程度。一篇好的文本是高效的、易于理解的且可快速阅读的。该指数有助于帮助我们理解文本的复杂程度,以便更好地安排翻译和审阅工作。当今社会,文本信息(尤其是互联网上的文本)比以往任何时候都更需要拥有合理的结构,并能够直接传递信息。该分析可以帮助同时实现这两个目标。

技术


可读性

我们通过 Gulpease 指数计算可读性。该指数已被用于意大利语、英语和法语。对于德语和西班牙语,仅提供可读性指数分析。如果该技术尚不支持您的语言,但您对此感兴趣,欢迎与我们取得联系

术语

该技术使用泊松统计、最大似然估计和逆文本频率指数在既定文档词汇频率和相应语言的 1 亿字通用语料库之间进行比较。它使用概率词性标注来考量特定词汇序列是术语的概率。它通过最小化相对熵来形成 N 元字节(n-grams)。如需了解更多信息,请参见术语提取

我也能行!

我们一直在寻找具有全球思维的优秀工程师。
如果您认为自己有能力改善这些应用程序,欢迎与我们联系。

联系我们

了解我们的实验

口语语言识别器

口语语言识别器能够自动检测一段语音使用的语言。您可以使用这个工具对长度为 1 秒到 1 分钟之间的录音进行分类。该工具目前支持 8 种语言。

了解详情获取 API
术语提取器

Terminology Extractor 能够从书面文本中自动提取技术主题的术语。它可以帮助译者识别文档的难易程度,并简化创建词汇表的过程。

了解详情获取 API
可读性分析器

文本信息(尤其是互联网上的文本)必须结构合理并易于阅读。该应用能够帮助您了解一份文本的语言是否通顺流畅,或是否需要改进。

了解详情获取 API
语言识别器

语言识别器能够自动检测书面文本使用的语言。它还可以用于识别书面文本的主题。

了解详情
语义关系

“飞机”、“鸟类”和“直升机”,这几个词汇有什么共同点?该应用通过分析词汇的统计学属性来确定文本中的语义关系。

了解详情
翻译派对

如果您将一个英文句子翻译成日文,然后又重新翻译回英文(像一个无限循环),会有什么有趣的情况发生?欢迎您来试一试!请记得与您的朋友分享有趣的结果。

了解详情