自动语言识别器

关于语言识别器

简介

语言识别器是一款自动分类器。该工具能够计算文本与事先输入的参考文本之间的相似度。

技术

该技术通过字节序列的统计属性(文本中的坐标)创建文本的 N 维表达(向量空间模型)。它对先前插入的参考文本执行所述操作。在 N 维空间中,插入的文本将拥有精确的位置信息。最接近它的参考文本将是最类似的文本。

开发该技术的理由?

这款工具是一项爬虫技术的一部分,它能够从网络上为我们的译者提取有用的信息。

它可用作自动分类器,只需提供示例文本,即可轻松地识别文本所属的类别。我们还会使用这款工具对通信信息进行分类,并识别以我们不懂的语言书写的文本主题。

我希望使用该技术!

如果您对此技术感兴趣,请参阅有关 Translated Labs 以及自然语言处理服务的更多信息。

我也能行!

我们一直在寻找具有全球思维的优秀工程师。
如果您认为自己有能力改善这些应用程序,欢迎与我们联系。

联系我们

了解我们的实验

口语语言识别器

口语语言识别器能够自动检测一段语音使用的语言。您可以使用这个工具对长度为 1 秒到 1 分钟之间的录音进行分类。该工具目前支持 8 种语言。

了解详情获取 API
术语提取器

术语提取器能够从书面文本中自动提取技术主题的术语。它可以帮助译者识别文档的难易程度,并简化创建词汇表的过程。

了解详情获取 API
可读性分析器

文本信息(尤其是互联网上的文本)必须结构合理并易于阅读。该应用能够帮助您了解一份文本的语言是否通顺流畅,或是否需要改进。

了解详情获取 API
语言识别器

语言识别器能够自动检测书面文本使用的语言。它还可以用于识别书面文本的主题。

了解详情
语义关系

“飞机”、“鸟类”和“直升机”,这几个词汇有什么共同点?该应用通过分析词汇的统计学属性来确定文本中的语义关系。

了解详情
翻译派对

如果您将一个英文句子翻译成日文,然后又重新翻译回英文(像一个无限循环),会有什么有趣的情况发生?欢迎您来试一试!请记得与您的朋友分享有趣的结果。

了解详情