自动语言识别器
关于语言识别器
简介
语言识别器是一款自动分类器。该工具能够计算文本与事先输入的参考文本之间的相似度。
技术
该技术通过字节序列的统计属性(文本中的坐标)创建文本的 N 维表达( 向量空间模型)。它对先前插入的参考文本执行所述操作。在 N 维空间中,插入的文本将拥有精确的位置信息。最接近它的参考文本将是最类似的文本。
开发该技术的理由?
这款工具是一项爬虫技术的一部分,它能够从网络上为我们的译者提取有用的信息。
它可用作自动分类器,只需提供示例文本,即可轻松地识别文本所属的类别。我们还会使用这款工具对通信信息进行分类,并识别以我们不懂的语言书写的文本主题。
我希望使用该技术!
如果您对此技术感兴趣,请参阅有关 Translated Labs 以及自然语言处理服务的更多信息。
我也能行!
我们一直在寻找具有全球思维的优秀工程师。
如果您认为自己有能力改善这些应用程序,欢迎与我们联系。