Extração de terminologia

Informações sobre a extração de terminologia

Introdução

A terminologia é a soma dos termos que identificam um tópico específico. A extração de terminologia é o processo de extrair terminologia de um texto.

A ideia é comparar a frequência das palavras em um determinado documento com a frequência delas no idioma. Palavras que aparecem com muita frequência no documento, mas raramente no idioma, são provavelmente termos.

Tecnologia

Ele usa estatísticas de Poisson, estimativa máxima de verossimilhança e frequência inversa de documentos entre a frequência de palavras em um determinado documento e um corpus genérico de 100 milhões de palavras por idioma. Ele usa um identificador probabilístico de parte do discurso para levar em conta a probabilidade de que uma sequência específica possa ser um termo. Cria n-gramas de palavras, minimizando a entropia relativa.

Por que nós desenvolvemos isso?

A Translated desenvolveu essa tecnologia para ajudar seus tradutores a conhecer as dificuldades de um documento e simplificar o processo de criação de glossários.

Nós também a usamos para aprimorar os resultados de busca nos mecanismos de busca tradicionais (mais especificamente, o Google), fornecendo uma estimativa melhor de quanto uma palavra-chave é relevante para um documento.

Eu quero!

Se você tem interesse nessa tecnologia, leia mais sobre a Translated Labs e nossos serviços para processamento de linguagem natural.

Eu posso fazer melhor!

Estamos sempre em busca de excelentes engenheiros com uma mentalidade global.
Entre em contato se acha que pode aprimorar algum desses aplicativos.

Fale conosco

Explore nossas experiências

Identificador de idioma falado

O identificador de idioma falado detecta automaticamente o idioma de um texto falado. Você pode usá-lo para classificar gravações de 1 segundo a 1 minuto. Atualmente, ele é compatível com oito idiomas.

Saiba mais ou obtenha a API
Extrator de terminologia

Esta ferramenta extrai automaticamente a terminologia de um tópico técnico de um texto escrito.Ela pode ajudar os tradutores a identificar as dificuldades em um documento e simplificar o processo de criação de glossários.

Saiba mais ou obtenha a API
Analisador de legibilidade

As informações escritas, especialmente na Internet, devem ser fáceis de ler e bem estruturadas.Este aplicativo ajuda você a entender se um texto é facilmente legível ou se precisa de melhorias.

Saiba mais ou obtenha a API
Identificador de idioma

O identificador de idioma detecta automaticamente o idioma de um texto escrito. Ele também pode ser usado para identificar o tópico de um texto escrito em um idioma que você não entende.

Saiba mais
Relações semânticas

O que as palavras avião, pássaro e helicóptero têm em comum?Este aplicativo procura por relações semânticas em um texto, analisando as propriedades estatísticas das palavras.

Saiba mais
A festa da tradução

O que acontece quando você traduz uma frase em inglês para japonês e depois para inglês, como se fosse um loop infinito? Experimente! E não se esqueça de compartilhar os resultados mais engraçados com seus amigos.

Saiba mais