Extração de terminologia
Informações sobre a extração de terminologia
Introdução
A terminologia é a soma dos termos que identificam um tópico específico. A extração de terminologia é o processo de extrair terminologia de um texto.
A ideia é comparar a frequência das palavras em um determinado documento com a frequência delas no idioma. Palavras que aparecem com muita frequência no documento, mas raramente no idioma, são provavelmente termos.
Tecnologia
Ele usa estatísticas de Poisson, estimativa máxima de verossimilhança e frequência inversa de documentos entre a frequência de palavras em um determinado documento e um corpus genérico de 100 milhões de palavras por idioma. Ele usa um identificador probabilístico de parte do discurso para levar em conta a probabilidade de que uma sequência específica possa ser um termo. Cria n-gramas de palavras, minimizando a entropia relativa.
Por que nós desenvolvemos isso?
A Translated desenvolveu essa tecnologia para ajudar seus tradutores a conhecer as dificuldades de um documento e simplificar o processo de criação de glossários.
Nós também a usamos para aprimorar os resultados de busca nos mecanismos de busca tradicionais (mais especificamente, o Google), fornecendo uma estimativa melhor de quanto uma palavra-chave é relevante para um documento.
Eu quero!
Se você tem interesse nessa tecnologia, leia mais sobre a Translated Labs e nossos serviços para processamento de linguagem natural.
Eu posso fazer melhor!
Estamos sempre em busca de excelentes engenheiros com uma mentalidade global.
Entre em contato se acha que pode aprimorar algum desses aplicativos.
Explore nossas experiências
Identificador do idioma falado
O identificador do idioma falado detecta automaticamente o idioma de um texto falado. Você pode usá-lo para classificar gravações de 1 segundo a 1 minuto. Atualmente, ele é compatível com oito idiomas.
Saiba mais ou obtenha a APIExtrator de terminologia
Esta ferramenta extrai automaticamente a terminologia de um tópico técnico de um texto escrito.Ela pode ajudar os tradutores a identificar as dificuldades em um documento e simplificar o processo de criação de glossários.
Saiba mais ou obtenha a APIAnalisador de legibilidade
As informações escritas, especialmente na Internet, devem ser fáceis de ler e bem estruturadas.Este aplicativo ajuda você a entender se um texto é facilmente legível ou se precisa de melhorias.
Saiba mais ou obtenha a APIIdentificador de idioma
O identificador de idioma detecta automaticamente o idioma de um texto escrito. Ele também pode ser usado para identificar o tópico de um texto escrito em um idioma que você não entende.
Saiba maisRelações semânticas
O que as palavras avião, pássaro e helicóptero têm em comum?Este aplicativo procura por relações semânticas em um texto, analisando as propriedades estatísticas das palavras.
Saiba maisTranslation Party
O que acontece quando você traduz uma frase em inglês para japonês e depois para inglês, como se fosse um loop infinito? Experimente! E não se esqueça de compartilhar os resultados mais engraçados com seus amigos.
Saiba mais