translatedlabs.com

Relações semânticas

Informações sobre a busca de relações semânticas

Introdução

Este aplicativo procura relações semânticas em um texto, analisando as propriedades estatísticas das palavras.

Ele não se baseia em regras, mas na probabilidade de que duas palavras podem aparecer na mesma frase sem estarem relacionadas.

Tecnologia

Ele cria uma representação n-dimensional de palavras (PLSA) usando as propriedades estatísticas das palavras que aparecem ao lado delas como coordenadas. Esta demonstração usa os debates do Parlamento Europeu como corpus.

Por que nós desenvolvemos isso?

Essa tecnologia é parte integrante de um projeto mais complicado, capaz de extrair terminologia traduzida da Internet.

Por exemplo, se você deseja encontrar na Internet a tradução em inglês de "Metallizzazione", será difícil encontrar sites bilíngues de onde essas informações possam ser extraídas — mas você encontrará no Google mais de 50 mil páginas em italiano que falam sobre "Metallizzazione". Nestas páginas, você descobrirá que "Metallazzione" tem relações semânticas com "vuoto", "impianto", "vernice", "finitura", "metallo", para as quais as traduções em inglês podem ser facilmente encontradas. Nesse ponto, você pode procurar o que as palavras "vácuo", "planta", "tinta", "metal" têm em comum e a resposta será "metalização" — a tradução que você estava procurando!

Eu quero!

Se você tem interesse nessa tecnologia, leia mais sobre a Translated Labs e nossos serviços para processamento de linguagem natural.

Eu posso fazer melhor!

Estamos sempre em busca de excelentes engenheiros com uma mentalidade global.
Entre em contato se acha que pode aprimorar algum desses aplicativos.

Fale conosco

Explore nossas experiências

Identificador do idioma falado

O identificador do idioma falado detecta automaticamente o idioma de um texto falado. Você pode usá-lo para classificar gravações de 1 segundo a 1 minuto. Atualmente, ele é compatível com oito idiomas.

Saiba mais ou obtenha a API
Extrator de terminologia

Esta ferramenta extrai automaticamente a terminologia de um tópico técnico de um texto escrito.Ela pode ajudar os tradutores a identificar as dificuldades em um documento e simplificar o processo de criação de glossários.

Saiba mais ou obtenha a API
Analisador de legibilidade

As informações escritas, especialmente na Internet, devem ser fáceis de ler e bem estruturadas.Este aplicativo ajuda você a entender se um texto é facilmente legível ou se precisa de melhorias.

Saiba mais ou obtenha a API
Identificador de idioma

O identificador de idioma detecta automaticamente o idioma de um texto escrito. Ele também pode ser usado para identificar o tópico de um texto escrito em um idioma que você não entende.

Saiba mais
Relações semânticas

O que as palavras avião, pássaro e helicóptero têm em comum?Este aplicativo procura por relações semânticas em um texto, analisando as propriedades estatísticas das palavras.

Saiba mais
Translation Party

O que acontece quando você traduz uma frase em inglês para japonês e depois para inglês, como se fosse um loop infinito? Experimente! E não se esqueça de compartilhar os resultados mais engraçados com seus amigos.

Saiba mais