translatedlabs.com

Extraction de la terminologie

Informations sur l'extraction de la terminologie

Introduction

La terminologie est l'ensemble des termes qui identifient un sujet spécifique. L'extraction de la terminologie est le processus consistant à ressortir la terminologie d'un texte.

L'idée est de comparer la fréquence des mots dans un document donné avec leur fréquence dans la langue. Les mots qui apparaissent très fréquemment dans le document mais rarement dans la langue sont probablement des termes.

Technologie

Elle utilise les statistiques de Poisson, l' Estimation du maximum de vraisemblance et la fréquence inverse du document entre la fréquence des mots dans un document donné et un corpus générique de 100 millions de mots par langue. Elle utilise un tagger probabiliste de partie de discours pour prendre en compte la probabilité qu'une séquence particulière soit un terme. Elle crée des n-grammes de mots en minimisant l' entropie relative.

Pourquoi avons-nous développé cette technologie ?

Translated a développé cette technologie pour aider ses traducteurs à prendre conscience des difficultés d'un document et à simplifier le processus de création de glossaires.

Nous l'utilisons également pour améliorer les résultats de recherche dans les moteurs de recherche traditionnels (p. ex. Google) en donnant une meilleure estimation de la pertinence d'un mot clé pour un document.

Je la veux !

Si cette technologie vous intéresse, découvrez-en plus sur Translated Labs et nos services pour le traitement du langage naturel.

Je peux faire mieux !

Nous sommes constamment à la recherche d'ingénieurs de qualité ayant un état d'esprit ouvert et international.
Contactez-nous si vous pensez pouvoir améliorer ces applications.

Contactez-nous

Découvrez nos expériences

Identificateur de langue parlée

L'identificateur de langue parlée détecte automatiquement la langue d'un texte parlé. Vous pouvez l'utiliser pour classer des enregistrements d'une seconde à une minute. Il prend actuellement en charge 8 langues.

En savoir plus ou obtenir l'API
Extracteur de terminologie

Cet outil extrait automatiquement la terminologie d'un sujet technique à partir d'un texte écrit.Il peut aider les traducteurs à identifier les difficultés d'un document et simplifier le processus de création de glossaires.

En savoir plus ou obtenir l'API
Analyseur de lisibilité

Les informations écrites, en particulier sur Internet, doivent être faciles à lire et bien structurées.Cette application vous aide à comprendre si un texte est facilement lisible ou s'il doit être amélioré.

En savoir plus ou obtenir l'API
Identificateur de langue

L'identificateur de langue détecte automatiquement la langue d'un texte écrit. Il peut également être utilisé pour identifier le sujet d’un texte écrit dans une langue que vous ne comprenez pas.

En savoir plus
Relations sémantiques

Qu'est-ce que les mots avion, oiseau et hélicoptère ont en commun ?Cette application recherche les relations sémantiques dans un texte en analysant les propriétés statistiques des mots.

En savoir plus
Translation Party

Que se passe-t-il lorsque vous traduisez une phrase anglaise en japonais, puis à nouveau en anglais, comme s'il s'agissait d'une boucle infinie ? Eh bien, essayez ! Et n'oubliez pas de partager les résultats les plus amusants avec vos amis.

En savoir plus