Terminologie-Extraktion

Informationen zum Extrahieren von Terminologie

Einführung

Die Terminologie ist die Summe der Begriffe, die ein bestimmtes Thema identifizieren. Das Extrahieren von Terminologie ist der Prozess des Extrahierens von Terminologie aus einem Text.

Die Idee besteht darin, die Häufigkeit von Wörtern in einem bestimmten Dokument mit ihrer Häufigkeit in der Sprache zu vergleichen. Wörter, die sehr häufig im Dokument, aber selten in der Sprache vorkommen, sind wahrscheinlich Fachtermini.

Technologie

Die Technologie verwendet Poisson-Statistiken, die Maximum-Likelihood-Schätzung und die Häufigkeit inverser Dokumente zwischen der Häufigkeit von Wörtern in einem bestimmten Dokument und einem generischen Korpus von 100 Millionen Wörtern pro Sprache. Sie verwendet einen probabilistischen Teil-der-Sprache-Tagger, um die Wahrscheinlichkeit zu berücksichtigen, dass eine bestimmte Abfolge ein Fachterminus sein könnte. Sie erzeugt n-Gramm Wörter, indem die relative Entropie minimiert wird.

Warum haben wir dieses Tool entwickelt?

Translated hat diese Technologie entwickelt, um seinen Übersetzern zu helfen, sich der Schwierigkeiten in einem Dokument bewusst zu werden und den Prozess der Erstellung von Glossaren zu vereinfachen.

Wir verwenden sie auch, um die Suchergebnisse in herkömmlichen Suchmaschinen zu verbessern, (vor allem Google), indem eine bessere Einschätzung gegeben wird, wie wichtig ein Schlüsselwort für ein Dokument ist.

Ich möchte diesen Dienst nutzen

Wenn Sie an dieser Technologie interessiert sind, lesen Sie bitte mehr über Translated Labs und unsere Dienstleistungen für die Verarbeitung natürlicher Sprache.

Ich habe Verbesserungsvorschläge

Wir sind immer auf der Suche nach erfahrenen Ingenieuren mit einer globalen Denkweise.
Kontaktieren Sie uns, wenn Sie Verbesserungsvorschläge für eine dieser Anwendungen haben.

Kontakt aufnehmen

Erfahren Sie mehr über unsere Arbeit

Spoken Language Identifier

Der Spoken Language Identifier erkennt automatisch die Sprache eines gesprochenen Textes. Sie können damit Aufnahmen von einer Sekunde bis zu einer Minute klassifizieren. Er unterstützt derzeit acht Sprachen.

Mehr erfahren oder API abrufen
Terminology Extractor

Dieses Tool extrahiert automatisch die Terminologie eines technischen Themas aus einem schriftlichen Text.Er kann Übersetzern helfen, die Schwierigkeiten in einem Dokument zu erkennen und den Prozess der Erstellung von Terminologiedatenbanken zu vereinfachen.

Mehr erfahren oder API abrufen
Readability Analyzer

Schriftliche Informationen, insbesondere im Internet, müssen leicht verständlich und gut strukturiert sein. Diese Anwendung hilft Ihnen zu verstehen, ob ein Text leicht lesbar ist oder ob er verbessert werden muss.

Mehr erfahren oder API abrufen
Language Identifier

Der Language Identifier erkennt automatisch die Sprache eines geschriebenen Textes. Er kann auch verwendet werden, um das Thema eines schriftlichen Textes in einer Sprache zu identifizieren, die Sie nicht verstehen.

Mehr erfahren
Semantische Beziehungen

Was haben die Wörter Flugzeug, Vogel und Hubschrauber gemeinsam?Diese Anwendung sucht nach semantischen Beziehungen in einem Text, indem sie die statistischen Eigenschaften von Wörtern analysiert.

Mehr erfahren
Translation Party

Was passiert, wenn Sie einen englischen Satz ins Japanische und dann wieder ins Englische übersetzen, als wäre es eine Endlosschleife? Probieren Sie es mal aus! Und vergessen Sie nicht, die lustigsten Ergebnisse mit Ihren Freunden zu teilen.

Mehr erfahren