Terminologie-Extraktion
Informationen zum Extrahieren von Terminologie
Einführung
Die Terminologie ist die Summe der Begriffe, die ein bestimmtes Thema identifizieren. Das Extrahieren von Terminologie ist der Prozess des Extrahierens von Terminologie aus einem Text.
Die Idee besteht darin, die Häufigkeit von Wörtern in einem bestimmten Dokument mit ihrer Häufigkeit in der Sprache zu vergleichen. Wörter, die sehr häufig im Dokument, aber selten in der Sprache vorkommen, sind wahrscheinlich Fachtermini.
Technologie
Die Technologie verwendet Poisson-Statistiken, die Maximum-Likelihood-Schätzung und die Häufigkeit inverser Dokumente zwischen der Häufigkeit von Wörtern in einem bestimmten Dokument und einem generischen Korpus von 100 Millionen Wörtern pro Sprache. Sie verwendet einen probabilistischen Teil-der-Sprache-Tagger, um die Wahrscheinlichkeit zu berücksichtigen, dass eine bestimmte Abfolge ein Fachterminus sein könnte. Sie erzeugt n-Gramm Wörter, indem die relative Entropie minimiert wird.
Warum haben wir dieses Tool entwickelt?
Translated hat diese Technologie entwickelt, um seinen Übersetzern zu helfen, sich der Schwierigkeiten in einem Dokument bewusst zu werden und den Prozess der Erstellung von Glossaren zu vereinfachen.
Wir verwenden sie auch, um die Suchergebnisse in herkömmlichen Suchmaschinen zu verbessern, (vor allem Google), indem eine bessere Einschätzung gegeben wird, wie wichtig ein Schlüsselwort für ein Dokument ist.
Ich möchte diesen Dienst nutzen
Wenn Sie an dieser Technologie interessiert sind, lesen Sie bitte mehr über Translated Labs und unsere Dienstleistungen für die Verarbeitung natürlicher Sprache.
Ich habe Verbesserungsvorschläge
Wir sind immer auf der Suche nach erfahrenen Ingenieuren mit einer globalen Denkweise.
Kontaktieren Sie uns, wenn Sie Verbesserungsvorschläge für eine dieser Anwendungen haben.
Erfahren Sie mehr über unsere Arbeit
Spracherkenner für gesprochene Texte
Der Spracherkenner für gesprochene Texte erkennt automatisch die Sprache eines gesprochenen Textes. Sie können damit Aufnahmen von einer Sekunde bis zu einer Minute klassifizieren. Er unterstützt derzeit acht Sprachen.
Mehr erfahren oder API abrufenTerminologie-Extraktion
Dieses Tool extrahiert automatisch die Terminologie eines technischen Themas aus einem schriftlichen Text.Er kann Übersetzern helfen, die Schwierigkeiten in einem Dokument zu erkennen und den Prozess der Erstellung von Terminologiedatenbanken zu vereinfachen.
Mehr erfahren oder API abrufenLesbarkeitsanalyse
Schriftliche Informationen, insbesondere im Internet, müssen leicht verständlich und gut strukturiert sein. Diese Anwendung hilft Ihnen zu verstehen, ob ein Text leicht lesbar ist oder ob er verbessert werden muss.
Mehr erfahren oder API abrufenSpracherkenner
Der Spracherkenner erkennt automatisch die Sprache eines geschriebenen Textes. Er kann auch verwendet werden, um das Thema eines schriftlichen Textes in einer Sprache zu identifizieren, die Sie nicht verstehen.
Mehr erfahrenSemantische Beziehungen
Was haben die Wörter Flugzeug, Vogel und Hubschrauber gemeinsam?Diese Anwendung sucht nach semantischen Beziehungen in einem Text, indem sie die statistischen Eigenschaften von Wörtern analysiert.
Mehr erfahrenTranslation Party
Was passiert, wenn Sie einen englischen Satz ins Japanische und dann wieder ins Englische übersetzen, als wäre es eine Endlosschleife? Probieren Sie es mal aus! Und vergessen Sie nicht, die lustigsten Ergebnisse mit Ihren Freunden zu teilen.
Mehr erfahren