Extragerea terminologiei

Informații despre extragerea terminologiei

Introducere

Terminologia este suma termenilor care identifică un subiect specific. Extragerea terminologiei este procesul de extragere a termenilor dintr-un text.

Scopul este de a compara frecvența cuvintelor dintr-un document dat cu frecvența lor în limbă. Cuvintele care apar foarte des în document, dar rareori în limbă sunt probabil termeni.

Tehnologie

Utilizează statistici Poisson, estimarea probabilității maxime și frecvența inversă în documente dintre frecvența cuvintelor dintr-un document dat și un corpus generic de 100 de milioane de cuvinte pe limbă. Instrumentul folosește un marcator probabilistic de părți de vorbire pentru a lua în considerare probabilitatea ca o anumită secvență să fie un termen. Creează n-grame de cuvinte prin minimizarea entropiei relative.

De ce am dezvoltat această tehnologie?

Translated a dezvoltat această tehnologie pentru a ajuta traducătorii să fie conștienți de dificultățile unui document și pentru a simplifica procesul de creare a glosarelor.

De asemenea, îl folosim pentru a îmbunătăți rezultatele căutării în motoarele de căutare tradiționale (de ex., Google), oferind o estimare mai bună a nivelului de relevanță a unui cuvânt-cheie pentru un document.

Mă interesează!

Dacă te interesează această tehnologie, te rugăm să citești mai multe pe Translated Labs și să consulți serviciile noastre de procesare a limbajului natural.

Eu pot face mai bine!

Căutăm în permanență să angajăm ingineri excelenți cu o mentalitate globală.
Contactează-ne dacă crezi că poți îmbunătăți oricare dintre aceste aplicații.

Ia legătura cu noi

Descoperă experimentele noastre

Spoken Language Identifier

Spoken Language Identifier detectează automat limba unui text vorbit. Îl poți utiliza pentru a clasifica înregistrări de la 1 secundă până la 1 minut. În prezent, acceptă 8 limbi.

Află mai multe sau Obține API-ul
Terminology Extractor

Acest instrument extrage automat terminologia unui subiect tehnic dintr-un text scris.Poate ajuta traducătorii să identifice dificultățile unui document și să simplifice procesul de creare a glosarelor.

Află mai multe sau Obține API-ul
Readability analyzer

Informațiile scrise, în special pe internet, trebuie să fie ușor de citit și bine structurate.Această aplicație te ajută să înțelegi dacă un text este ușor de citit sau dacă are nevoie de îmbunătățiri.

Află mai multe sau Obține API-ul
Language Identifier

Language Identifier detectează automat limba unui text scris. De asemenea, poate fi folosit pentru a identifica subiectul unui text scris într-o limbă pe care nu o înțelegi.

Află mai multe
Semantic relationships

Ce au în comun cuvintele avion, pasăre și elicopter?Această aplicație caută relații semantice într-un text, analizând proprietățile statistice ale cuvintelor.

Află mai multe
Translation Party

Ce se întâmplă când traduci o propoziție din limba engleză în limba japoneză și apoi din nou în limba engleză, ca și cum ar fi o buclă infinită? Încearcă și ai să vezi! Și nu uita să împărtășești cele mai amuzante rezultate cu prietenii.

Află mai multe