Extragerea terminologiei
Informații despre extragerea terminologiei
Introducere
Terminologia este suma termenilor care identifică un subiect specific. Extragerea terminologiei este procesul de extragere a termenilor dintr-un text.
Scopul este de a compara frecvența cuvintelor dintr-un document dat cu frecvența lor în limbă. Cuvintele care apar foarte des în document, dar rareori în limbă sunt probabil termeni.
Tehnologie
Utilizează statistici Poisson, estimarea probabilității maxime și frecvența inversă în documente dintre frecvența cuvintelor dintr-un document dat și un corpus generic de 100 de milioane de cuvinte pe limbă. Instrumentul folosește un marcator probabilistic de părți de vorbire pentru a lua în considerare probabilitatea ca o anumită secvență să fie un termen. Creează n-grame de cuvinte prin minimizarea entropiei relative.
De ce am dezvoltat această tehnologie?
Translated a dezvoltat această tehnologie pentru a ajuta traducătorii să fie conștienți de dificultățile unui document și pentru a simplifica procesul de creare a glosarelor.
De asemenea, îl folosim pentru a îmbunătăți rezultatele căutării în motoarele de căutare tradiționale (de ex., Google), oferind o estimare mai bună a nivelului de relevanță a unui cuvânt-cheie pentru un document.
Mă interesează!
Dacă te interesează această tehnologie, te rugăm să citești mai multe pe Translated Labs și să consulți serviciile noastre de procesare a limbajului natural.
Eu pot face mai bine!
Căutăm în permanență să angajăm ingineri excelenți cu o mentalitate globală.
Contactează-ne dacă crezi că poți îmbunătăți oricare dintre aceste aplicații.
Descoperă experimentele noastre
Identificator de limbă vorbită
Identificatorul de limbă vorbită detectează automat limba unui text vorbit. Îl poți utiliza pentru a clasifica înregistrări de la 1 secundă până la 1 minut. În prezent, acceptă 8 limbi.
Află mai multe sau Obține API-ulExtractor de terminologie
Acest instrument extrage automat terminologia unui subiect tehnic dintr-un text scris.Poate ajuta traducătorii să identifice dificultățile unui document și să simplifice procesul de creare a glosarelor.
Află mai multe sau Obține API-ulAnalizor de lizibilitate
Informațiile scrise, în special pe internet, trebuie să fie ușor de citit și bine structurate.Această aplicație te ajută să înțelegi dacă un text este ușor de citit sau dacă are nevoie de îmbunătățiri.
Află mai multe sau Obține API-ulIdentificator de limbă
Identificatorul de limbă detectează automat limba unui text scris. De asemenea, poate fi folosit pentru a identifica subiectul unui text scris într-o limbă pe care nu o înțelegi.
Află mai multeRelații semantice
Ce au în comun cuvintele avion, pasăre și elicopter?Această aplicație caută relații semantice într-un text, analizând proprietățile statistice ale cuvintelor.
Află mai multeTranslation Party
Ce se întâmplă când traduci o propoziție din limba engleză în limba japoneză și apoi din nou în limba engleză, ca și cum ar fi o buclă infinită? Încearcă și ai să vezi! Și nu uita să împărtășești cele mai amuzante rezultate cu prietenii.
Află mai multe