Estrazione terminologica

Informazioni sull'estrazione terminologica

Introduzione

La terminologia è la somma dei termini che identificano un argomento specifico. L'estrazione terminologica è il processo di estrazione della terminologia da un testo.

L'idea è di confrontare la frequenza delle parole in un determinato documento con la loro frequenza nella lingua. Le parole che appaiono molto frequentemente nel documento ma raramente nella lingua sono probabilmente termini.

Tecnologia

Utilizza le statistiche di Poisson, la Stima della massima verosimiglianza e la Frequenza inversa dei documenti tra la frequenza delle parole in un determinato documento e un corpus generico di 100 milioni di parole per lingua. Utilizza un taggatore di parte del discorso probabilistico per tenere conto della probabilità che una particolare sequenza possa essere un termine. Crea n-grammi di parole minimizzando la entropia relativa.

Perché l'abbiamo sviluppato?

Translated ha sviluppato questa tecnologia per aiutare i suoi traduttori a essere consapevoli delle difficoltà di un documento e a semplificare il processo di creazione di glossari.

Lo usiamo anche per migliorare i risultati di ricerca nei motori di ricerca tradizionali (ad es. Google) fornendo una stima migliore di quanto una parola chiave sia rilevante per un documento.

Lo voglio!

Se questa tecnologia ti interessa, ti invitiamo a leggere di più sui Translated Labs e sui nostri servizi per il trattamento automatico della lingua.

Posso fare di meglio!

Cerchiamo costantemente ingegneri di talento con una mentalità globale.
Se pensi di poter migliorare una di queste applicazioni, contattaci.

Contattaci

Esplora i nostri esperimenti

Identificatore di lingua parlata

L'identificatore di lingua parlata rileva automaticamente la lingua di un testo parlato. Puoi usarlo per classificare registrazioni da 1 secondo a 1 minuto. Al momento supporta 8 lingue.

Scopri di più o Ottieni API
Estrattore di terminologia

Questo strumento estrae automaticamente la terminologia di un argomento tecnico da un testo scritto.Può aiutare i traduttori a identificare le difficoltà presenti in un documento e semplificare il processo di creazione dei glossari.

Scopri di più o Ottieni API
Analisi di leggibilità

Le informazioni scritte, soprattutto su Internet, devono essere di facile lettura e ben strutturate.Questa applicazione ti aiuta a capire se un testo è facilmente leggibile o se ha bisogno di miglioramenti.

Scopri di più o Ottieni API
Identificatore di lingua

L'identificatore di lingua rileva automaticamente la lingua di un testo scritto. Può anche essere usato per identificare l'argomento di un testo scritto in una lingua che non comprendi.

Per saperne di più
Relazioni semantiche

Che cosa hanno in comune le parole aeroplano, uccello ed elicottero? Questa applicazione cerca le relazioni semantiche presenti tra le parole di un testo, analizzando le proprietà statistiche delle parole.

Per saperne di più
Translation Party

Cosa succede quando traduci una frase inglese in giapponese, e poi di nuovo in inglese, come se fosse un loop infinito? Provaci! E non dimenticare di condividere i risultati più divertenti con i tuoi amici.

Per saperne di più