Termistön purkaminen

Tietoja termistön purkamisesta

Johdanto

Termistö on tiettyyn aiheeseen liittyvien termien joukko. Termistön purkaminen on prosessi, jolla termistö puretaan tekstistä.

Ajatuksena on verrata tietyn asiakirjan sanojen esiintymistiheyttä niiden esiintymistiheyteen kielessä. Sanat, jotka esiintyvät hyvin usein asiakirjassa mutta harvoin kielessä, ovat todennäköisesti termejä.

Teknologia

Se käyttää Poisson-tilastoja, suurimman todennäköisyyden arviointia ja käänteistä dokumenttifrekvenssiä tietyn asiakirjan sanojen esiintymistiheyden ja kielikohtaisen sadan miljoonan sanan yleisen korpuksen välillä. Se käyttää sanaluokkajäsennintä ottaakseen huomioon todennäköisyyden, että tietty peräkkäisten sanojen jakso voisi olla termi. Se luo sanojen n-grammeja minimoimalla suhteellisen entropian.

Miksi olemme kehittäneet tämän?

Translated on kehittänyt tämän teknologian auttamaan kääntäjiä tunnistamaan asiakirjan vaikeudet ja yksinkertaistamaan sanastojen luomisprosessia.

Käytämme sitä myös parantamaan hakutuloksia perinteisissä hakukoneissa (esim. Googlessa) antamalla paremman arvion siitä, kuinka merkityksellinen avainsana on asiakirjan kannalta.

Haluan sen!

Jos olet kiinnostunut tästä teknologiasta, lue lisää Translated Labsista ja luonnollisen kielen käsittelyyn liittyvistä palveluistamme.

Osaan tehdä paremmin!

Pyrimme jatkuvasti palkkaamaan hyviä insinöörejä, joilla on kyky ajatella globaalisti.
Ota yhteyttä, jos uskot voivasi parantaa jotakin näistä sovelluksista.

Ota yhteyttä

Tutustu kokeisiimme

Puhutun kielen tunnistin

Puhutun kielen tunnistin tunnistaa puhutun tekstin kielen automaattisesti. Voit käyttää sitä luokittelemaan äänitteet, joiden pituus on yhdestä sekunnista yhteen minuuttiin. Se tukee tällä hetkellä kahdeksaa kieltä.

Lisätietoja tai Hanki sovellusliittymä
Termistön purkaja

Tämä työkalu purkaa automaattisesti teknisen aiheen termistön kirjoitetusta tekstistä. Se voi auttaa kääntäjiä tunnistamaan asiakirjan vaikeudet ja yksinkertaistamaan sanastojen luomista.

Lisätietoja tai Hanki sovellusliittymä
Luettavuusanalysaattori

Kirjallisen tiedon on etenkin internetissä oltava helppolukuista ja hyvin jäsenneltyä. Tämä sovellus auttaa sinua ymmärtämään, onko teksti helposti luettavissa vai tarvitseeko sitä parantaa.

Lisätietoja tai Hanki sovellusliittymä
Kielentunnistin

Kielentunnistin tunnistaa kirjoitetun tekstin kielen automaattisesti. Sitä voidaan käyttää myös tunnistamaan sinulle vieraalla kielellä kirjoitetun tekstin aihe.

Lisätietoja
Semanttiset suhteet

Mitä yhteistä on sanoilla lentokone, lintu ja helikopteri? Tämä sovellus etsii semanttisia suhteita tekstistä analysoimalla sanojen tilastollisia ominaisuuksia.

Lisätietoja
Käännösosapuoli

Mitä tapahtuu käännettäessä englanninkielinen lause japaniksi ja sitten taas englanniksi, ikään kuin loputtomassa silmukassa? Kokeile! Äläkä unohda jakaa hauskimpia tuloksia ystävillesi.

Lisätietoja