Terminológiakinyerés

Információk a terminológia kinyeréséről

Bevezetés

A terminológia azon kifejezések összessége, amelyek egy adott témát azonosítanak. A terminológiakinyerés az a folyamat, amelynek során egy szövegből kinyerjük a terminológiát.

A lényeg az, hogy összehasonlítjuk a szavak gyakoriságát egy adott dokumentumban a nyelvben történő előfordulásuk gyakoriságával. Azok szavak, amelyek nagyon gyakran jelennek meg a dokumentumban, de a nyelvben csak ritkán, valószínűleg kifejezések.

Technológia

A Poisson-statisztikákat, maximum likelihood módszert és a dokumentum inverz gyakoriságát használja egy adott dokumentumban szereplő szavak gyakorisága és egy nyelvenként 100 millió szót tartalmazó általános korpusz között. Probabilisztikus címkézést használ, amellyel megállapítja annak valószínűségét, hogy az egymást egy adott sorrendben követő szavak egy kifejezést alkotnak-e. N-gramokat hoz létre a szavakból a relatív entrópia minimalizálásával.

Miért fejlesztettük ki ezt az eszközt?

A Translated azért fejlesztette ki ezt a technológiát, hogy a fordítói tisztában legyenek a dokumentumban fellelhető nehezebb részekkel, és egyszerűsítse a szószedetek létrehozásának folyamatát.

Arra is használjuk, hogy javítsuk a keresési találatokat a hagyományos keresőmotorokban (pl. Google), mivel jobban megbecsülhető, hogy egy kulcsszó mennyire releváns egy dokumentumban.

Szeretném alkalmazni!

Ha érdekli ez a technológia, olvasson részletesebben a Translated Labsről és a természetesnyelv-feldolgozással kapcsolatos szolgáltatásainkról.

Én jobban tudnám csinálni!

Folyamatosan arra törekszünk, hogy kiváló, globális gondolkodásmódú mérnökökkel dolgozzunk együtt.
Vegye fel velünk a kapcsolatot, ha úgy gondolja, hogy tovább tudná fejleszteni bármelyik alkalmazásunkat.

Kapcsolatfelvétel

Ismerje meg kísérleti projektjeinket

Beszélt nyelv azonosítása

A Beszélt nyelv azonosítása automatikusan felismeri az elhangzó szöveg nyelvét. 1 másodperc és 1 perc közötti hosszúságú felvételek besorolására használhatja. Jelenleg 8 nyelvet támogat.

További információ vagy API beszerzése
Terminológiakinyerés

Ez az eszköz automatikusan kinyeri egy szakmai témakör terminológiáját az írott szövegből.Segíthet a fordítóknak azonosítani a dokumentumban fellelhető nehezebb részeket, és egyszerűsítheti a szószedetek létrehozásának folyamatát.

További információ vagy API beszerzése
Olvashatóság elemzése

Az írásbeli információknak – különösen az interneten – könnyen olvashatónak és jól strukturáltnak kell lenniük.Ez az alkalmazás segít megérteni, hogy a szöveg könnyen olvasható-e, vagy javítást igényel.

További információ vagy API beszerzése
Nyelv azonosítása

A Nyelv azonosítása automatikusan felismeri az írott szöveg nyelvét. A használatával megismerheti egy írott szöveg témakörét egy olyan nyelven is, amit nem ért.

További információ
Szemantikus kapcsolatok

Mi a közös a repülőgép, a madár és a helikopter szavakban?Ez az alkalmazás a szöveg szemantikai összefüggéseit keresi a szavak statisztikai tulajdonságainak elemzésével.

További információ
Translation Party

Mi történik, ha egy angol mondatot japánra, majd újra angolra fordít, mintha végtelenül ismétlődne? Próbálja ki! És ne felejtse el megosztani a legviccesebb eredményeket a barátaival.

További információ