Terminologiekstrahering

Informasjon om ekstrahering av terminologi

Introduksjon

Terminologi er summen av termene som identifiserer et spesifikt emne. Ekstrahering av terminologi er en prosess hvor terminologi ekstraheres fra en tekst.

Hensikten er å sammenligne frekvensen av ord i et gitt dokument med frekvensen deres i språket. Ord som opptrer svært ofte i et dokument, men sjeldent i språket, er sannsynligvis termer.

Teknologi

Den benytter seg både av Poisson-statistikker, maksimal sannsynlighetsberegning og omvendt dokumentfrekvens mellom frekvensen av ord i et gitt dokument og en generisk korpus av 100 millioner ord per språk. Den bruker en probabilistisk ordklassetagger for å vurdere sannsynligheten for at en bestemt sekvens kan være en term. Den skaper n-grammer av ord ved å minimere den relative entropien.

Hvorfor har vi utviklet dette?

Translated har utviklet denne teknologien for å hjelpe oversetterne med å være klar over et dokuments vanskeligheter og forenkle prosessen med å lage ordlister.

Vi bruker den også til å forbedre søkeresultater i tradisjonelle søkemotorer (f.eks. Google) ved å gi et bedre estimat av hvor relevant et nøkkelord er for et dokument.

Jeg vil ha dette!

Hvis du er interessert i denne teknologien, kan du lese mer om Translated labs og språkteknologitjenestene våre.

Jeg kan gjøre dette bedre!

Vi er stadig på utkikk etter å ansette dyktige utviklere med et globalt tankesett.
Ta kontakt hvis du tror du kan forbedre noen av disse applikasjonene.

Ta kontakt

Utforsk eksperimentene våre

Talespråkidentifikator

Talespråkidentifikatoren gjenkjenner automatisk språket i en skrevet tekst. Du kan bruke den til å klassifisere opptak på mellom ett sekund til ett minutt. Den støtter foreløpig åtte språk.

Finn ut mer eller få tak i API
Terminologiekstraktor

Dette verktøyet skiller automatisk ut terminologi relatert til et teknisk emne fra skrevet tekst.Det kan hjelpe oversettere med å identifisere utfordringer i dokumentet og forenkle prosessen med å lage ordlister.

Finn ut mer eller få tak i API
Lesbarhetsanalysator

Skriftlig informasjon, særlig på internett, må være lettlest og godt strukturert.Denne applikasjonen hjelper deg med å forstå hvor lettlest en tekst er, eller om den trenger forbedringer.

Finn ut mer eller få tak i API
Språkidentifikator

Språkidentifikatoren oppdager automatisk språket i en skrevet tekst. Verktøyet kan også brukes til å identifisere temaet i en skrevet tekst på et språk du ikke forstår.

Finn ut mer
Semantiske forbindelser

Hva har ordene «fly», «fugl» og «helikopter» til felles?Denne applikasjonen søker etter semantiske forbindelser i en tekst ved å analysere hvert ords statistiske egenskaper.

Finn ut mer
Translation Party

Hva skjer når du oversetter en engelsk setning til japansk, og deretter tilbake til engelsk i en evig sirkel? Prøv, da vel! Og ikke glem å dele de morsomste resultatene med vennene dine.

Finn ut mer