Terminologiekstrahering
Informasjon om ekstrahering av terminologi
Introduksjon
Terminologi er summen av termene som identifiserer et spesifikt emne. Ekstrahering av terminologi er en prosess hvor terminologi ekstraheres fra en tekst.
Hensikten er å sammenligne frekvensen av ord i et gitt dokument med frekvensen deres i språket. Ord som opptrer svært ofte i et dokument, men sjeldent i språket, er sannsynligvis termer.
Teknologi
Den benytter seg både av Poisson-statistikker, maksimal sannsynlighetsberegning og omvendt dokumentfrekvens mellom frekvensen av ord i et gitt dokument og en generisk korpus av 100 millioner ord per språk. Den bruker en probabilistisk ordklassetagger for å vurdere sannsynligheten for at en bestemt sekvens kan være en term. Den skaper n-grammer av ord ved å minimere den relative entropien.
Hvorfor har vi utviklet dette?
Translated har utviklet denne teknologien for å hjelpe oversetterne med å være klar over et dokuments vanskeligheter og forenkle prosessen med å lage ordlister.
Vi bruker den også til å forbedre søkeresultater i tradisjonelle søkemotorer (f.eks. Google) ved å gi et bedre estimat av hvor relevant et nøkkelord er for et dokument.
Jeg vil ha dette!
Hvis du er interessert i denne teknologien, kan du lese mer om Translated labs og språkteknologitjenestene våre.
Jeg kan gjøre dette bedre!
Vi er stadig på utkikk etter å ansette dyktige utviklere med et globalt tankesett.
Ta kontakt hvis du tror du kan forbedre noen av disse applikasjonene.
Utforsk eksperimentene våre
Talespråkidentifikator
Talespråkidentifikatoren gjenkjenner automatisk språket i en skrevet tekst. Du kan bruke den til å klassifisere opptak på mellom ett sekund og ett minutt. Den støtter foreløpig åtte språk.
Finn ut mer eller få tak i APITerminologiekstraktor
Dette verktøyet skiller automatisk ut terminologi relatert til et teknisk emne fra skrevet tekst.Det kan hjelpe oversettere med å identifisere utfordringer i dokumentet og forenkle prosessen med å lage ordlister.
Finn ut mer eller få tak i APILesbarhetsanalysator
Skriftlig informasjon, særlig på internett, må være lettlest og godt strukturert.Denne applikasjonen hjelper deg med å forstå hvor lettlest en tekst er, eller om den trenger forbedringer.
Finn ut mer eller få tak i APISpråkidentifikator
Språkidentifikatoren oppdager automatisk språket i en skrevet tekst. Verktøyet kan også brukes til å identifisere temaet i en skrevet tekst på et språk du ikke forstår.
Finn ut merSemantiske forhold
Hva har ordene «fly», «fugl» og «helikopter» til felles?Denne applikasjonen søker etter semantiske forhold i en tekst ved å analysere hvert ords statistiske egenskaper.
Finn ut merTranslation Party
Hva skjer når du oversetter en engelsk setning til japansk, og deretter tilbake til engelsk i en evig sirkel? Prøv, da vel! Og ikke glem å dele de morsomste resultatene med vennene dine.
Finn ut mer