Terminologiudtræk

Information om terminologiudtræk

Introduktion

Terminologi er summen af de udtryk, der identificerer et specifikt emne. Terminologiudtræk er processen, hvor terminologi fra en tekst udtrækkes.

Tanken er at sammenligne hyppigheden af ord i et givet dokument med dets hyppighed på sproget. Ord, der meget ofte i forekommer i dokumentet, men sjældent på sproget, er sandsynligvis udtryk.

Teknologi

Den anvender Poisson-statistikker, den maksimale sandsynlighedsberegning og omvendt dokumentfrekvens mellem frekvensen af ord i et givet dokument og en generisk samling på 100 millioner ord per sprog. Den bruger en sandsynlighedstagger for en del af talen, der tager højde for muligheden af, at en bestemt rækkefølge af ord kan være et udtryk. Den skaber n-diagrammer af ord ved at minimere den relative entropi.

Hvorfor har vi udviklet dette?

Translated har udviklet denne teknologi for at hjælpe sine oversættere med at være opmærksomme på problemer i et dokument, og forenkle processen med at oprette ordlister.

Vi bruger den også til at forbedre søgeresultater i traditionelle søgemaskiner (især Google) ved at give en bedre vurdering af, i hvor høj grad et nøgleord er relevant for dokumentet.

Den vil jeg gerne have!

Hvis du er interesseret i denne teknologi, kan du læse mere om Translated Labs og vores tjenester til naturlig sprogbehandling.

Jeg kan gøre det bedre.

Vi ønsker hele tiden at ansætte dygtige udviklere med et globalt tankesæt.
Kontakt os, hvis du mener, du kan forbedre nogle af disse applikationer.

Tag kontakt til os

Se nærmere på vores eksperimenter

Identifikator af det talte sprog

Identifikatoren af det talte sprog registrerer automatisk sproget i en talt tekst. Du kan bruge den til at kategorisere optagelser fra 1 sekund til 1 minut. Den understøtter i øjeblikket 8 sprog.

Få mere at vide, eller Hent API
Terminologiudtrækker

Dette værktøj trækker automatisk terminologien for et teknisk emne ud af en skreven tekst. Det kan hjælpe oversættere med at identificere problemerne i et dokument og forenkle processen med at oprette ordlister.

Få mere at vide, eller Hent API
Læsbarhedsanalysator

Skriftlige oplysninger, især på internettet, skal være lette at læse og godt struktureret. Denne applikation hjælper dig med at finde ud af, om en tekst er læt at læse, eller om den skal forbedres.

Få mere at vide, eller Hent API
Sprogidentifikator

Sprogidentifikatoren registrerer automatisk sproget i en skreven tekst. Den kan også anvendes til at identificere emnet i en skreven tekst på et sprog, du ikke forstår.

Få mere at vide
Semantiske relationer

Hvad har ordene fly, fugl og helikopter til fælles?Denne applikation søger efter semantiske relationer i en tekst ved at analysere ordenes statistiske egenskaber.

Få mere at vide
Translation Party

Hvad sker der, når du oversætter en engelsk sætning til japansk og derefter tilbage til engelsk i én ubrudt handling? Prøv engang! Og glem ikke at dele de sjoveste resultater med dine venner.

Få mere at vide