Extracción de terminología

Información sobre la extracción de terminología

Introducción

La terminología es el conjunto de los términos propios de un tema específico. La extracción de terminología es el proceso de extraer los términos clave de un texto.

La idea es comparar la frecuencia con la que aparecen las palabras en un documento específico con su frecuencia en la lengua común. Las palabras que aparecen frecuentemente en el documento, pero rara vez en la lengua común, son probablemente términos.

Tecnología

Utiliza estadísticas de Poisson, la Estimación por máxima verosimilitud y la Frecuencia de documento inversa entre la frecuencia de palabras en un documento dado y un corpus genérico de 100 millones de palabras por idioma. Utiliza un etiquetador probabilístico de parte del discurso para tener en cuenta la probabilidad de que una secuencia en concreto pueda ser un término. Crea n-gramas de palabras al minimizar la entropía relativa.

¿Por qué hemos desarrollado esta herramienta?

Translated ha desarrollado esta tecnología para ayudar a sus traductores a ser conscientes de las dificultades de un documento y simplificar el proceso de creación de glosarios.

También lo utilizamos para mejorar los resultados de búsqueda en los motores de búsqueda tradicionales (especialmente Google), al ofrecer una mejor estimación de la relevancia de una palabra clave en un documento.

¡Me encanta!

Si te interesa esta herramienta, consulta más información sobre Translated Labs y nuestros servicios de procesamiento del lenguaje natural.

¡Puedo hacerlo mejor!

Siempre estamos dispuestos a contratar a grandes ingenieros con una mentalidad global.
Ponte en contacto con nosotros si crees que puedes mejorar alguna de estas aplicaciones.

Contáctanos

Explora nuestros experimentos

Spoken Language Identifier

Spoken Language Identifier detecta automáticamente el idioma de un texto oral. Puedes utilizarlo para clasificar grabaciones de 1 segundo a 1 minuto. Actualmente está disponible para 8 idiomas.

Lee más información o consigue la API
Terminology Extractor

Esta herramienta extrae automáticamente la terminología de un tema técnico de un texto escrito.Puede ayudar a los traductores a identificar las dificultades de un documento y simplificar el proceso de creación de glosarios.

Lee más información o consigue la API
Analizador de fluidez

La información escrita, especialmente en internet, debe ser fácil de leer y estar bien estructurada. Esta aplicación te ayuda a entender si un texto se puede leer fácilmente o si se tiene que mejorar.

Lee más información o consigue la API
Language Identifier

Language Identifier detecta automáticamente el idioma de un texto escrito. También se puede utilizar para identificar el tema de un texto escrito en un idioma que no entiendas.

Más información
Relaciones semánticas

¿Qué tienen en común las palabras avión, pájaro y helicóptero?Esta aplicación busca relaciones semánticas en un texto analizando las propiedades estadísticas de las palabras.

Más información
Translation Party

¿Qué sucede cuando traduces una frase del inglés al japonés y luego de nuevo al inglés, como si fuera un bucle infinito? Pruébalo. ¡A ver qué sale! Y no olvides compartir los resultados más divertidos con tus amigos.

Más información