Extracción de terminología
Información sobre la extracción de terminología
Introducción
La terminología es el conjunto de los términos propios de un tema específico. La extracción de terminología es el proceso de extraer los términos clave de un texto.
La idea es comparar la frecuencia con la que aparecen las palabras en un documento específico con su frecuencia en la lengua común. Las palabras que aparecen frecuentemente en el documento, pero rara vez en la lengua común, son probablemente términos.
Tecnología
Utiliza estadísticas de Poisson, la Estimación por máxima verosimilitud y la Frecuencia de documento inversa entre la frecuencia de palabras en un documento dado y un corpus genérico de 100 millones de palabras por idioma. Utiliza un etiquetador probabilístico de parte del discurso para tener en cuenta la probabilidad de que una secuencia en concreto pueda ser un término. Crea n-gramas de palabras al minimizar la entropía relativa.
¿Por qué hemos desarrollado esta herramienta?
Translated ha desarrollado esta tecnología para ayudar a sus traductores a ser conscientes de las dificultades de un documento y simplificar el proceso de creación de glosarios.
También lo utilizamos para mejorar los resultados de búsqueda en los motores de búsqueda tradicionales (especialmente Google), al ofrecer una mejor estimación de la relevancia de una palabra clave en un documento.
¡Me encanta!
Si te interesa esta herramienta, consulta más información sobre Translated Labs y nuestros servicios de procesamiento del lenguaje natural.
¡Puedo hacerlo mejor!
Siempre estamos dispuestos a contratar a grandes ingenieros con una mentalidad global.
Ponte en contacto con nosotros si crees que puedes mejorar alguna de estas aplicaciones.
Explora nuestros experimentos
Identificador de idioma hablado
El identificador de idioma hablado detecta automáticamente el idioma de un texto oral. Puedes utilizarlo para clasificar grabaciones de 1 segundo a 1 minuto. Actualmente está disponible para 8 idiomas.
Lee más información o consigue la APIExtractor de terminología
Esta herramienta extrae automáticamente la terminología de un tema técnico de un texto escrito.Puede ayudar a los traductores a identificar las dificultades de un documento y simplificar el proceso de creación de glosarios.
Lee más información o consigue la APIAnalizador de fluidez
La información escrita, especialmente en internet, debe ser fácil de leer y estar bien estructurada. Esta aplicación te ayuda a entender si un texto se puede leer fácilmente o si se tiene que mejorar.
Lee más información o consigue la APIIdentificador de idiomas
El identificador de idiomas detecta automáticamente el idioma de un texto escrito. También se puede utilizar para identificar el tema de un texto escrito en un idioma que no entiendas.
Más informaciónRelaciones semánticas
¿Qué tienen en común las palabras avión, pájaro y helicóptero?Esta aplicación busca relaciones semánticas en un texto analizando las propiedades estadísticas de las palabras.
Más informaciónTranslation Party
¿Qué sucede cuando traduces una frase del inglés al japonés y luego de nuevo al inglés, como si fuera un bucle infinito? Pruébalo. ¡A ver qué sale! Y no olvides compartir los resultados más divertidos con tus amigos.
Más información