Εξαγωγή ορολογίας

Πληροφορίες σχετικά με την εξαγωγή ορολογίας

Εισαγωγή

Η ορολογία είναι το άθροισμα των όρων που προσδιορίζουν ένα συγκεκριμένο θέμα. Η εξαγωγή ορολογίας είναι η διαδικασία απομόνωσης όρων σε ένα κείμενο.

Το καταφέρνουμε συγκρίνοντας τη συχνότητα των λέξεων σε ένα έγγραφο με τη συχνότητά που απαντώνται γενικά στη γλώσσα. Οι λέξεις που εμφανίζονται πολύ συχνά στο έγγραφο αλλά σπάνια στη γλώσσα πιθανώς είναι όροι.

Τεχνολογία

Χρησιμοποιεί στατιστικά στοιχεία Poisson, την Εκτίμηση μέγιστης πιθανοφάνειας και την Αντίστροφη συχνότητα εγγράφων μεταξύ της συχνότητας των λέξεων σε ένα έγγραφο και ενός γενικού σώματος κειμένου 100 εκατομμυρίων λέξεων ανά γλώσσα. Χρησιμοποιεί μια πιθανοτική ετικέτα για τα μέρη του λόγου, ώστε να λάβει υπόψη την πιθανότητα ότι μια συγκεκριμένη ακολουθία θα μπορούσε να είναι ένας όρος. Δημιουργεί μια ακολουθία ν λέξεων ελαχιστοποιώντας το φαινόμενο της σχετικής εντροπίας.

Γιατί αναπτύξαμε αυτήν την τεχνολογία;

Η Translated ανέπτυξε αυτή την τεχνολογία για να βοηθήσει τους μεταφραστές της να αναγνωρίζουν τις δυσκολίες ενός εγγράφου, αλλά και για να απλοποιήσουμε τη διαδικασία δημιουργίας γλωσσαρίων.

Το χρησιμοποιούμε επίσης για να βελτιώσουμε τα αποτελέσματα αναζήτησης στις παραδοσιακές μηχανές αναζήτησης (π.χ. Google) παρέχοντας μια καλύτερη εκτίμηση για το πόσο μια λέξη-κλειδί είναι σχετική για ένα έγγραφο.

Το θέλω!

Εάν ενδιαφέρεστε για αυτή την τεχνολογία, διαβάστε περισσότερα για τα Translated Labs και τις υπηρεσίες μας σχετικά με την επεξεργασία της φυσικής γλώσσας.

Βελτιωνόμαστε συνεχώς!

Είμαστε σε διαρκή αναζήτηση ταλαντούχων προγραμματιστών και μηχανικών υπολογιστών στον τομέα της τοπικής προσαρμογής.
Επικοινωνήστε μαζί μας αν έχετε προτάσεις για να βελτιώσουμε αυτές τις εφαρμογές.

Επικοινωνήστε μαζί μας

Εξερευνήστε τα πειράματά μας

Spoken Language Identifier (Εργαλείο αναγνώρισης προφορικού λόγου)

Το Εργαλείο αναγνώρισης προφορικού λόγου αναγνωρίζει αυτόματα τη γλώσσα ενός προφορικού κειμένου. Μπορείτε να το χρησιμοποιήσετε για να ταξινομήσετε ηχογραφήσεις που διαρκούν από 1 δευτερόλεπτο έως 1 λεπτό. Αυτή τη στιγμή υποστηρίζει 8 γλώσσες.

Μάθετε περισσότερα ή πραγματοποιήστε Λήψη του API
Terminology Extractor (Εργαλείο εξαγωγής ορολογίας)

Αυτό το εργαλείο εξάγει αυτόματα την ορολογία ενός τεχνικού θέματος από ένα γραπτό κείμενο. Μπορεί να βοηθήσει τους μεταφραστές να εντοπίσουν τις δυσκολίες ενός εγγράφου, αλλά και να απλοποιήσει τη διαδικασία δημιουργίας γλωσσαρίων.

Μάθετε περισσότερα ή πραγματοποιήστε Λήψη του API
Readability analyzer (Εργαλείο ανάλυσης αναγνωσιμότητας)

Οι γραπτές πληροφορίες, ειδικά στο διαδίκτυο, πρέπει να είναι εύκολες στην ανάγνωση και άρτια δομημένες. Αυτή η εφαρμογή σάς βοηθά να καταλάβετε αν ένα κείμενο είναι εύκολο στην ανάγνωση ή χρειάζεται βελτίωση.

Μάθετε περισσότερα ή πραγματοποιήστε Λήψη του API
​Language Identifier​ (Εργαλείο αναγνώρισης γλώσσας)

Το Εργαλείο αναγνώρισης γλώσσας εντοπίζει αυτόματα τη γλώσσα ενός γραπτού κειμένου. Μπορεί επίσης να χρησιμοποιηθεί για να αναγνωρίσει το θέμα ενός γραπτού κειμένου, το οποίο έχει συνταχθεί σε γλώσσα που δεν γνωρίζετε.

Μάθετε περισσότερα
Σημασιολογικές σχέσεις

Τι κοινό έχουν οι λέξεις «αεροπλάνο», «πουλί» και «ελικόπτερο»; Αυτή η εφαρμογή αναζητά σημασιολογικές σχέσεις σε ένα κείμενο, αναλύοντας τις στατιστικές ιδιότητες των λέξεων.

Μάθετε περισσότερα
Translation Party

Τι συμβαίνει όταν μεταφράζετε μια πρόταση από τα Αγγλικά στα Ιαπωνικά και έπειτα ξανά στα Αγγλικά και ούτω καθεξής επ' άπειρον; Δοκιμάστε το! Και μην ξεχάσετε να κοινοποιήσετε τα πιο αστεία αποτελέσματα στους φίλους σας.

Μάθετε περισσότερα