Johdanto
Puhutun kielen tunnistin on palvelu, joka yrittää määrittää äänitteessä puhutun kielen.
Malli tukee tällä hetkellä kahdeksaa kieltä: englantia, espanjaa, italiaa, ranskaa, saksaa, portugalia, hollantia ja venäjää.
Tuetut ääniformaatit: WAV, FLAC, OGG.
Teknologia
Malli käyttää konvolutionaalisia ja toistuvia neuroverkkoja, jotka on koulutettu kymmenien tuntien puhetiedoilla. Tämä on päästä päähän -malli, joka käyttää raakaa aaltomuotoa syötteenä eikä tee oletuksia kyseessä olevien kielten fonetiikasta tai kieliopista. Malli yrittää pikemminkin päätellä äänen kaikki merkitykselliset piirteet tiedoista. Malli tuottaa todennäköisyysjakauman kielillä, jotka se tunnistaa tuotoksena.
Mallia voidaan käyttää vain sekunnin pituisten ja jopa minuutin mittaisten äänitteiden luokitteluun. Huomaa, että mitä pidempi äänite, sitä tarkempi ennuste. Kahdenkymmenen sekunnin äänitteissä tarkkuus on noin 95 %, kun taas viiden sekunnin näytteissä se on hiukan yli 80 %
Haluan sen
Jos tämä teknologia kiinnostaa sinua, tutustu sovellusliittymään, joka on saatavana
Rapidapissa