Introduktion
Identifikatoren af det talte sprog er en tjeneste, der prøver at bestemme det sprog, der tales i en lydoptagelse.
Modellen understøtter i øjeblikket 8 sprog: engelsk, spansk, italiensk, fransk, tysk, portugisisk, hollandsk og russisk.
Understøttede lydformater: WAV, FLAC, OGG.
Teknologi
Systemet bruger indviklede og tilbagevendende neurale netværk, der er udført på baggrund af mange timers taledata. Dette er en end-to-end-model, der bruger rå lydbølger som input og ikke foretager egne vurderinger om fonetikken eller grammatikken for de aktuelle sprog. Systemet forsøger i stedet at udlede alle relevante funktioner i lyden fra dataene. Som resultat producerer det sandsynlighedsfordelingen over de sprog, der genkendes af modellen.
Du kan bruge den til at klassificere optagelser på helt ned til 1 sekund og op til et minut. Bemærk, at jo længere optagelsen er, desto højere bliver nøjagtigheden af klassifikationen. For optagelser på 20 sekunder er nøjagtigheden ca. 95 %, mens den for optagelser på 5 sekunder er lidt over 80 %
Det vil jeg gerne have
Hvis du er interesseret i denne teknologi, kan du se nærmere på vores API, der er tilgængelig på
Rapidapi