Microsoft heeft mijlpaal bereikt in tekst-naar-spraak synthese
Microsoft zegt een mijlpaal te hebben bereikt in tekst-naar-spraak synthese met een productiesysteem dat diepe neurale netwerken gebruikt om de stemmen van computers bijna niet te onderscheiden van opnames van mensen.
Met de mensachtige natuurlijke prosodie en duidelijke woordenvertaling heeft Neural TTS de luistervermoeidheid aanzienlijk verminderd wanneer een gebruiker communiceert met AI-systemen. Dit meldt Xuedong Huang,angL Technical Fellow, Cloud en AI bij Microsoft.
Huang: "Ons team demonstreerde deze week onze door neuraal netwerk aangedreven tekst-naar-spraak-mogelijkheden op de Microsoft Ignite- conferentie in Orlando, Florida. De mogelijkheid is momenteel beschikbaar in preview via Azure Cognitive Services Speech Services. Neurale tekst-naar-spraak kan worden gebruikt om interacties met chatbots en virtuele assistenten natuurlijker en boeiender te maken, digitale teksten zoals e-books om te zetten in audioboeken en navigatiesystemen in auto's te verbeteren."
De mijlpaal in tekst-naar-spraak sluit aan bij een reeks doorbraken die onze groep in de afgelopen twee jaar heeft bereikt, inclusief menselijke pariteit in spraakherkenning en menselijke pariteit bij machinevertalingen, aldus Huang.