Witold Kepinski - 07 oktober 2019

IBM belicht Text-to-Speech innovaties met behulp van LPCNet

Ai Intelligence Telecom Unified communications Artificial intelligence Innovatie

IBM belicht nieuwe Text-to-Speech innovaties met behulp van LPCNet zo meldt het in een blog.

Recente vorderingen op het gebied van diep leren verbeteren de ontwikkeling van Text-to-Speech-systemen (TTS) aanzienlijk door efficiënter en efficiënter leren van stem- en spreekstijlen van sprekers en een meer natuurlijke generatie van hoogwaardige output-spraak, aldus IBM.

Om deze spraak van hoge kwaliteit te produceren, zijn de meeste TTS-systemen echter afhankelijk van grote en complexe neurale netwerkmodellen die moeilijk te trainen zijn en geen real-time spraaksynthese toestaan, zelfs wanneer gebruik wordt gemaakt van GPU's.

Om deze uitdagingen aan te gaan, heeft het IBM Research AI-team een nieuwe methode ontwikkeld voor neurale spraaksynthese op basis van een modulaire architectuur, die drie diepe neurale netwerken (DNN's) combineert met tussentijdse signaalverwerking van de output van de netwerken.

Lees meer details hier.

Tip de redactie

Over Witold Kepinski

Witold Kepinski (1969) is Editor-in-Chief en Director Content en mede-aandeelhouder van Dutch IT Channel en Dutch IT Leaders. Witold Kepinski is 25 jaar actief in de IT Media en Tech Business branche

Witold Kepinski geeft met een gespecialiseerd team van redacteuren, bloggers en videomakers inzicht in tech business trends en toepassingen waarmee IT-beslissers en Channel Partners impact maken.

Auteur pagina

IBM belicht Text-to-Speech innovaties met behulp van LPCNet

Dutch IT events

Meer over ai

Over Witold Kepinski

Wil jij dagelijkse updates?