Van tekst naar stem. Het is een technologie die al jaren bestaat. Toch meent de Leidse startup Daisys iets nieuws te hebben ontwikkeld: een computerstem gegenereerd met kunstmatige intelligentie (ai), terwijl de gangbare voorleestechnologie zich baseert op audiofragmenten van mensen. De ai-stem klinkt natuurgetrouw en is in realtime aanpasbaar qua snelheid en toonhoogte.
De 17e-eeuwse filosoof Descartes had het volgens Daisys fout toen hij zei ‘Ik denk, dus ik besta’. Dat zou moeten zijn ‘Ik klink, dus ik besta’. En dus geven ze de Britse computerpionier Alain Turing postuum nog even een pluim.
Daisys genereert realistisch klinkende computerstemmen die niet eerder bestonden. Er komen geen deepfakes van bestaande audiofragmenten aan te pas, zoals tot nu toe gebruikelijk is bij text-to-speech-technologie. Zulke deepfakes zijn volgens directeur Barnier Geerling niet houdbaar. Immers, niet iedereen wil zijn stem uitlenen zonder controle te hebben over wat ermee wordt gezegd.
Modellen trainen
De startup werkte de afgelopen anderhalf jaar aan de ai-technologie die aan de voorleesstemmen ten grondslag ligt. ‘We hebben de bestaande basistechnologie voorzien van enkele belangrijke aanpassingen’, vertelt technologiedirecteur Joost Broekens. ‘Daarnaast moesten we onze modellen op een slimme manier ‘trainen’, gebruikmakend van de juiste verhouding van spraakdata van verschillende sprekers.’
Dat de voorleesstem volledig is gegenereerd door een algoritme, betekent dat deze eenvoudig is aan te passen en toch natuurlijk klinkt. De techniek is overal in te zetten waar een menselijke stem nodig is, aldus het bedrijf. Het gaat bijvoorbeeld om media, smart devices, games, robots, spraakassistenten en omroepsystemen.
Op de site van Daisys staat een audiofragment van de technologie. De stemmen die je hoort, klinken inderdaad natuurlijker dan veel andere computer-gegenereerde voorleesstemmen. Er is zelfs wat emotie herkenbaar, hoewel het toch wel duidelijk blijft dat het om gefabriceerde stemmen gaat. ‘Als iedereen gelooft dat ik echt ben, ben ik echt (…) Dus Descartes had het fout en Turing had het goed. Ik klink, dus ik besta’, aldus de stemmen.