De spraaktoepassingen van Google voor Google Home en de Google Assistent app liggen onder vuur nadat duizend geluidsfragmenten op straat liggen. Van ruzies tot slaapkamergesprekken. Vijf vaststellingen over de Google-hetze. ‘De transparantie kan beter.’
Eerst even de feiten: medewerkers van Google luisteren naar opnames die gemaakt zijn met de slimme Google Home-luidsprekers en via de Google Assistent-app op smartphones. Wereldwijd, en dus ook in België en Nederland. Dat bleek na onderzoek van VRT NWS, dat een duizendtal fragmenten in handen kreeg en kon beluisteren. En nadien sommige mensen achter de gesprekken ook kon opsporen.
Google Home is in ons land nog niet echt ingeburgerd, maar de stembediening wel steeds meer. Hun systeem werkt ook op de smartphone via de Google Assistent-app, en is dus vergelijkbaar met Siri van Apple of Alexa van Apple.
1. Niks nieuws onder de zon
Dat al die apparaten gesprekken (kunnen) opnemen, is op zich niet nieuw. Denk aan het verhaal van de smart tv van Samsung. Of aan de spraakassistent van Amazon.
Dat die gesprekken ook effectief worden beluisterd, was eigenlijk ook al bekend. Enkele maanden geleden kwam bijvoorbeeld aan de oppervlakte dat Amazon de audiofragmenten op zijn eigen spraakassistent Echo laat herbeluisteren door een team van duizenden medewerkers wereldwijd.
‘Dat Google meeluistert, verbaast me niet. Dat mensen verbaast zijn dat Google mee- en afluistert als ze zo’n ding, of een Alexa of een nieuwe generatie Sonos, in huis halen, verbaast me veel meer’, laat Jan Guldentops van BA zich ontvallen.
2. Gebruikersvoorwaarden onduidelijk
Privacy-experts en -juristen nemen de gebruikersvoorwaarden rond toepassingen als Google Home alvast stevig op de korrel. ‘Nergens communiceert Google dat men – al dan niet via tussenbedrijven – kennis neemt van de audio-opnames en die laat analyseren door fysieke tussenpersonen. Dat op zich is een ongelooflijk grote schending van de GDPR-privacywetgeving’, zo schrijft Matthias Dobbelaere-Welvaert, privacy-expert en -activist naar aanleiding van het voorval.
David Stevens van de Gegevensbeschermingsautoriteit (GBA) hield zich deze ochtend in een reactie op Radio 1 op de vlakte en wilde zich niet uitspreken of Google ook effectief in de fout gaat. Mogelijk zet de GBA een onderzoek in. ‘Er zijn een aantal principes waar wij vragen bij stellen. Hoe lang worden de gegevens bijgehouden? Voor welke andere doeleinden worden die mogelijks nog gebruikt?’, klonk het.
Wat tot dusver wat onderbelicht bleef, is dat Google ook bij Google Home de optie aanbiedt om de gebruikersgegevens en crashrapporten niet naar Google te verzenden. ‘Die vraag wordt gesteld in elke installatie van een Google Home-device’, merkt ethische hacker Inti De Ceukelaire op op Twitter. ‘De transparantie kan altijd beter, maar je hebt dus wel de optie’, nuanceert hij.
3. Spraaktechnologie nog niet op punt: 15 procent foutenmarge
Het lijkt wel een eindeloos verhaal bij spraaktechnologie, al van toen Lernout & Hauspie er zich mee bezig hielden: de technologie helemaal op punt stellen, blijft nog altijd een uitdaging. Bij Google zit er dan nog een stevige laag kunstmatige intelligentie (ai) boven.
Van de ruim duizend opgenomen fragmenten die ze bij VRT NWS te horen kregen, waren er 153 die onbewust werden opgenomen, zonder dat de gebruiker de opdracht had gegeven aan de Google Assistent. Dat is een foutenmarge van 15 procent.
Normaal wordt Google Home pas geactiveerd als iemand ‘Ok Google’ zegt. Maar als iemand in de buurt iets zegt dat daar op zou lijken, begint het systeem vaak ook al op te nemen. Op die manier worden dus onbewust conversaties opgenomen, en dus ook vertrouwelijke gesprekken in de keuken of slaapkamer. Of hoe de technologie nog (te) vaak hapert.
4. Verdere analyse lijkt onvermijdelijk
Om het systeem verder de finetunen, en fouten eruit te halen (zeker voor een ‘kleinere’ taal als het Nederlands), blijkt verdere analyse noodzakelijk. Volgens Google zou het ook gaan om een ‘kleine set audiofragmenten’, al bleek – ook op basis van de VRT-opsporingen – het wel wat langer dan dat te zijn.
Volgens Google gaat het ook om amper 0,2 procent van alle fragmenten die door een mens worden beluisterd. Al luisteren de medewerkers niet rechtstreeks mee, maar achteraf.
In België en Nederland zou het om enkele tientallen medewerkers gaan, vaak taalexperts, die worden ingeschakeld. De Google-medewerkers beluisteren fragmenten om de zelflerende algoritmen achter de Assistant slimmer te maken, en bijvoorbeeld ook om te kunnen gaan met plaatselijke dialecten. De medewerkers moeten aanvullen of rechtzetten waar de technologie nog steken laat vallen. Dat lijkt nodig. Zo start ook de Google Assistant-app op als het niet nodig is en dat de technologie nog al te vaak niet wat gevraagd wordt.
5. Vooral menselijk falen
Tot slot nog dit: de wereld hadden die opgenomen Google-gesprekken niet kunnen horen als één menselijke (externe) medewerker die – compleet tegen zijn vertrouwensovereenkomst in – niet had gelekt en doorgespeeld naar VRT Nieuwsdienst. Zoals vaak in security is de mens de zwakste schakel in het systeem.
De vraag blijft wel hoeveel (al dan niet externe) medewerkers toegang hebben tot die vertrouwelijke data en hoe die zo massaal doorgespeeld konden worden. ‘De manier waarop er met die data wordt omgegaan, zal toch moeten herzien worden’, oppert De Ceukelaire.
Of om het met een understatement te stellen: hoe nieuwe technologie nogal eens met groeipijnen heeft af te rekenen.