Al die diensten die de menselijke stem moeten (leren) begrijpen, allemaal hebben ze data nodig. Bakken data, bergen data. Data warehouses vol data. En natuurlijk iets dat ze helpt met het begrijpen van die data. Onzinnige angst voor meeluisteren?
Onlangs kwam Siri van Apple in het nieuws voor meeluisteren, daarvoor was het Google, toen was het Amazon en afgelopen week ook weer Microsoft ontdekte Vice. Het online tijdschrift wist de hand te leggen op interne documenten, screenshots en audio-opnamen van Skype audio- of telefoongesprekken waarbij de automatische vertaaldienst ingeschakeld was. Of die opnames ook door het menselijk oor beluisterd werden, wordt niet duidelijk.
Bij Cortana lijkt het er wel op dat ook mensen luisterden naar de stemcommando’s die de dienst te verwerken krijgt. Vice’s Motherboard-onderdeel zegt inzicht te hebben gekregen in deze opnames en transcripties. Dit soort mededelingen zorgden er bij andere online grootgrutters voor dat ze hun diensten niet meer (zeggen) te transcriberen via de mens.
Het feit dat de – anonieme – medewerker van een contractor dit soort data überhaupt kon delen met Motherboard laat zien dat het met de veiligheid niet heel snor zit – of inmiddels zat. Ondanks alles kan iedereen hoog en laag springen, als je de kleine lettertjes leest staat er gewoon in de EULA’s dat Microsoft de stemdata gebruikt voor verbetering van de diensten Skype en Cortana.
We kunnen allemaal heel moeilijk blijven doen over dit soort dingen, maar misschien moeten de kleine lettertjes gewoon wat groter her en der staan en moet je makkelijker dit soort onderdelen aan en uit kunnen zetten. Maar goed, wat vindt u daar nou van?