Computers gaan steeds beter menselijke taal begrijpen. IBM brengt nieuwe technologie op de markt die al aardig de nuances bij communicatie kan doorzien.
Gecompliceerde woordschema’s zoals idioom (uitdrukkingen) en combinaties van woorden die samen een nieuwe betekenis krijgen, vormen geen geheimen meer voor de computer. Belangrijke nlp-functies (natural language processing) worden vercommercialiseerd, zo kondigt IBM aan. Elke klant kan het thans gebruiken.
Deze nlp-technologie is oorspronkelijk ontwikkeld voor IBM’s Project Debater. Vorig jaar maakte Big Blue bekend een systeem voor kunstmatige intelligentie (artificial intelligence, ai) te hebben ontwikkeld dat met mensen kan debatteren over complexe onderwerpen. Deze techniek wordt nu toegevoegd aan Watson, het ai-systeem van IBM. Om goed een debat te kunnen voeren moest Project Debater heel goed kunnen luisteren naar de opponent. Argumenten van de tegenstanders moesten precies worden begrepen om snedig te kunnen reageren. Hiertoe is de sentiment-analyse verbeterd. Watson is nu ook in staat onderscheid te maken tussen letterlijke en figuurlijke uitdrukkingen. Althans in het Engels.
Samenvatten en clusteren
Het ai-systeem kan ook beter samenvatten. Watson haalt tekstgegevens uit verschillende bronnen om gebruikers een samenvatting te geven van wat er over een bepaald onderwerp wordt gezegd en geschreven. Een vroege versie van Summarization werd dit jaar bij de uitreiking van de Grammy Awards gebruikt, een van de belangrijkste muziekprijzen. De software analyseerde meer dan achttien miljoen artikelen, blogs en bios om hapklare inzichten te produceren over honderden artiesten en beroemdheden. De gegevens werden vervolgens verwerkt in de ‘livestream’ van de rode loper, on-demand video’s en foto’s om fans meer informatie en context te geven.
Ook is vooruitgang geboekt met nieuwe clusteringstechnieken. Deze stellen gebruikers in staat om inkomende data te classificeren op onderwerp. Die data kunnen vervolgens worden geanalyseerd. Domeinspecialisten kunnen hierdoor snel data aanpassen en afstemmen op het jargon van bepaalde bedrijven of industrietakken.
IBM heeft al vele jaren in natuurlijke taalverwerking geïnvesteerd. Vooral dankzij ai nemen de prestaties snel toe. Ook Microsoft, Google, Amazon en het Chinese iFlyTek behoren tot de koplopers.