De cloud is perfect voor het democratiseren van nieuwe oplossingen en technologieën, zoals ai-platformen, analytische oplossingen en quantum-computing. Generatieve ai is bijvoorbeeld voor iedereen beschikbaar via ChatGPT en Dall-E. Juist die toegankelijkheid maakt dat dergelijke nieuwe ai-tools veel media-aandacht krijgen.
Maar hoe zit het met realtime-ai, waarmee je bijvoorbeeld fraude bij banktransactie kunt detecteren? Het detecteren van fraude bij banktransacties is niet zo vanzelfsprekend. Hoewel banken ai gebruiken voor transacties met een laag volume, is dit bij transacties met grote volumes een andere situatie. Veel banken doen realtime-fraudeanalyses op slechts tien tot twintig procent van hun transacties, de rest wordt geanalyseerd nadat de transactie heeft plaatsgevonden. Fraudeurs weten dit als geen ander en nemen daarom alleen geld op onder clip-niveau (contractual liability insurance policy level). Op deze manier worden cybercriminelen niet geanalyseerd en kunnen ze onder de radar opereren. Hierdoor neemt de gemiddelde (tier 2) bank een risico van ongeveer 35 miljoen dollar per jaar.
Waarom proberen banken niet alle transacties te analyseren? Als er sprake is van enorm veel data hoopt deze zich op, wat de nodige uitdagingen met zich meebrengt. Databases worden namelijk zó groot, dat het bijna onmogelijk is om gegevens te verplaatsen. Bovendien moeten er veel data worden uitgewisseld. Hierdoor lopen processen, zoals transacties, vaak vertraging op.
Daarnaast draaien de meeste zware transactionele systemen van een bank, vanwege de veiligheid, op locatie. Wanneer de ai-inferentie in de cloud op deze systemen wordt uitgevoerd, is er sprake van vertraging (latency), omdat de data van de bankapplicatie naar de fraude-scoringsservice getransfereerd moet worden. Daarnaast moet het systeem de data verwerken en de fraudescore teruggeven vanuit de cloud. Wanneer een bank bijvoorbeeld vijf- tot achtduizend transacties per seconde afhandelt, wordt de transfer- en verwerkingstijd, van vijfhonderd milliseconden en meer, een struikelblok om fraudescores uit te voeren op alle transacties voordat ze plaatsvinden.
Deze effecten van zwaartekracht noemen we ook wel transactionele ‘data gravity’. Om dit op te lossen is het belangrijk om data fysiek dicht bij elkaar te houden. Hierdoor is data snel uit te wisseln zonder dat eindgebruikers last ondervinden van vertraagde processen. Om dit te realiseren. doen organisaties er goed aan om te kiezen voor een hybride-cloudbenadering.
Compenseren
Wanneer de fraudescore niet wordt toegepast, wordt de fraude pas gedetecteerd nadat de transactie heeft plaatsgevonden. De fraudeur heeft het geld gekregen en de bank zal de klant compenseren, wanneer de fraude is bewezen. De verzekering zal vervolgens weer de bank vergoeden. Door deze manier van werken worden criminele activiteiten niet voorkomen en tegelijkertijd de kosten van banktransacties verhoogd. Oftewel, de crimineel is de grote winnaar.
Door realtime-scoring toe te passen voor elke transactie, kunnen deze fraudelente transacties drastisch worden verminderd. Maar zelfs bij uitvoering op locatie zou het scoren nog steeds vijftig tot tweehonderd milliseconden duren (gebaseerd op onze interne benchmarks), wat nog steeds te hoog is voor transactievolumes zoals hierboven beschreven. Dit is waar ai-versnellers, zoals de Telum-processor, hun intrede doen. Deze processor kan een inferentiemodel in één tot twee milliseconden uitvoeren tegen zeer hoge transactiesnelheden (lees 100.000 tps).
Conclusie: door intelligent gebruiken te maken van de juiste systemen in combinatie met de hybride cloud worden transacties versneld en kan worden voorkomen dat geldstromen naar kwaadwillende organisaties gaan.