De slag om de gunst van ai-ontwikkelaars zal de komende maanden in volle hevigheid uitbarsten. Google paait individuele ontwikkelaars door veel meer ai ‘weg te geven’ dan de concurrentie.
Gebruikers van de gratis, op het web gebaseerde ontwikkeltool Google AI Studio krijgen zeer ruime gratis quota. Ze kunnen tot zestig verzoeken per minuut aan het nieuwe krachtige grote taalmodel Gemini doen, de belangrijkste tegenhanger van OpenAI’s GPT. Volgens Google is dat twintig keer meer dan andere gratis aanbiedingen.
Na de lancering een week geleden van het nieuwe ai-taalmodel presenteert Google vandaag de tools waarmee ontwikkelaars kunnen voortborduren op Gemini Pro, de versie die niet in een datacenter hoeft te draaien en toch geschikt is voor een veelheid aan taken. De vlotste manier om met Gemini te bouwen is Google AI Studio. Je kunt daar snel prompts mee ontwikkelen en een api-key krijgen voor gebruik in je eigen app-ontwikkeling.
Daarnaast kunnen ontwikkelaars die in grotere ondernemingen werken, via het beheerde ai-platform Vertex AI toegang krijgen tot Gemini en bouwen in Google Cloud. Ze kunnen ook gemakkelijk overgaan van AI Studio naar Vertex AI waar Gemini kan worden aangepast. De ontwikkelaars blijven daarbij in volledige controle over hun data. Ze kunnen profiteren van de extra mogelijkheden die Google Cloud biedt op gebied van veiligheid, privacy, databeheer en compliance.
Inference performance
Tot begin 2024 kunnen Vertex-ontwikkelaars dezelfde Gemini-modellen gratis uitproberen als collega’s die met Studio werken. Daarna moet per duizend karakters of per beeld worden betaald. Google claimt de beste inference performance per euro.
Gemini onderscheidt zich van andere grote taalmodellen in die zin dat het hele model van grond af aan multimodaal is opgezet. Deze modellen kunnen naadloos verschillende typen informatie combineren, waaronder tekst, code, audio, beeld en video; eigenlijk net als mensen dat kunnen.
Tijdens een live demo die Google gisteren aan geselecteerde media gaf, liet het bedrijf zien hoe een makelaar heel snel een gedetailleerde beschrijving van huur- en koopwoningen kan maken. De makelaar filmt de woning van binnen en buiten waarna het ai-model precies de videobeelden in tekst omzet. Als de beschrijving te zakelijk is en meer in de stijl van de makelaar moet, kan dat in een handomdraai. Met een druk op de knop krijg je de code waarmee de app wordt geprogrammeerd.
Imagen 2 en MedLM
Google presenteert ook een nieuwe versie van zijn tekst-naar-beeld model. Imagen 2 biedt fotorealisme, kan teksten over beelden plaatsen en kan logo’s maken. Verder introduceert Google MedLM, een reeks ‘foundation models’, speciaal voor de gezondheidszorg. Ook werd bekend dat het Franse Mistral AI zijn taalmodellen via Google Cloud gaat distribueren.