Google Cloud breidt toegang tot Gemini-modellen uit voor Vertex AI
Google DeepMind kondigt Gemini 1.5 aan, het nieuwste model dat aanzienlijk verbeterde prestaties levert, met een belangrijke doorbraak in het begrijpen van lange contexten in verschillende modaliteiten. Het model is gebouwd op een innovatieve nieuwe versie van de Mixture-of-Experts (MoE) architectuur en is efficiënter om te trainen en te bedienen. Google lanceert nu Gemini 1.5 Pro, een middelgroot model dat geoptimaliseerd is voor een breed scala aan taken en dat op hetzelfde niveau presteert als 1.0 Ultra, Google’s grootste model tot nu toe. Ook introduceert Google het langste contextvenster van alle grootschalige funderingsmodellen tot nu toe. Vanaf donderdag kunnen developers en zakelijke klanten een testversie van 1.5 Pro met een contextvenster van 1 miljoen tokens verkennen via de Gemini API in Google AI Studio en in privévoorvertoning op Vertex AI. Dit meldt Burak Gokturk VP & GM, Cloud AI bij Google in een blog.
In december 2023 kondigde Google Gemini aan, ons meest capabele en veelzijdige model tot nu toe. Sinds december hebben geselecteerde klanten zoals Samsung en Palo Alto Networks geavanceerde AI-agents ontwikkeld met Gemini-modellen in Vertex AI, om hun gebruikers onder andere nieuwe manieren van productiviteit en gepersonaliseerd leren te bieden. Nu biedt Google een grotere beschikbaarheid van meer Gemini-modellen voor klanten:, zo meldt Burak Gokturk VP & GM, Cloud AI bij Google:
- ● Gemini 1.0 Pro, ons meest geavanceerde model voor het efficiënt uitvoeren van diverse AI-taken, is nu algemeen beschikbaar voor alle klanten van Vertex AI. Vanaf vandaag kan elke developer beginnen met het ontwikkelen met Gemini Pro in productie. 1.0 Pro levert de beste balans tussen kwaliteit, prestaties en kosten voor de meeste AI-taken, zoals content genereren, bewerken, samenvatten en classificeren.
- ● Gemini 1.0 Ultra, het meest geavanceerde en capabele model voor complexe taken, is nu algemeen beschikbaar op Vertex AI voor klanten via allowlist. 1.0 Ultra is ontworpen voor complexe taken, met uitstekende prestaties op gebieden als ingewikkelde instructies, code, redenering en meertaligheid, en is geoptimaliseerd voor kwalitatief hoge output.
Daarnaast zijn we blij met de introductie van een nieuwe generatie Gemini modellen met Gemini 1.5, die verbeterde prestaties leveren op een efficiëntere architectuur.
Het eerste Gemini 1.5 model dat we beschikbaar stellen om te testen is Gemini 1.5 Pro, dat nu in private preview op Vertex AI staat. Het is een middelgroot multimodaal model, geoptimaliseerd voor het opschalen van een breed takenpakket en presteert op een vergelijkbaar niveau als 1.0 Ultra, ons grootste model tot nu toe. 1.5 Pro bevat een nieuwe baanbrekende experimentele functie voor het begrijpen van uitgebreide contexten - het langste contextvenster van alle grootschalige funderingsmodellen tot nu toe. Apps kunnen nu tot 1 miljoen tokens in productie nemen. Dit betekent dat 1.5 Pro enorme hoeveelheden informatie in één keer kan verwerken - waaronder 1 uur video, 11 uur audio, codebestanden met meer dan 30.000 regels code of meer dan 700.000 woorden.
Dankzij grotere contextvensters verwijzen modellen naar meer informatie, begrijpen ze de verhaallijn beter, wordt de onderlinge samenhang van langere teksten behouden en worden er contextrijke antwoorden gegenereert. Met 1.5 Pro kunnen bedrijven bijvoorbeeld:
- ● Een complete codebibliotheek nauwkeurig analyseren in een enkele prompt, zonder het model te hoeven fine-tunen. Inclusief het begrijpen van en redeneren over kleine details die een developer gemakkelijk over het hoofd kan zien, zoals fouten, inefficiënties en inconsistenties in code.
- ● Het doornemen van lange documenten, van het vergelijken van details in contracten tot het samenvatten en analyseren van thema's en meningen in analistenrapporten, onderzoeken of zelfs een serie boeken.
- ● Het analyseren en vergelijken van inhoud over uren aan video, zoals het vinden van specifieke details in sportbeelden of het bijwerken van gedetailleerde informatie uit samenvattingen van videomeetings die nauwkeurige vraag-antwoordondersteuning bieden.
- ● Laat chatbots lange gesprekken voeren zonder details te vergeten, zelfs bij complexe taken of veel vervolg interacties.
- ● Het mogelijk maken van hypergepersonaliseerde ervaringen door relevante gebruikersinformatie in het prompt te verwerken, zonder de complexiteit van het fine-tunen van een model.
Ontwikkel productieklare toepassingen met de Gemini API in Vertex AI
De Gemini API in Vertex AI biedt developers de mogelijkheid om de volgende generatie AI-agents en -apps te ontwikkelen - apps die tegelijkertijd informatie verwerken in verschillende vormen, zoals tekst, code, afbeeldingen en video. Om de kracht van de Gemini-modellen te benutten, moeten organisaties en developers in staat zijn om enterprise-grade applicaties te ontwikkelen en in productie te nemen. Vertex AI is het enige AI-platform in de cloud dat één geïntegreerd platform biedt voor modellen, tooling en infrastructuur. Dit zodat applicaties die met Gemini-modellen zijn ontwikkeld, eenvoudig worden geïmplementeerd en onderhouden. Met Vertex AI kunnen klanten:
- Gemini-modellen aanpassen aan specifieke bedrijfsbehoeften. De Gemini API in Vertex AI ondersteunt nu op adapter gebaseerde tuning zoals Low-Rank Adaptation (LoRA), waarmee developers het model efficiënter en op een goedkopere manier aanpassen. Aanvullende personalisatietechnieken zoals reinforcement learning from human feedback (RLHF) en distillatie komen de komende maanden naar de Gemini API.
- Verbeter de reactie van het Gemini-model met actuele informatie en stel het model in staat actie te ondernemen in de echte wereld. Met ondersteuning voor volledig beheerde gegevens verbeteren developers de nauwkeurigheid en relevantie van de antwoorden van het Gemini-model door gebruik te maken van de eigen gegevens van hun bedrijf. Met function calling, dat nu algemeen beschikbaar is, verbinden developers het Gemini-model met externe API's voor transacties en andere acties.
- Beheer en schaal Gemini in productie met speciaal ontwikkelde tools om ervoor te zorgen dat applicaties, zodra ze zijn ontwikkeld, eenvoudig worden ingezet en onderhouden. Vertex AI biedt een geautomatiseerde evaluatietool voor generatieve AI-modellen: Automatic Side by Side. Met deze functie worden de reacties van modellen vergeleken aan de hand van een standaardset criteria. Dit helpt developers om inzicht te krijgen in de prestaties van Gemini en om prompts en tuning aan te passen op basis van die feedback.
Ontwikkel zoek- en conversatieagents met Gemini-modellen met minimale code ervaring, in uren en dagen in plaats van weken en maanden:
- ● Vertex AI Search biedt developers een out of the box, Google Search-kwaliteit informatieopvraag- en antwoordgeneratiesysteem. Met ondersteuning voor Gemini-modellen bouwen developers zoekapplicaties met een nog sterkere basis, accurate vermeldingen en nog betere antwoorden.
- ● Vertex AI Conversation biedt developers de mogelijkheid om geavanceerde gen AI-aangedreven conversatiechatbots te ontwikkelen met behulp van Gemini-modellen. Met de geavanceerde redeneer- en multimodale mogelijkheden van Gemini genereren developers meer gepersonaliseerde, informatieve en aantrekkelijke conversational AI-ervaringen in hun applicaties.
Het Gemini-tijdperk is nog maar net begonnen - blijf op het scherpst van de snede
Developers ontwikkelen productieklare applicaties op Vertex AI, dat enterprise-grade model uitbreiding, testen, implementatie en beheertools biedt. Ook kunnen developers in verschillende landen wereldwijd de Gemini-modellen ervaren met de API in Google AI Studio, een gratis, webgebaseerde tool, waarmee ze snel prototypes maken en apps lanceren met een API-sleutel. Nu al onze nieuwe Gemini-modellen beschikbaar zijn voor onze klanten, kunnen we niet wachten om de nieuwe generatie intelligente apps en agents te zien die ze gaan creëren. Het Gemini-tijdperk is nog maar net begonnen. Als jouw organisatie voorop wil blijven lopen, zorg er dan samen met je accountteam voor dat je een vertrouwde tester wordt van de nieuwe Gemini-modellen. Bezoek ons in april in Las Vegas op Google Cloud Next '24 voor het laatste nieuws over AI en verken onze aankomende evenementen voor diepgaande informatie over producten en strategieën.
Door: Burak Gokturk VP & GM, Cloud AI