Gartner voorspelt snelle groei van multimodale GenAI-oplossingen
Veertig procent van de generatieve AI (GenAI)-oplossingen zijn in 2027 multimodaal (tekst, beeld, audio en video), voorspelt marktonderzoeker. Dit percentage lag in 2023 nog op slechts 1%. De verschuiving van individuele naar multimodale modellen biedt een verbeterde interactie tussen mens en AI en een kans voor GenAI-enabled aanbiedingen om te differentiëren.
Erick Brethenoux, Distinguished VP Analyst bij Gartner: "Naarmate de GenAI-markt evolueert naar modellen die native zijn getraind op meer dan één modaliteit, helpt dit om relaties tussen verschillende gegevensstromen vast te leggen en heeft het de potentie om de voordelen van GenAI te schalen naar alle gegevenstypen en toepassingen. Het stelt AI ook in staat om mensen te ondersteunen bij het uitvoeren van meer taken, ongeacht de omgeving."
Multimodale GenAI is een van de twee technologieën die zijn geïdentificeerd in de Gartner Hype Cycle voor Generatieve AI van 2024, waarbij vroege adoptie potentieel heeft om te leiden tot een opmerkelijk concurrentievoordeel en time-to-marketvoordelen. Samen met open-source large language models (LLM's) hebben beide technologieën een groot potentieel voor impact op organisaties binnen de komende vijf jaar.
Domeinspecifieke GenAI-modellen en autonome agenten
Van de GenAI-innovaties die Gartner verwacht dat ze binnen 10 jaar mainstream zullen worden, zijn twee technologieën geïdentificeerd die het hoogste potentieel bieden: domeinspecifieke GenAI-modellen en autonome agenten
Afbeelding 1: Hype Cycle voor Generative AI, 2024
Bron: Gartner (september 2024)
"Navigeren door het GenAI-ecosysteem zal overweldigend blijven voor bedrijven vanwege een chaotisch en snel veranderend ecosysteem van technologieën en leveranciers", aldus Arun Chandrasekaran, Distinguished VP Analyst bij Gartner. "GenAI bevindt zich in de Trough of Disillusionment met het begin van de consolidatie van de industrie. Echte voordelen zullen naar voren komen zodra de hype afneemt, met vooruitgang in mogelijkheden die de komende jaren waarschijnlijk in rap tempo zal komen."
Multimodale GenAI
Multimodale GenAI gaat een transformerende impact hebben op bedrijfsapplicaties door de toevoeging van nieuwe functies en functionaliteiten mogelijk te maken die anders niet haalbaar zouden zijn, verwacht Gartner. De impact is niet beperkt tot specifieke branches of use cases en kan worden toegepast op elk contactpunt tussen AI en mensen. Tegenwoordig zijn veel multimodale modellen beperkt tot twee of drie modaliteiten, hoewel dit de komende jaren zal toenemen om er meer te omvatten.
"In de echte wereld komen mensen informatie tegen en begrijpen ze deze via een combinatie van verschillende modaliteiten zoals audio, visueel en sensorisch", aldus Brethenoux. "Multimodale GenAI is belangrijk omdat gegevens doorgaans multimodaal zijn. Wanneer modellen met één modaliteit worden gecombineerd of samengesteld om multimodale GenAI-applicaties te ondersteunen, leidt dit vaak tot latentie en minder nauwkeurige resultaten, wat resulteert in een ervaring van lagere kwaliteit."
Open-source LLM's
Open-source LLM's zijn deep-learning basismodellen die de bedrijfswaarde van de implementatie van GenAI versnellen door commerciële toegang te democratiseren en ontwikkelaars in staat te stellen modellen te optimaliseren voor specifieke taken en use cases. Bovendien bieden ze toegang tot ontwikkelaarsgemeenschappen in organisaties, de academische wereld en andere onderzoeksfuncties die werken aan gemeenschappelijke doelen om de modellen te verbeteren en waardevoller te maken.
"Open-source LLM's vergroten het innovatiepotentieel door middel van maatwerk, betere controle over privacy en beveiliging, modeltransparantie, de mogelijkheid om collaboratieve ontwikkeling te benutten en het potentieel om vendor lock-in te verminderen", aldus Chandrasekaran. "Uiteindelijk bieden ze ondernemingen kleinere modellen die gemakkelijker en goedkoper te trainen zijn en die bedrijfsapplicaties en kernbedrijfsprocessen mogelijk maken."
Domeinspecifieke GenAI-modellen
Domeinspecifieke GenAI-modellen zijn geoptimaliseerd voor de behoeften van specifieke branches, bedrijfsfuncties of taken. Ze kunnen de afstemming van use-cases binnen de organisatie verbeteren, terwijl ze een verbeterde nauwkeurigheid, beveiliging en privacy leveren, evenals beter gecontextualiseerde antwoorden. Dit vermindert de behoefte aan geavanceerde prompt engineering in vergelijking met algemene modellen en kan hallucinatierisico's verlagen door gerichte training.
"Domeinspecifieke modellen kunnen een snellere time-to-value, verbeterde prestaties en verbeterde beveiliging voor AI-projecten bereiken door een geavanceerder startpunt te bieden voor branchespecifieke taken", aldus Chandrasekaran. "Dit zal een bredere acceptatie van GenAI aanmoedigen, omdat organisaties deze kunnen toepassen op use cases waar algemene modellen niet performant genoeg zijn."
Autonome agenten
Autonome agenten zijn gecombineerde systemen die gedefinieerde doelen bereiken zonder menselijke tussenkomst. Ze gebruiken verschillende AI-technieken om patronen in hun omgeving te identificeren, beslissingen te nemen, een reeks acties aan te roepen en output te genereren. Deze agenten hebben het potentieel om van hun omgeving te leren en in de loop van de tijd te verbeteren, waardoor ze complexe taken kunnen uitvoeren.
"Autonome agenten vertegenwoordigen een significante verschuiving in AI-mogelijkheden", aldus Brethenoux. "Hun onafhankelijke operationele en beslissingsmogelijkheden stellen hen in staat om de bedrijfsvoering te verbeteren, de klantervaring te verbeteren en nieuwe producten en diensten. Dit zal waarschijnlijk kostenbesparingen opleveren, wat een concurrentievoordeel oplevert. Het brengt ook een verschuiving van de organisatorische beroepsbevolking van levering naar toezicht met zich mee.”
Meer informatie is voor Gartner-klanten beschikbaar in het rapport 'Hype Cycle for Generative AI, 2024'. Ook deelt Gartner meer informatie in het gratis Gartner-webinar 'What Mature Organizations Do Differently for AI Success'.