Wouter Hoeffnagel - 15 juli 2024

Driekwart van zakelijk LLM-gebruik is open source

Bedrijven geven de voorkeur aan open source bij het gebruik van large language models (LLM's). Organisaties van iedere omvang investeren in generatieve AI met als doel hun organisaties te transformeren en hun data beter in te zetten voor het realiseren van zakelijke doelstellingen.

Driekwart van zakelijk LLM-gebruik is open source image

Dit blijkt uit onderzoek van Databricks. 2023 werden 11 keer zoveel AI-modellen in productie genomen als het voorgaande jaar. Gemiddeld is het in productie nemen meer dan drie keer zo efficiënt geworden. Daarbij is natuurlijke taalverwerking (NLP) de meest gebruikte en snelst groeiende machine learning-toepassing.

Basismodellen aanvullen 70% van de bedrijven die generatieve AI gebruiken, zetten tools en vector databases in om basismodellen aan te vullen. Bedrijven zijn sterk gericht op het aanpassen van LLM's met hun eigen data via retrieval augmented generation (RAG). RAG vereist vector databases, waarvan het gebruik met 377% steeg op jaarbasis (zowel in het geval van open source- als gesloten LLM's).

76% van de bedrijven die LLM's gebruiken kiest voor open source, vaak in aanvulling op propriëtaire modellen. Slechts 4 weken na de lancering is Meta Llama 3 al goed voor 39% van het gehele open source modelgebruik. Sterk gereguleerde sectoren zijn de verrassende early adopters van generatieve AI: financiële dienstverleners lopen voorop in GPU-gebruik, dat in slechts 6 maanden steeg met 88%.

Wat zijn de meest gebruikte data- en AI-oplossingen?

Naast trends in AI-gebruik, brengt het onderzoek de 10 meest gebruikte data en AI-oplossingen in kaart. 9 van de 10 producten in de lijst zijn open source. Organisaties kiezen vaak voor meer flexibiliteit, waardoor ze propriëtaire beperkingen proberen te vermijden. Een drietal producten vallen op in de top 10, gebaseerd op hun ontwikkeling in het afgelopen jaar en het groeiende zakelijke gebruik:

Plotly Dash: Plotly Dash is een low-code platform waarmee datawetenschappers data-applicaties kunnen bouwen, opschalen en implementeren. Producten zoals Plotly Dash helpen bedrijven sneller en eenvoudiger applicaties te leveren om aan dynamische bedrijfsbehoeften te voldoen.

Hugging Face: Hugging Face Transformers is het op één na populairste product. Veel bedrijven gebruiken het open source platform met vooraf getrainde transformermodellen in combinatie met hun zakelijke data om foundation models te bouwen en te verfijnen. Dit ondersteunt een groeiende trend die Databricks ziet met RAG-toepassingen.

LangChain: LangChain is een open source-toolchain voor de ontwikkeling en het gebruik van propriëtaire LLM's. Wanneer bedrijven hun eigen LLM-applicaties bouwen en werken met gespecialiseerde transformergerelateerde Python-library’s om modellen als deze te trainen, stelt LangChain hen in staat prompt interfaces of integraties met andere systemen te ontwikkelen.

Efficiëntieslagen

“We kunnen uit het rapport concluderen dat bedrijven met behulp van datawetenschap en AI grotere efficiëntieslagen beoogt, en dat generatieve AI daar nieuwe mogelijkheden voor biedt”, aldus Kevin Jonkergouw, Regional VP Benelux bij Databricks. “Daar is wel één samenhangende beheeromgeving voor nodig, zodat de gehele organisatie data en AI veilig en verantwoord kan gebruiken. Dat kan met behulp van data intelligence-platforms. De onderzoeksresultaten laten zien dat bedrijven in alle sectoren deze tools omarmen, waarbij early adopters vaak uit sterk gereguleerde sectoren komen zoals de financiële sector.”

Meer informatie is beschikbaar in het State of Data & AI 2024-rapport.

Gartner BW tm 02-11-2024 Dutch IT Golf Cup BW tm 16-09-2024
Dutch IT Security Day BN tm 15-10-2024

Wil jij dagelijkse updates?

Schrijf je dan in voor onze nieuwsbrief!