Witold Kepinski - 18 december 2024

NVIDIA NeMo Retriever microservices voor meertalige generatieve AI

Bedrijven kunnen hun generatieve AI-inspanningen uitbreiden naar nauwkeurige, meertalige systemen met behulp van NVIDIA NeMo Retriever-embedding en reranking NVIDIA NIM-microservices.

Ai Artificial intelligence Api Software Data Genai

NVIDIA NeMo Retriever microservices voor meertalige generatieve AI image

De nieuwe toepassingen zijn nu beschikbaar zijn in de NVIDIA API-catalogus. Deze modellen kunnen informatie in een breed scala aan talen en formaten, zoals documenten, begrijpen om nauwkeurige, contextbewuste resultaten op grote schaal te leveren.

Met NeMo Retriever kunnen bedrijven nu:

Haal kennis uit grote en diverse datasets voor aanvullende context en om nauwkeurigere antwoorden te geven.
Verbind generatieve AI naadloos met bedrijfsgegevens in de meeste grote wereldtalen om uw gebruikerspubliek uit te breiden.
Lever bruikbare informatie op grotere schaal met 35x verbeterde gegevensopslagefficiëntie via nieuwe technieken zoals ondersteuning voor lange contexten en dynamische inbeddingsgrootten.

NVIDIA-partners zoals DataStax, Cohesity, Cloudera, Nutanix, SAP, VAST Data en WEKA passen deze microservices al toe om organisaties in alle sectoren te helpen aangepaste modellen veilig te verbinden met diverse en grote gegevensbronnen. Door gebruik te maken van retrieval-augmented generation ( RAG )-technieken, stelt NeMo Retriever AI-systemen in staat om toegang te krijgen tot rijkere, relevantere informatie en effectief taalkundige en contextuele verschillen te overbruggen.

Wikidata

In samenwerking met DataStax heeft Wikimedia NeMo Retriever geïmplementeerd om de inhoud van Wikipedia vector-embedden, waarmee miljarden gebruikers worden bediend. Vector-embedden — of "vectoriseren" — is een proces dat data omzet in een formaat dat AI kan verwerken en begrijpen om inzichten te extraheren en intelligente besluitvorming te stimuleren.

Wikimedia gebruikte de NeMo Retriever embedding en reranking NIM microservices om meer dan 10 miljoen Wikidata-items te vectoriseren in AI-ready formaten in minder dan drie dagen, een proces dat voorheen 30 dagen duurde. Die 10x versnelling maakt schaalbare, meertalige toegang mogelijk tot een van 's werelds grootste open-source knowledge graphs.

Dit baanbrekende project zorgt voor realtime updates voor honderdduizenden items die dagelijks worden bewerkt door duizenden bijdragers, wat de wereldwijde toegankelijkheid voor zowel ontwikkelaars als gebruikers verbetert. Met het serverloze model van Astra DB en NVIDIA AI-technologieën levert het DataStax-aanbod bijna-nul latentie en uitzonderlijke schaalbaarheid om de dynamische eisen van de Wikimedia-community te ondersteunen.

DataStax maakt gebruik van NVIDIA AI Blueprints en integreert de NVIDIA NeMo Customizer, Curator, Evaluator en Guardrails microservices in de LangFlow AI-codebuilder. Zo kan het ontwikkelaarsecosysteem AI-modellen en -pijplijnen optimaliseren voor hun unieke use cases en kunnen bedrijven hun AI-toepassingen opschalen.

Taalinclusieve AI stimuleert wereldwijde impact op het bedrijfsleven

NeMo Retriever helpt wereldwijde ondernemingen taalkundige en contextuele barrières te overwinnen en het potentieel van hun data te ontsluiten. Door robuuste AI-oplossingen in te zetten, kunnen bedrijven nauwkeurige, schaalbare en impactvolle resultaten behalen.

De platform- en adviespartners van NVIDIA spelen een cruciale rol bij het verzekeren dat ondernemingen generatieve AI-mogelijkheden, zoals de nieuwe meertalige NeMo Retriever-microservices, efficiënt kunnen adopteren en integreren. Deze partners helpen AI-oplossingen af te stemmen op de unieke behoeften en middelen van een organisatie, waardoor generatieve AI toegankelijker en effectiever wordt. Ze omvatten:

Cloudera is van plan om de integratie van NVIDIA AI in de Cloudera AI Inference Service uit te breiden. Cloudera AI Inference is momenteel ingebed met NVIDIA NIM en zal NVIDIA NeMo Retriever bevatten om de snelheid en kwaliteit van inzichten voor meertalige use cases te verbeteren.

SAP Joule Copilot

Cohesity introduceerde de eerste generatieve AI-aangedreven conversationele zoekassistent in de branche die back-upgegevens gebruikt om inzichtelijke antwoorden te leveren. Het gebruikt de NVIDIA NeMo Retriever reranking microservice om de nauwkeurigheid van het ophalen te verbeteren en de snelheid en kwaliteit van inzichten voor verschillende toepassingen aanzienlijk te verbeteren.

SAP maakt gebruik van de aardingsmogelijkheden van NeMo Retriever om context toe te voegen aan de Joule copilot Q&A-functie en informatie op te halen uit aangepaste documenten.

VAST Data implementeert NeMo Retriever-microservices op de VAST Data InsightEngine met NVIDIA om nieuwe gegevens direct beschikbaar te maken voor analyse. Dit versnelt de identificatie van zakelijke inzichten door realtime-informatie vast te leggen en te organiseren voor AI-gestuurde beslissingen.

Enterprise AI

WEKA integreert zijn WEKA AI RAG Reference Platform (WARRP)-architectuur met NVIDIA NIM en NeMo Retriever in zijn dataplatform met lage latentie om schaalbare, multimodale AI-oplossingen te leveren die honderdduizenden tokens per seconde verwerken.
Taalbarrières doorbreken met meertalige informatieopvraging

Meertalige informatieopvraging is essentieel voor enterprise AI om te voldoen aan de eisen van de echte wereld. NeMo Retriever ondersteunt efficiënte en nauwkeurige tekstopvraging in meerdere talen en cross-linguale datasets. Het is ontworpen voor enterprise use cases zoals zoeken, vraag-antwoord, samenvatting en aanbevelingssystemen.

Bovendien pakt het een belangrijke uitdaging aan in enterprise AI: het verwerken van grote volumes aan grote documenten. Met long-context support kunnen de nieuwe microservices lange contracten of gedetailleerde medische dossiers verwerken, terwijl nauwkeurigheid en consistentie behouden blijven over uitgebreide interacties. Deze mogelijkheden helpen ondernemingen hun data effectiever te gebruiken, en bieden nauwkeurige, betrouwbare resultaten voor werknemers, klanten en gebruikers, terwijl resources worden geoptimaliseerd voor schaalbaarheid. Geavanceerde meertalige retrievaltools zoals NeMo Retriever kunnen AI-systemen aanpasbaarder, toegankelijker en impactvoller maken in een geglobaliseerde wereld.

Beschikbaarheid

Ontwikkelaars krijgen toegang tot de meertalige NeMo Retriever-microservices en andere NIM-microservices voor het ophalen van informatie via de NVIDIA API-catalogus of een gratis NVIDIA AI Enterprise -ontwikkelaarslicentie van 90 dagen.

Tip de redactie

Over Witold Kepinski

Witold Kepinski (1969) is Bestuurder, Editor-in-Chief en Director Content van Dutch IT Channel en Dutch IT Leaders. Witold Kepinski is 25 jaar actief in de IT Media en Tech Business branche

Witold Kepinski geeft met een gespecialiseerd team van redacteuren, bloggers en videomakers inzicht in tech business trends en toepassingen waarmee IT-beslissers en Channel Partners impact maken.

Auteur pagina