Witold Kepinski - 28 december 2017

Kubernetes introduceert Kubeflow Machine Learning stack

Kubernetes introduceert Kubeflow Machine Learning stack image

Kubernetes, aanbieder van container technologie, introduceert Kubeflow Machine Learning stack. Kubeflow is een configureerbare, draagbare, schaalbare ML-stack die speciaal is gebouwd voor Kubernetes omgevingen.

Kubernetes is snel de hybride oplossing geworden voor het overal inzetten van gecompliceerde workloads. Hoewel het begon met stateloze services, zijn klanten begonnen met het verplaatsen van complexe workloads naar het platform, gebruik makend van de rijke API's, betrouwbaarheid en prestaties van Kubernetes. Een van de snelstgroeiende use cases is om Kubernetes te gebruiken als het platform bij uitstek voor machine learning.

Het bouwen van een productiegereed machine-learning systeem omvat verschillende componenten, waarbij vaak leveranciers en met de hand gerolde oplossingen worden gemengd. Het verbinden en beheren van deze services voor zelfs gematigd geavanceerde instellingen introduceert enorme barrières van complexiteit bij het overnemen van machine learning. Infrastructuuringenieurs zullen vaak een aanzienlijke hoeveelheid tijd besteden aan het handmatig afstemmen van implementaties en handrollen voordat een enkel model kan worden getest.

Erger nog, deze implementaties zijn zo gebonden aan de clusters waarin ze zijn ingezet dat deze stapels onbeweeglijk zijn, wat betekent dat het verplaatsen van een model van een laptop naar een zeer schaalbare cloudcluster effectief onmogelijk is zonder significante re-architectuur. Al deze verschillen dragen bij aan verspilde inspanningen en creëren kansen om bugs bij elke transitie te introduceren, aldus Kubernetes.

Introductie van Kubeflow

Om deze zorgen weg te nemen, kondigt Kubernetes de creatie aan van het Kubeflow-project, een nieuwe open source Github repo die erop gericht is om het gebruik van ML-stacks op Kubernetes eenvoudig, snel en uitbreidbaar te maken. Deze repository bevat:

JupyterHub voor het maken en beheren van interactieve Jupyter-notitieblokken

Een Tensorflow Custom Resource (CRD) die kan worden geconfigureerd om CPU's of GPU's te gebruiken, en aangepast aan de grootte van een cluster met een enkele instelling

Een TF-servercontainer

Omdat deze oplossing op Kubernetes is gebaseerd, werkt deze overal waar Kubernetes wordt uitgevoerd.

Lees meer technische details op deze link.

Wil jij dagelijkse updates?

Schrijf je dan in voor onze nieuwsbrief!