Machine Learning

Automatisiertes Machine Learning: Wie Algorithmen demokratisiert werden

Bild: Illustration: Antikwar / iStock.com

25.11.2019 - Noch ist K�nstliche Intelligenz eine Kunst, die nicht jeder beherrscht. Mit AutoML soll der Einstieg ins maschinelle Lernen aber sehr einfach werden. Werden KI-Experten nun �berfl�ssig? Nein! Aber AutoML ver�ndert Machine Learning nachhaltig, nicht nur zum Positiven.

von Oliver Schonschek

"Wir haben bewiesen, dass Feedzai AutoML in nur wenigen Stunden praktisch dieselben Ergebnisse erzielen kann, f�r die ein Data Scientists Team normalerweise mehrere Wochen ben�tigen w�rde" , so Pedro Bizarro, Chief Science Officer und Mitbegr�nder von Feedzai. "Dies stellt nicht nur einen bahnbrechenden Fortschritt f�r Feedzai dar, sondern wird unseren Kunden auch einen erheblichen Wettbewerbsvorteil verschaffen." Feedzai ist ein L�sungsanbieter f�r die KI-gest�tzte Bek�mpfung betr�gerischer Aktivit�ten.

Mit AutoML wird zum Beispiel die Erstellung der Modelle f�r das Maschinelle Lernen automatisiert, mit denen nach Anzeichen f�r Betrugsversuche gefahndet werden soll. Data Scientists w�ren dann in der Lage, L�sungen zur Betrugsbek�mpfung 50-mal schneller zu entwickeln, als dies mit dem �blichen Workflow m�glich ist, wie Feedzai erkl�rt. Diese Zeitersparnis kommt nicht nur dem Mangel an KI-Experten entgegen, der auf dem Markt herrscht. Aufgrund immer ausgekl�gelterer Betrugsversuche m�ssen die Unternehmen schneller reagieren k�nnen als jemals zuvor, um die Betrugsrisiken zu bek�mpfen. AutoML macht also die Betrugsabwehr effektiver. Die Vorteile einer schnelleren, automatisierten Modellierung wirken sich auch in anderen Anwendungsfeldern des Maschinellen Lernens aus, sodass man fast von einem Turbo f�r Machine Learning sprechen k�nnte. Mit der leichteren Verf�gbarkeit von Maschinellem Lernen (ML) werden die neuen Technologien schneller Einzug halten in Bereiche, in denen bisher ML noch kaum ein Thema war.

Kommt der Citizen Data Scientist?

Neben Feedzai gibt es zahlreiche andere Anbieter im Bereich AutoML, es gibt L�sungen wie Google Cloud AutoML, Amazon SageMaker, Microsoft Azure Machine Learning Studio, Rapid- Miner Auto Model und H2O Driverless AI.
Die Fachwelt steht AutoML mehrheitlich positiv gegen�ber und sieht darin die Basis f�r Enterprise AI �berhaupt. Einige Experten sagen kritisch, die AutoML-L�sungen der gro�en Cloud- Provider seien f�r die Anbieter nur eine weitere gute M�glichkeit, mehr Cloud-Dienste zu verkaufen. Andere sehen dagegen das Zeitalter des Citizen Data Scientist gekommen.

Damit in dem Bild des Citizen Data Scientist jeder zum Datenwissenschaftler wird, bedarf es im Machine Learning einer (nahezu) vollst�ndigen Automatisierung, bei der man einen Datensatz und ein Ziel in eine automatisierte Pipeline einspeist und seine Ergebnisse zusammen mit dem besten Modell erhalten kann. Doch schafft das AutoML wirklich? Was k�nnen die bisherigen L�sungen, und was werden sie in Zukunft erm�glichen?

Stand heute: AutoML braucht (noch) den Menschen

Sehen wir uns einen AutoML-Dienst genauer an. Google Cloud AutoML bietet bisher drei Dienste, den �bersetzungsdienst Cloud Translation, den Textanalyse-Dienst Cloud Natural Language und den Bildanalyse-Dienst Cloud Vision.
AutoML Vision zum Beispiel erm�glicht es Entwicklern mit geringen Kenntnissen �ber Maschinelles Lernen, qualitativ hochwertige benutzerdefinierte Modelle zu trainieren, so Google. Der Ablauf dabei ist: Nachdem die Bilder hochgeladen und mit Labels versehen wurden, trainiert AutoML ein Modell, das nach Bedarf angepasst werden kann, sprich: Man liefert AutoML einen Bilderdatensatz, der mit Labeln versehen ist, bei dem man also zum Beispiel Autobildern das Label "Auto" zugeordnet hat.

Auf dieser Basis soll ein Modell zur Bildanalyse trainiert werden, das dann sp�ter m�glichst zuverl�ssig den Bildern das Label "Auto" verpasst, die auch ein Auto zeigen. Dass wir Menschen das k�nnen, hilft uns bei den bekannten CAPTCHA vieler Onlinedienste weiter. Tats�chlich helfen wir Menschen aber auch den AutoML-Diensten weiter: Wenn die Daten nicht bereits von dem Nutzer mit einem Label versehen wurden, kann man das Labeling bei Google & Co. bestellen. Dabei machen im ersten Schritt Menschen (!) die Kennzeichnung.

Man spricht auch von Human-in-the-loop (HITL) im Machine Learning: Zuerst kennzeichnen Menschen die Daten. Dies ergibt ein Modell mit hoher Qualit�t und eine gro�e Menge an Trainingsdaten. Der Algorithmus f�r ML lernt dann, aus diesen Daten Entscheidungen zu treffen. Diese Entscheidungen pr�fen die Menschen und optimieren so das Modell, sp�ter nur noch an den Stellen, an denen der Algorithmus sich nicht sicher ist.

Bei Amazon nennt sich der Kennzeichnungsdienst Sage- Maker Ground Truth. Amazon schreibt dazu: "Sie k�nnen sich entscheiden, Kennzeichnungsauftr�ge direkt an Ihr Kennzeichnungsteam zu vergeben. Alternativ stehen f�r den Fall, dass Sie skalieren m�ssen, direkt in der Amazon SageMaker Ground Truth-Konsole Optionen zur Verf�gung, um mit Kennzeichnern au�erhalb Ihres Unternehmens zusammenzuarbeiten. Sie k�nnen per Integration mit Amazon Mechanical Turk auf eine �ffentliche Belegschaft aus �ber 500.000 Kennzeichnern zugreifen. Falls Ihre Daten Vertraulichkeit oder besondere F�higkeiten erfordern, k�nnen Sie alternativ von Amazon vorausgew�hlte professionelle Kennzeichnungsfirmen einsetzen."

Entweder man nutzt ein menschliches Heer an Kennzeichnern, die �ber Amazon beauftragt werden, oder man nutzt einen vortrainierten Service, den man auf einem Marktplatz f�r ML bekommt. Solche vortrainierten Modelle werden m�glich durch das initiale Trainieren von Ground Truth mit von Menschen gekennzeichneten Daten, sodass der Service lernt, Daten selbstst�ndig zu kennzeichnen.

Wichtig: AutoML braucht (immer) Daten

Es steht au�er Frage, dass man erst dann von Automatisierung sprechen kann, wenn ein Label-Service die Daten selbstst�ndig kennzeichnet. Dazu muss aber erst dieser Service selbst angelernt werden. Den Startpunkt liefert die menschliche Intelligenz, dann erst kann die trainierte KI dabei helfen, andere KI-L�sungen auszubilden. Das Ziel lautet "Unsupervised Learning", die ML-L�sung identifiziert dann Muster in Daten ohne vorherige menschliche Anleitung durch Labeling.
Hinsichtlich "Citizen Data Scientist" kann man gegenw�rtig sagen: Nur wer selbst �ber ein Label-Team verf�gt oder sich einen trainierten Service bzw. ein Angebot wie Amazon Mechanical Turk mit 500.000 Kennzeichnern leisten kann, kann auch einen AutoML-Dienst mit den notwendigen Daten f�ttern. F�r den echten Citizen Data Scientist ist dies jedoch kaum m�glich, Machine Learning f�r jedermann d�rfte also noch an den Kosten und Ressourcen scheitern.

Neben der Anleitung durch den Menschen, die in Zukunft immer seltener ben�tigt werden wird, brauchen L�sungen im Bereich AutoML eines dauerhaft: einen riesigen Datenpool, um m�glichst viele Anwendungsfelder trainieren zu k�nnen. Dazu passt sehr gut die Forderung des Bundesverbandes ITMittelstand BITMI auf dem letzten Digital-Gipfel: KI muss auch f�r den IT-Mittelstand zug�nglich sein, so BITMI. Dabei betonte der Bundesverband die Bedeutung von Daten f�r KI. "Wir brauchen konkrete Pl�ne f�r den Aufbau von Datenpools, die auch mittelst�ndischen Unternehmen zug�nglich sind. Ohne diese Daten kann es in Deutschland keinen erfolgreichen, fl�chendekkenden Einsatz von KI geben. Keinesfalls d�rfen wir weiter unsere technologischen Schw�chen bei Daten in eine ethische St�rke mit Datenschutz umdichten" , sagte BITMi-Pr�sident Oliver Gr�n.

Der Ausblick: Wie sich AutoML entwickeln wird und entwickeln muss

Wenn man die gegenw�rtige Situation bei AutoML betrachtet, ist keinesfalls die Grundlage daf�r erreicht, dass jedermann nun Machine Learning nutzen k�nnte. Weder der "Citizen Data Scientist" noch kleinere Unternehmen haben die Ressourcen, das Geld und die Daten in entsprechender Vielfalt und Qualit�t, um tats�chlich ihre eigenen ML-L�sungen zu erzeugen.

Mit dem weiteren Training der AutoML-Dienste, das die aktuellen Nutzer �bernehmen (und daf�r bezahlen!), wird AutoML aber ohne Zweifel den Zustand "Unsupervised Learning" erreichen: Die ML-L�sung identifiziert Muster in Daten ohne vorherige menschliche Anleitung. Damit entf�llt in Zukunft der Bedarf an zahlreichen Trainingsdaten und an Label-Ressourcen, auch die Kosten werden weiter sinken. Machine Learning f�r jedermann ist damit in gewissem Umfang erreichbar. Trotzdem wird es weiterhin professionelle Data Scientists geben und geben m�ssen. W�rden alle Machine-Learning-Aufgaben �ber AutoMLDienste zug�nglich, w�re dies nicht wirklich von Vorteil f�r die Unternehmen und die Gesellschaft.

AutoML: Zwischen Transparenz, Fehlerfortpflanzung und Abh�ngigkeit

Bekanntlich wird gerade in Deutschland mehr Transparenz bei Machine Learning gefordert, wie zum Beispiel die Leitlinien f�r K�nstliche Intelligenz des Bundesverbandes Digitale Wirtschaft (BVDW) zeigen. Selbst eine gerichtliche �berpr�fbarkeit algorithmischer Entscheidungen wird gefordert. Auch die Verbraucher w�nschen sich diese Transparenz: Immerhin vier von zehn Bundesb�rgern (45 Prozent) w�rden wissen wollen, welche Regeln eine KI einsetzt, wenn sie Entscheidungen auf Basis pers�nlicher Daten trifft. Vor allem j�ngere Nutzer interessieren sich daf�r. Sechs von zehn der 14- bis 29-J�hrigen (61 Prozent) gaben dies an, so eine Umfrage des Digitalverbandes Bitkom.

Wenn sich die meisten Machine-Learning-L�sungen auf einige, wenige AutoML-Dienste zur�ckf�hren lassen, wird dies bei der gew�nschten Transparenz helfen. Die Pr�fungen der Algorithmen k�nnten sich auf einen zwar sehr gro�en, aber definierten Kreis beschr�nken. Doch wo Licht ist, da ist auch Schatten. Zum einen steigt die Abh�ngigkeit im Machine Learning von einigen, wenigen AutoML-Diensten, wenn es kaum noch Eigenentwicklungen durch KI-Experten g�be. Zum anderen darf man nicht vergessen, dass sich m�gliche Fehler von einer Maschinenintelligenz auf die andere �bertragen k�nnten. Fehler in einer AutoML-Funktion w�rden entsprechend Fehler in den erzeugten Modellen und ML-L�sungen nach sich ziehen.

Es ist deshalb notwendig, dass Machine Learning zwar f�r jedermann zug�nglich wird, es aber trotzdem eine steigende Zahl von KI-Experten gibt, die f�r Vielfalt, Unabh�ngigkeit, Pr�fbarkeit und Sicherheit im Machine Learning sorgen. "K�nstliche Intelligenz wird in absehbarer Zukunft in den allermeisten F�llen weder Vorgesetzten noch Mitarbeitern die Arbeit komplett abnehmen, sondern sie bei ihrer T�tigkeit unterst�tzen. Wer hofft, seinen Chef auf diesem Weg loszuwerden, wird sich noch etwas gedulden m�ssen" , sagte k�rzlich Bitkom- Pr�sident Achim Berg. "Schon heute erhalten Techniker Hinweise auf die wahrscheinlichste Fehlerursache oder �rzte Hilfe bei der Auswertung von R�ntgenbildern. KI wird in Zukunft auch Hilfe bei weitreichenden Managemententscheidungen geben - diese aber nicht selbstt�tig treffen."

Genauso wird es bei den KI-Experten selbst sein: AutoML wird einen leichteren Zugang zu Machine Learning bieten f�r Unternehmen und sp�ter auch f�r Privatpersonen. Die KI-Experten werden nicht ersetzt, sondern entlastet, sie sparen Zeit, die sie in Ma�nahmen stecken sollten, die f�r mehr �berpr�fbarkeit, Unabh�ngigkeit und Sicherheit beim Maschinellen Lernen sorgen.

Machine Learning

Automatisiertes Machine Learning: Wie Algorithmen demokratisiert werden

Kommt der Citizen Data Scientist?

Stand heute: AutoML braucht (noch) den Menschen

Wichtig: AutoML braucht (immer) Daten

Der Ausblick: Wie sich AutoML entwickeln wird und entwickeln muss

AutoML: Zwischen Transparenz, Fehlerfortpflanzung und Abh�ngigkeit

Ihr Guide im New Marketing Management - ab 6,23 im Monat!

Neu in dieser Rubrik

Meistgelesen in dieser Rubrik

HighText Verlag

Folgen Sie uns:

Besuchen Sie auch:

Wichtige Links: