Anzeige
Anzeige

Automatisiertes Machine Learning: Wie Algorithmen demokratisiert werden

 (Bild: Illustration: Antikwar / iStock.com)

25.11.2019 - Noch ist Künstliche Intelligenz eine Kunst, die nicht jeder beherrscht. Mit AutoML soll der Einstieg ins maschinelle Lernen aber sehr einfach werden. Werden KI-Experten nun überflüssig? Nein! Aber AutoML verändert Machine Learning nachhaltig, nicht nur zum Positiven.

von Oliver Schonschek

"Wir haben bewiesen, dass Feedzai AutoML in nur wenigen Stunden praktisch dieselben Ergebnisse erzielen kann, für die ein Data Scientists Team normalerweise mehrere Wochen benötigen würde" , so Pedro Bizarro, Chief Science Officer und Mitbegründer von Feedzai. "Dies stellt nicht nur einen bahnbrechenden Fortschritt für Feedzai dar, sondern wird unseren Kunden auch einen erheblichen Wettbewerbsvorteil verschaffen." Feedzai ist ein Lösungsanbieter für die KI-gestützte Bekämpfung betrügerischer Aktivitäten.

Mit AutoML wird zum Beispiel die Erstellung der Modelle für das Maschinelle Lernen automatisiert, mit denen nach Anzeichen für Betrugsversuche gefahndet werden soll. Data Scientists wären dann in der Lage, Lösungen zur Betrugsbekämpfung 50-mal schneller zu entwickeln, als dies mit dem üblichen Workflow möglich ist, wie Feedzai erklärt. Diese Zeitersparnis kommt nicht nur dem Mangel an KI-Experten entgegen, der auf dem Markt herrscht. Aufgrund immer ausgeklügelterer Betrugsversuche müssen die Unternehmen schneller reagieren können als jemals zuvor, um die Betrugsrisiken zu bekämpfen. AutoML macht also die Betrugsabwehr effektiver. Die Vorteile einer schnelleren, automatisierten Modellierung wirken sich auch in anderen Anwendungsfeldern des Maschinellen Lernens aus, sodass man fast von einem Turbo für Machine Learning sprechen könnte. Mit der leichteren Verfügbarkeit von Maschinellem Lernen (ML) werden die neuen Technologien schneller Einzug halten in Bereiche, in denen bisher ML noch kaum ein Thema war.

Kommt der Citizen Data Scientist?

Neben Feedzai gibt es zahlreiche andere Anbieter im Bereich AutoML, es gibt Lösungen wie Google Cloud AutoML, Amazon SageMaker, Microsoft Azure Machine Learning Studio, Rapid- Miner Auto Model und H2O Driverless AI.
Die Fachwelt steht AutoML mehrheitlich positiv gegenüber und sieht darin die Basis für Enterprise AI überhaupt. Einige Experten sagen kritisch, die AutoML-Lösungen der großen Cloud- Provider seien für die Anbieter nur eine weitere gute Möglichkeit, mehr Cloud-Dienste zu verkaufen. Andere sehen dagegen das Zeitalter des Citizen Data Scientist gekommen.

Damit in dem Bild des Citizen Data Scientist jeder zum Datenwissenschaftler wird, bedarf es im Machine Learning einer (nahezu) vollständigen Automatisierung, bei der man einen Datensatz und ein Ziel in eine automatisierte Pipeline einspeist und seine Ergebnisse zusammen mit dem besten Modell erhalten kann. Doch schafft das AutoML wirklich? Was können die bisherigen Lösungen, und was werden sie in Zukunft ermöglichen?

Stand heute: AutoML braucht (noch) den Menschen

Sehen wir uns einen AutoML-Dienst genauer an. Google Cloud AutoML bietet bisher drei Dienste, den Übersetzungsdienst Cloud Translation, den Textanalyse-Dienst Cloud Natural Language und den Bildanalyse-Dienst Cloud Vision.
AutoML Vision zum Beispiel ermöglicht es Entwicklern mit geringen Kenntnissen über Maschinelles Lernen, qualitativ hochwertige benutzerdefinierte Modelle zu trainieren, so Google. Der Ablauf dabei ist: Nachdem die Bilder hochgeladen und mit Labels versehen wurden, trainiert AutoML ein Modell, das nach Bedarf angepasst werden kann, sprich: Man liefert AutoML einen Bilderdatensatz, der mit Labeln versehen ist, bei dem man also zum Beispiel Autobildern das Label "Auto" zugeordnet hat.

Auf dieser Basis soll ein Modell zur Bildanalyse trainiert werden, das dann später möglichst zuverlässig den Bildern das Label "Auto" verpasst, die auch ein Auto zeigen. Dass wir Menschen das können, hilft uns bei den bekannten CAPTCHA vieler Onlinedienste weiter. Tatsächlich helfen wir Menschen aber auch den AutoML-Diensten weiter: Wenn die Daten nicht bereits von dem Nutzer mit einem Label versehen wurden, kann man das Labeling bei Google & Co. bestellen. Dabei machen im ersten Schritt Menschen (!) die Kennzeichnung.

Man spricht auch von Human-in-the-loop (HITL) im Machine Learning: Zuerst kennzeichnen Menschen die Daten. Dies ergibt ein Modell mit hoher Qualität und eine große Menge an Trainingsdaten. Der Algorithmus für ML lernt dann, aus diesen Daten Entscheidungen zu treffen. Diese Entscheidungen prüfen die Menschen und optimieren so das Modell, später nur noch an den Stellen, an denen der Algorithmus sich nicht sicher ist.

Bei Amazon nennt sich der Kennzeichnungsdienst Sage- Maker Ground Truth. Amazon schreibt dazu: "Sie können sich entscheiden, Kennzeichnungsaufträge direkt an Ihr Kennzeichnungsteam zu vergeben. Alternativ stehen für den Fall, dass Sie skalieren müssen, direkt in der Amazon SageMaker Ground Truth-Konsole Optionen zur Verfügung, um mit Kennzeichnern außerhalb Ihres Unternehmens zusammenzuarbeiten. Sie können per Integration mit Amazon Mechanical Turk auf eine öffentliche Belegschaft aus über 500.000 Kennzeichnern zugreifen. Falls Ihre Daten Vertraulichkeit oder besondere Fähigkeiten erfordern, können Sie alternativ von Amazon vorausgewählte professionelle Kennzeichnungsfirmen einsetzen."

Entweder man nutzt ein menschliches Heer an Kennzeichnern, die über Amazon beauftragt werden, oder man nutzt einen vortrainierten Service, den man auf einem Marktplatz für ML bekommt. Solche vortrainierten Modelle werden möglich durch das initiale Trainieren von Ground Truth mit von Menschen gekennzeichneten Daten, sodass der Service lernt, Daten selbstständig zu kennzeichnen.

Wichtig: AutoML braucht (immer) Daten


Es steht außer Frage, dass man erst dann von Automatisierung sprechen kann, wenn ein Label-Service die Daten selbstständig kennzeichnet. Dazu muss aber erst dieser Service selbst angelernt werden. Den Startpunkt liefert die menschliche Intelligenz, dann erst kann die trainierte KI dabei helfen, andere KI-Lösungen auszubilden. Das Ziel lautet "Unsupervised Learning", die ML-Lösung identifiziert dann Muster in Daten ohne vorherige menschliche Anleitung durch Labeling.
Hinsichtlich "Citizen Data Scientist" kann man gegenwärtig sagen: Nur wer selbst über ein Label-Team verfügt oder sich einen trainierten Service bzw. ein Angebot wie Amazon Mechanical Turk mit 500.000 Kennzeichnern leisten kann, kann auch einen AutoML-Dienst mit den notwendigen Daten füttern. Für den echten Citizen Data Scientist ist dies jedoch kaum möglich, Machine Learning für jedermann dürfte also noch an den Kosten und Ressourcen scheitern.

Neben der Anleitung durch den Menschen, die in Zukunft immer seltener benötigt werden wird, brauchen Lösungen im Bereich AutoML eines dauerhaft: einen riesigen Datenpool, um möglichst viele Anwendungsfelder trainieren zu können. Dazu passt sehr gut die Forderung des Bundesverbandes ITMittelstand BITMI auf dem letzten Digital-Gipfel: KI muss auch für den IT-Mittelstand zugänglich sein, so BITMI. Dabei betonte der Bundesverband die Bedeutung von Daten für KI. "Wir brauchen konkrete Pläne für den Aufbau von Datenpools, die auch mittelständischen Unternehmen zugänglich sind. Ohne diese Daten kann es in Deutschland keinen erfolgreichen, flächendekkenden Einsatz von KI geben. Keinesfalls dürfen wir weiter unsere technologischen Schwächen bei Daten in eine ethische Stärke mit Datenschutz umdichten" , sagte BITMi-Präsident Oliver Grün.

Der Ausblick: Wie sich AutoML entwickeln wird und entwickeln muss

Wenn man die gegenwärtige Situation bei AutoML betrachtet, ist keinesfalls die Grundlage dafür erreicht, dass jedermann nun Machine Learning nutzen könnte. Weder der "Citizen Data Scientist" noch kleinere Unternehmen haben die Ressourcen, das Geld und die Daten in entsprechender Vielfalt und Qualität, um tatsächlich ihre eigenen ML-Lösungen zu erzeugen.

Mit dem weiteren Training der AutoML-Dienste, das die aktuellen Nutzer übernehmen (und dafür bezahlen!), wird AutoML aber ohne Zweifel den Zustand "Unsupervised Learning" erreichen: Die ML-Lösung identifiziert Muster in Daten ohne vorherige menschliche Anleitung. Damit entfällt in Zukunft der Bedarf an zahlreichen Trainingsdaten und an Label-Ressourcen, auch die Kosten werden weiter sinken. Machine Learning für jedermann ist damit in gewissem Umfang erreichbar. Trotzdem wird es weiterhin professionelle Data Scientists geben und geben müssen. Würden alle Machine-Learning-Aufgaben über AutoMLDienste zugänglich, wäre dies nicht wirklich von Vorteil für die Unternehmen und die Gesellschaft.

AutoML: Zwischen Transparenz, Fehlerfortpflanzung und Abhängigkeit

Bekanntlich wird gerade in Deutschland mehr Transparenz bei Machine Learning gefordert, wie zum Beispiel die Leitlinien für Künstliche Intelligenz des Bundesverbandes Digitale Wirtschaft (BVDW) zeigen. Selbst eine gerichtliche Überprüfbarkeit algorithmischer Entscheidungen wird gefordert. Auch die Verbraucher wünschen sich diese Transparenz: Immerhin vier von zehn Bundesbürgern (45 Prozent) würden wissen wollen, welche Regeln eine KI einsetzt, wenn sie Entscheidungen auf Basis persönlicher Daten trifft. Vor allem jüngere Nutzer interessieren sich dafür. Sechs von zehn der 14- bis 29-Jährigen (61 Prozent) gaben dies an, so eine Umfrage des Digitalverbandes Bitkom.

Wenn sich die meisten Machine-Learning-Lösungen auf einige, wenige AutoML-Dienste zurückführen lassen, wird dies bei der gewünschten Transparenz helfen. Die Prüfungen der Algorithmen könnten sich auf einen zwar sehr großen, aber definierten Kreis beschränken. Doch wo Licht ist, da ist auch Schatten. Zum einen steigt die Abhängigkeit im Machine Learning von einigen, wenigen AutoML-Diensten, wenn es kaum noch Eigenentwicklungen durch KI-Experten gäbe. Zum anderen darf man nicht vergessen, dass sich mögliche Fehler von einer Maschinenintelligenz auf die andere übertragen könnten. Fehler in einer AutoML-Funktion würden entsprechend Fehler in den erzeugten Modellen und ML-Lösungen nach sich ziehen.

Es ist deshalb notwendig, dass Machine Learning zwar für jedermann zugänglich wird, es aber trotzdem eine steigende Zahl von KI-Experten gibt, die für Vielfalt, Unabhängigkeit, Prüfbarkeit und Sicherheit im Machine Learning sorgen. "Künstliche Intelligenz wird in absehbarer Zukunft in den allermeisten Fällen weder Vorgesetzten noch Mitarbeitern die Arbeit komplett abnehmen, sondern sie bei ihrer Tätigkeit unterstützen. Wer hofft, seinen Chef auf diesem Weg loszuwerden, wird sich noch etwas gedulden müssen" , sagte kürzlich Bitkom- Präsident Achim Berg. "Schon heute erhalten Techniker Hinweise auf die wahrscheinlichste Fehlerursache oder Ärzte Hilfe bei der Auswertung von Röntgenbildern. KI wird in Zukunft auch Hilfe bei weitreichenden Managemententscheidungen geben - diese aber nicht selbsttätig treffen."

Genauso wird es bei den KI-Experten selbst sein: AutoML wird einen leichteren Zugang zu Machine Learning bieten für Unternehmen und später auch für Privatpersonen. Die KI-Experten werden nicht ersetzt, sondern entlastet, sie sparen Zeit, die sie in Maßnahmen stecken sollten, die für mehr Überprüfbarkeit, Unabhängigkeit und Sicherheit beim Maschinellen Lernen sorgen.

www.hightext.de

HighText Verlag

Schäufeleinstr. 5
80687 München

Tel.: +49 (0) 89-57 83 87-0
Fax: +49 (0) 89-57 83 87-99
E-Mail: info@onetoone.de
Web: www.hightext.de

Folgen Sie uns:



Besuchen Sie auch:

www.press1.de

www.ibusiness.de

www.versandhausberater.de