matchdigital

Maschinenlernen im Mittelstand: Einsatzbeispiele & Umsetzungstipps (Teil 1/2)

Sebastian Zang
11/19/2019

Maschinenlernen begegnet uns im Alltag bereits an vielen Stellen, etwa wenn wir mit Alexa oder Siri kommunizieren, bei einfachen Suchanfragen auf Google oder wenn wir das Übersetzungsprogramm DeepL nutzen. Maschinenlernen hat unseren Alltag und unser Berufsleben bereits in vielen Bereichen vereinfacht, mindestens jedoch beschleunigt.  

Zunächst einmal ist eine Begriffsklärung erforderlich, wie hängen KI und Maschinenlernen zusammen? Grundsätzlich gilt: Künstliche Intelligenz ist der umfassendere Begriff und schließt Methoden des Maschinenlernens ein. Künstliche Intelligenz ist zunächst definitorisch die Fähigkeit einer Software, Probleme alleine zu lösen. Maschinenlernen ist jene Unterdisziplin von Künstlicher Intelligenz, bei der sich eine Software logische Zusammenhänge auf der Basis von Beispieldaten eigenständig erschließt. Beim Maschinenlernen geht es folglich um statistische Zusammenhänge (auch genannt: Korrelationen), häufig liegt dem die Bayesianische Statistik zugrunde, deren Grundprinzipien aus dem Mathematikunterricht bekannt sein dürften.

Die Praxis des Maschinenlernens im Alltag

In der Praxis werden eine Vielzahl von Methoden des Maschinenlernens eingesetzt, es seien einige davon genannt: Vektor Regression, Kernel Support Vector Machine, Association Rule Learning oder Reinforcement Learning. Jede dieser Methoden hat ein spezifisches Leistungsprofil, das für je spezifische Problemstellungen eingesetzt wird. Association Rule Learning wird etwa dafür eingesetzt, Kaufempfehlungen zu machen nach dem Prinzip "Kunden, die dieses Produkt gekauft haben, interessierten sich auch für...". Reinforcement Learning wird etwa dazu eingesetzt, Online-Werbekampagnen so auszusteuern, dass bei verschiedenen Anzeigevarianten diejenigen ausgespielt werden, die die höchste Conversion-Rate aufweisen. 

Reinforcement Learning wird etwa genutzt, wenn Google Ad Words Kampagnen ausgesteuert werden. Typischerweise legen Ad Words Kampagnen Manager MEHRERE Anzeigentexte an, Google spielt jene Anzeigentexte aus, die am besten funktionieren. Ineffizient wäre ein Vorgehen, wo etwa für 5 Anzeigentexte jeweils 100 Anzeigenschaltungen vorgenommen werden mit anschließender Auswertung. Denn bei nur einer effizienten Anzeige wäre so für 4 x 100 Anzeigenschaltungen Budget verschwendet worden. Bei der Methode des Reinforcement Learning dagegen fließen die Erkenntnisse über die Wirksamkeit der Anzeigentexte sofort in das statistische Modell zurück. Dies wird statistisch mithilfe des Vertrauensintervalls umgesetzt, das mit jeder Anzeigenausspielung reduziert wird. 

Neuronale Netze - Hund oder Katze?

Eine weitere Methode der Künstlichen Intelligenz sind künstliche Neuronale Netze. Künstliche Neuronale Netze werden etwa dafür eingesetzt, Bilder zu erkennen; diese Methode lässt sich für eine Vielzahl von Problemstellungen nutzen. Künstliche Neuronale Netzwerke basieren auf dem gleichen Funktionsprinzip wie das menschliche Gehirn: Für Neuronen gibt es komputationale Modelle, die Kommunikation (Signalübertragung) zwischen den Neuronen eines Neuronalen Netzwerks wird simuliert; um ein Künstliches Neuronales Netzwerk zu "trainieren", wird eine Bewertung zum"Output" (z.B. Klassifizierung eines Bildes als "Hund" oder "Katze") an das Netzwerk zurückgespielt, so dass das Neuronale Netzwerk die Verarbeitung der eingehenden Signale so anpassen kann, dass schließlich das Ergebnis stimmt. Bei der Bilderkennung wird ein Bild - vereinfacht gesprochen - in verschiedene Merkmale zerlegt. Einige Merkmale wie z.B. dass es sich bei beiden Tieren um Säugetiere handelt, beide vier Beine, Fell und einen Schwanz haben, werden sowohl auf den Hund als auch die Katze zutreffen. Einer präziseren Klassifizierung nähert man sich an, wenn man die Tiergröße als weiteres Merkmal untersucht. Zwar sind sehr viele Katzen kleiner als Hunde, allerdings sind nicht ausschließlich alle Hunde kleiner als Katzen. Einen Hund von einer Katze zu unterscheiden ist folglich gar nicht so einfach, wie man es vorerst annehmen mag. Für jedes dieser und vieler weiterer Merkmal lässt sich eine Wahrscheinlichkeit bestimmen, ob es eher auf einen Hund oder eine Katze hindeutet. Ein Kuriosum bei dieser Art von Künstlichen Neuronalen Netze für die Bilderkennung (Convolutional Neural Networks) besteht darin, dass man nicht weiß, welche Merkmale die KI eigentlich herausarbeitet, anhand derer die Unterscheidung zwischen Hunden und Katzen getroffen werden. Es handelt sich um eine Black Box. Das hat ethische Implikationen, da die Nachvollziehbarkeit von Entscheidungen/Empfehlungen der KI nicht vollständig nachvollziehbar sind. Dies aber nur am Rande. Aber es gilt: Am Ende geht es um Statistik, also Wahrscheinlichkeitsrechnung. 

Zunehmende Dynamik bei der Verbreitung von Maschinenlernen 

Gegenwärtig bewegen wir uns erst im Zeitalter der sogenannten "Schwachen KI": Eine Schwache KI zeichnet sich dadurch aus, dass sich die Algorithmen der KI dergestalt trainieren lassen, dass sie klar umrissene Aufgaben lösen können. Sie werden zu Profis in der Bild- oder Spracherkennung oder können, basierend auf Nutzerdaten, individualisierte Werbung auf Websites generieren. Wenn die Intelligenzleistung nochmals einen deutlichen Sprung gemacht hat, beginnt das Zeitalter der "Starken KI", woran derzeit in den Forschungslaboren gearbeitet wird. Dies ist ein weiterer Evolutionsschritt der Künstlichen Intelligenz auf dem Weg zu einer "generischen Intelligenz", die den Menschen auszeichnet. Logisches Denken und Handeln sowie die Fähigkeit, autonom Entscheidungen zu treffen, sind einige Eigenschaften einer Starken KI. Eine Evolutionsstufe weiter wird die sogenannte "Superintelligenz" erreicht, einer Künstlichen Intelligenz, die die Fähigkeiten des Menschen übertreffen werden.

Die Erwartungen und Hoffnungen, die an Künstliche Intelligenz geknüpft sind, sind hoch - vor allem im Silicon Valley. Der Harvard Professor Nick Boström rechnet in seinem vielbeachteten Buch "Superintelligenz" vor, dass die Menschheit aufgrund neuer Basistechnologien (oder auch: Kulturtechniken) immer wieder signifikante Sprünge in der Produktivität gemacht hat. Für Gemeinschaften von Jägern und Sammlern im Pleistozän bedurfte es 224.000 Jahre, um die Weltwirtschaft zu verdoppeln. Nach der Landwirtschaftlichen Revolution verkürzte sich für Agrargesellschaften diese Zeitspanne auf 909 Jahre. Nach der Industriellen Revolution liegt die Verdopplungsrate für reine Industriegesellschaften nur noch bei 6,3 Jahren. Es gibt nun zahlreiche Technikenthusiasten (Vernor Vinges, Ray Kurzweil), die einen weiteren technologischen Quantensprung erwarten. Würde sich diese Dynamik der Produktivitätsbeschleunigung fortsetzen, würde eine neue Kulturtechnik (z.B. Künstliche Intelligenz) einen neuen Wachstumsmodus einleiten, dann wäre eine sich alle zwei Wochen verdoppelnde Weltwirtschaft die Folge (sic!).

Maschinenlernen oder auch Künstliche Intelligenz sind den Forschungslaboren heute ganz klar entwachsen. Dabei sind die ersten Erfolge beim Einsatz von Methoden des Maschinenlernens heute schon vergleichsweise einfach zu erzielen. Jeder Einsteiger kann nach einer Einführung in das Maschinenlernen in nur wenigen Stunden ein künstliches neuronales Netzwerk aufbauen, dies mit Hunde- und Katzenbildern trainieren und hat damit einen funktionierenden KI-Algorithmus zur einfachen Bilderkennung. Wenn in der Holzindustrie Maschinenlernen eingesetzt wird, um etwa Astlöcher zu erkennen (und diese dann auszufräsen), dann bleibt das Vorgehen das Gleiche. 

Wer Maschinenlernen einsetzen will, findet heute eine Vielzahl von Baukästen und Frameworks, die zunehmend nutzerfreundlicher werden. Für den Aufbau künstlicher Neuronaler Netzwerke wird etwa häufig die Bibliothek "Tensorflow" in Verbindung mit der Bibliothek "Keras" eingesetzt. Das Forschungszentrum Informatik in Karlsruhe hat einen modularen Baukasten entwickelt, um echtzeitfähige Anwendungen für Produktionsunternehme aufzubauen: Hierbei wird der gesamte Prozess von der Zusammenführung der Daten, dem Aufbau der Maschinenlernen-Algorithmen und die Bereitstellung der Ergebnisse abgedeckt. Der Baukasten ist frei verfügbar (Vgl. StreamPipes).

Microsoft hat kürzlich seine .NET-Entwicklungsumgebung um das Framework ML.NET ergänzt und schafft damit die Möglichkeit, die gängigen Bibliotheken (zum Beispiel Tensorflow, Keras) effizient in Software einzubinden. Es wird also deutlich, dass der Einstieg ins Maschinenlernen nicht schwer ist und die dazu nötige Software häufig sogar frei verfügbar ist. Keineswegs benötigt man für den Einsatz von Maschinenlernen-Methoden immer einen Doktortitel in Mathematik oder Statistik. 

Worauf man achten sollte, wenn man ein Maschinenlernen-Projekt im eigenen Unternehmen angeht, schauen wir uns in meinem nächsten Beitrag an.


Ihr Sebastian Zang


__________________

Sebastian Zang besitzt 20 Jahre Expertise in der IT Industrie. Seit 2011 begleitet und berät er als Geschäftsführer der Categis GmbH bei der Entwicklung einer Digital Roadmap und setzt IT Projekte in unternehmenseigenen Offshore Entwicklungszentren um. Als Director Mergers & Acquisitions für die börsennotierte Beta Systems Software AG bringt er seine Expertise zudem in die Bewertung und Weiterentwicklung von IT Geschäftsmodellen ein. Er ist zudem Keynote Speaker und Blogger rund um Digitale Transformation (www.erfolgreiche-software-projekte.de)

Autor dieses Posts
Sebastian Zang

Sebastian Zang

Sebastian Zang besitzt 20 Jahre Expertise in der IT Industrie. Seit 2011 berät er als Geschäftsführer der Categis GmbH bei der Entwicklung einer Digital Roadmap und setzt IT Projekte in unternehmenseigenen Offshore Entwicklungszentren um.