Künstliche Intelligenz (KI) ist eine Wissenschaft, die darauf abzielt, Computer so denken und handeln zu lassen wie Menschen. Aber es ist nicht so einfach, wie es klingt. Noch kann kein Computer die Komplexität der menschlichen Intelligenz erreichen. Der Schlüssel zu diesem Ziel liegt im Maschinelles Lernen (ML) und Deep Learning (DL). Denn diese beiden Technologien sind in der Lage, große Datenmengen zu analysieren und darauf basierend Entscheidungen und Vorhersagen zu treffen, ohne dass der Mensch eingreifen muss.
Diese grundlegende Aussage führt jedoch oft dazu, dass die Begriffe Deep Learning und Machine Learning in der KI-Welt wie austauschbare Schlagworte verwendet werden. Dies ist jedoch nicht der Fall. Umso wichtiger ist es, sich die beiden Begriffe genauer anzuschauen.
Was ist maschinelles Lernen (Machine Learning)?
Maschinelles Lernen oder Machine Learning - ein Begriff, der 1959 von Arthur Samuel geprägt wurde - ist ein Teilbereich der Künstlichen Intelligenz. Es wurde entwickelt, um Computer in die Lage zu versetzen, Aufgaben ohne explizite Programmierung auszuführen. Zu diesem Zweck verwendet ML Algorithmen, um Muster in Daten zu erkennen und zu interpretieren, daraus zu lernen und auf der Grundlage dieser Erkenntnisse die bestmöglichen Entscheidungen oder Vorhersagen zu treffen. Im Allgemeinen kann der Lernprozess dieser Algorithmen entweder überwacht oder unüberwacht sein, je nachdem, mit welchen Daten die Algorithmen gefüttert werden.
Wie funktioniert das maschinelle Lernen?
Normalerweise werden Computer mit strukturierten Daten wie Beispielen, Erfahrungen oder Anweisungen gefüttert, um nach Mustern in den Daten zu suchen und automatisch zu lernen, die Daten im Laufe der Zeit ohne menschliche Eingriffe oder Eingaben besser zu analysieren, um in Zukunft bessere Entscheidungen und Vorhersagen zu treffen. ML-Algorithmen nutzen Statistiken, um Muster in riesigen Datenmengen zu finden. In diesem Prozess kann alles, was digital gespeichert werden kann, als Daten in einen ML-Algorithmus eingespeist werden.
Algorithmen des maschinellen Lernens werden oft in überwachte und unüberwachte Algorithmen unterteilt.
Was ist überwachtes Lernen?
Überwachtes Lernen ist ein Teilbereich des maschinellen Lernens, der eine ständige menschliche Beteiligung erfordert - daher der Name "überwacht". Der Computer wird mit Trainingsdaten und einem Modell gefüttert, das ihm ausdrücklich beibringen soll, wie er auf diese Daten reagieren soll. Das überwachte Lernmodell hat eine Reihe von Eingabe- und Ausgabevariablen. Ein Algorithmus identifiziert die Abbildungsfunktion zwischen den Eingabe- und Ausgabevariablen.
Konkret bedeutet "überwacht" in diesem Fall, dass der Algorithmus jedes Mal korrigiert wird, um das Ergebnis zu optimieren. Der Algorithmus wird mit dem Datensatz trainiert und so lange verändert, bis er ein akzeptables Leistungsniveau erreicht. In diesem Prozess wird der Algorithmus so lange verfeinert, bis er in der Lage ist, neue Datensätze, die den erlernten Mustern folgen, genau zu verarbeiten. Beim halb-überwachten Lernen wird der Computer mit einer minimalen Menge an gekennzeichneten Daten und einer großen Menge an nicht gekennzeichneten Daten gefüttert und sucht selbständig nach Mustern.
Was ist unüberwachtes Lernen?
Unüberwachtes oder unkontrolliertes Lernen geht noch einen Schritt weiter. Hier werden nicht beschriftete Daten verwendet. Anders als beim überwachten Lernen werden hier nur Eingabevariablen verwendet, aber keine richtigen Antworten gegeben. Der Algorithmus muss herausfinden, was angezeigt wird. Das Ziel ist es, die Daten zu erforschen und versteckte Muster und innere Strukturen in den Daten zu finden. Dem Computer wird die Freiheit gegeben, nach Belieben Muster und Zusammenhänge zu finden, was oft zu Ergebnissen führt, die ein menschlicher Datenanalyst vielleicht nicht gesehen hätte.
Die gängigste Methode des unüberwachten Lernens ist das Clustering, das für die explorative Datenanalyse verwendet wird, um verborgene Muster oder Gruppierungen in Daten zu finden. Zu den Anwendungen der Clusteranalyse gehören die Gensequenzanalyse, die Marktforschung und die Objekterkennung.
Was ist Reinforcement Learning?
Verstärkungslernen ist das Training von ML-Modellen, um eine Folge von Entscheidungen zu treffen. Beim Verstärkungslernen versucht der Computer, durch Versuch und Irrtum eine Lösung für das Problem zu finden. Dabei erhält die KI entweder Belohnungen oder Bestrafungen für die von ihr durchgeführten Aktionen. Es ist Aufgabe des Modells herauszufinden, wie die Aufgabe zu lösen ist, um die Belohnung zu maximieren, was von völlig zufälligen Versuchen bis hin zu ausgeklügelten Taktiken reicht.
Das Verstärkungslernen ist derzeit die effektivste Methode, um maschinelle Kreativität zu erkennen, denn es nutzt die Möglichkeiten der Suche und vieler Versuche. Im Gegensatz zu anderen Techniken des maschinellen Lernens ist das verstärkende Lernen nicht auf von Menschen beschriftete Daten angewiesen. Dadurch eignet sich das verstärkende Lernen für Bereiche, in denen Trainingsdaten nicht verfügbar oder knapp sind oder durch rechtliche Beschränkungen eingeschränkt werden.
Wofür wird maschinelles Lernen eingesetzt?
ML ist etwas, das uns jeden Tag begegnet. Google zum Beispiel nutzt ML, um Spam, Malware und Phishing-E-Mails aus den Posteingängen herauszufiltern. Banken und Kreditkarteninstitute verwenden ML, um Warnungen über verdächtige Transaktionen auf Kundenkonten zu generieren. Bei Siri und Alexa steuert maschinelles Lernen Sprach- und Spracherkennungsplattformen. Und in der Medizin wird ML bereits eingesetzt, um Röntgenbilder und Bluttestergebnisse auf Anomalien wie Krebs zu untersuchen.
ML kann eine Vielzahl von Routineaufgaben automatisieren. ML hilft bei der Automatisierung und Erstellung genauer und skalierbarer Modelle für die Datenanalyse. ML wird heute in praktisch jeder Branche eingesetzt - von der Suche nach Malware über Wettervorhersagen bis hin zu Börsenmaklern, die nach optimalen Geschäften suchen.
Von der Spracherkennung zur Stimmungsanalyse
Eine häufige Anwendung ist auch die Gesichtserkennung zum Entsperren des Smartphones oder für Sicherheitszwecke wie die Identifizierung von Kriminellen oder die Suche nach vermissten Personen. Auch die automatische Spracherkennung ist eine Spielwiese der ML, z. B. bei der Umwandlung von Sprache in digitalen Text, bei der Authentifizierung von Nutzern anhand ihrer Stimme und bei der Ausführung von Aufgaben auf der Grundlage menschlicher Spracheingaben.
Kombiniert mit Natural Language Processing (NLP) ermöglicht Machine Learning Computern die nahtlose Interaktion zwischen Mensch und Technik bzw. zwischen gesprochener und geschriebener Sprache zu ermöglichen, zu interpretieren und zu verarbeiten. Besonders komplexe Arbeitsabläufe mit Chatbots oder virtuellen Assistenten (VAs) profitieren von dieser technologischen Verbindung, da nicht nur Aufgaben ausgeführt, sondern auch angemessen kommuniziert werden kann, während gleichzeitig aus Datensätzen gelernt wird, um noch bessere Entscheidungen zu treffen und angemessene Dienstleistungen zu erbringen. Computer Vision tools wie Optical Character Recognition (OCR) sind hier der kleine Bruder und wandeln gescannte Dokumente oder Fotos in Text um.
Im Finanzdienstleistungsbereich eignet sich ML für die Betrugserkennung, indem die Aktivitäten jedes Nutzers überwacht und bewertet werden, ob eine versuchte Aktivität typisch für diesen Nutzer ist oder nicht, oder um Geldwäscheaktivitäten aufzudecken. ML verbessert die Algorithmen zur Lead-Bewertung, indem es verschiedene Parameter wie Website-Besuche, geöffnete E-Mails, Downloads und Klicks in die Bewertung jedes Leads einbezieht. ML ermöglicht Stimmungsanalysen, um die Reaktion der Verbraucher auf ein bestimmtes Produkt oder eine Marketinginitiative zu messen. In jüngster Zeit nutzen Wissenschaftler/innen ML, um den Verlauf und den Ausbruch von Epidemien vorherzusagen.
Und was ist nun Deep Learning?
Deep Learning ist ein Teilbereich des maschinellen Lernens, der auf künstlichen neuronalen Netzen basiert. Während beim maschinellen Lernen die Fähigkeiten von Computern zur Durchführung komplexer Aufgaben noch weit hinter denen des Menschen zurückbleiben, setzt Deep Learning auf Algorithmen, die Daten mit einer logischen Struktur analysieren, ähnlich wie ein Mensch Schlussfolgerungen ziehen würde. Zu diesem Zweck strukturiert DL die Algorithmen in mehreren Schichten, um ein künstliches neuronales Netzwerk (KNN) zu schaffen, das aus riesigen Datenmengen lernen und selbstständig intelligente Entscheidungen treffen kann. So wie der Mensch sein Gehirn nutzt, um Muster zu erkennen und verschiedene Arten von Informationen zu klassifizieren, kann man DL beibringen, dieselben Aufgaben mit Daten zu erfüllen.
Wie funktioniert Deep Learning?
Bei Deep Learning-Modellen werden komplexe, mehrschichtige neuronale Netze aufgebaut. Diese KNN sind vom biologischen neuronalen Netz des menschlichen Gehirns inspiriert. Das bedeutet, dass der Lernprozess von DL weitaus leistungsfähiger ist als der von herkömmlichen maschinellen Lernmodellen. Ein KNN besteht aus mehreren Schichten, die als Ebenen bezeichnet werden: einer Eingabeschicht, einer Ausgabeschicht und den mittleren Schichten, die auch als versteckte Schichten bezeichnet werden.
Eine Schicht ist eine Variable, die sich an die Merkmale der Daten anpassen kann, mit denen sie trainiert wurde, und die es ihr ermöglicht, Aufgaben wie die Klassifizierung von Bildern und die Umwandlung von Sprache in Text zu erfüllen. Je mehr versteckte Schichten ein Netz zwischen der Eingabe- und der Ausgabeschicht hat, desto tiefer ist es. Im Allgemeinen wird jedes KNN mit zwei oder mehr versteckten Schichten als tiefes neuronales Netz bezeichnet.
Neuronale Netze lernen von selbst
Bei einem neuronalen Netz werden nur der Startpunkt und das gewünschte Ergebnis eingegeben. Das Netz lernt dann selbstständig. Dadurch, dass das Netz selbständig lernt, müssen nicht alle Regeln eingegeben werden. Nur die Architektur des neuronalen Netzes wird erstellt. Sobald das System trainiert ist, kann ihm z. B. ein neues Bild gezeigt werden, und es wird in der Lage sein, das Bild zu unterscheiden und zu klassifizieren.
Faltungsneuronale Netze
Faltungsneuronale Netze (Convolutional Neural Networks, CNN) sind speziell entwickelte Algorithmen, die ein Eingangsbild nehmen, verschiedenen Aspekten und Objekten im Bild eine Bedeutung zuweisen und auch zwischen ihnen unterscheiden können. Die Architektur eines Convolutional Neural Network ist vergleichbar mit den Konnektivitätsmustern der Neuronen im menschlichen Gehirn. Hier wird auf jedes Element eines Bildes ein Filter angewendet, der dem Computer hilft, Elemente im Bild selbst zu verstehen und darauf zu reagieren. Diese Technik ist nützlich, wenn eine große Anzahl von Bildern nach einem bestimmten Element oder Merkmal durchsucht wird, z. B. um ein Objekt auf dem Meeresboden zu finden oder das Gesicht einer einzelnen Person in einem Bild einer Menschenmenge zu identifizieren.
Rekurrente neuronale Netze
Recurrent Neural Networks (RNN) führen ein Schlüsselelement ein, das bei einfacheren Algorithmen fehlt: Speicher. RNN beruhen auf sequentiellen Daten oder Zeitreihen. Das rekurrente neuronale Netz erinnert sich an die Vergangenheit und seine Entscheidungen werden von dem beeinflusst, was es aus der Vergangenheit gelernt hat. Der Computer ist in der Lage, sich an vergangene Datenpunkte und Entscheidungen zu "erinnern" und sie bei der Überprüfung der aktuellen Daten zu berücksichtigen. Diese DL-Algorithmen werden häufig bei ordinalen oder zeitlichen Problemen eingesetzt, z. B. bei der Sprachübersetzung, der Verarbeitung natürlicher Sprache (NLP) oder der Spracherkennung, und sind in beliebten Anwendungen wie Siri oder Google Translate zu finden.
Wofür wird Deep Learning eingesetzt?
DL hat ein breites Spektrum von Anwendungen. Beim automatisierten Fahren erkennt es Objekte wie STOP-Schilder oder Fußgänger. Assistenzgeräte für den Hausgebrauch wie Alexa und Siri stützen sich ebenfalls auf Deep-Learning-Algorithmen, um auf die Stimme des Nutzers zu reagieren und seine Vorlieben zu erkennen. Ohne Deep Learning gäbe es keine Chatbots, Google Translate wäre nur eine rudimentäre Übersetzungsmaschine, und der Streaming-Dienst Netflix wüsste nicht, welche Filme oder Fernsehserien er vorschlagen sollte.
In der Landwirtschaft kann DL zur Optimierung der Ertragsproduktion eingesetzt werden, indem Daten von Sensoren und Satelliten unter Berücksichtigung von Temperatur und Luftfeuchtigkeit zur Erstellung von Prognosen verwendet werden. In Vertrieb und Marketing können potenzielle Kunden, die am ehesten eine Lösung kaufen würden, ermittelt werden. Im Bereich des Markenschutzes können Logo- und Produktfälschungen online erkannt werden. DL ermöglicht es Unternehmen, datengesteuerte prädiktive Werbung, Echtzeitwerbung oder gezielte Display-Werbung zu betreiben. In der Gas- und Ölindustrie kann DL Erkenntnisse aus bisher verborgenen Daten gewinnen, um wichtige Ziele zu erreichen, z. B. seismische Modellierung, automatische Bohrlochplanung, Vorhersage von Maschinenausfällen und Optimierung der Lieferkette.
Machine Learning und Deep Learning
Die Begriffe Machine Learning und Deep Learning werden oft synonym verwendet. Dennoch gibt es einige Unterscheidungsmerkmale. Im Gegensatz zum maschinellen Lernen ist Deep Learning ein noch junger Teilbereich der künstlichen Intelligenz, der auf künstlichen neuronalen Netzen basiert. Beim maschinellen Lernen geht es darum, Computer in die Lage zu versetzen, mit weniger menschlichen Eingriffen zu denken und zu handeln. Beim Deep Learning geht es darum, dass Computer mit Hilfe von Strukturen, die das menschliche Gehirn nachahmen, denken lernen.
Bei einem Deep-Learning-Modell ist der Schritt der Merkmalsextraktion überflüssig. Auch ohne die Hilfe von Menschen kann dieses Modell die einzigartigen Merkmale eines Autos erkennen und in einer bestimmten Situation eine korrekte Vorhersage treffen. Beim maschinellen Lernen hingegen ist ein ständiges menschliches Eingreifen erforderlich, um Ergebnisse zu erzielen. Deep Learning ist komplexer in der Einrichtung, erfordert danach aber nur noch minimale menschliche Eingriffe. Da ML-Programme weniger komplex sind als Deep-Learning-Algorithmen, können sie auf herkömmlichen Computern ausgeführt werden.
Deep Learning hingegen erfordert viel leistungsfähigere Hardware und Ressourcen. ML-Modelle lassen sich schnell einrichten und ausführen, aber die Aussagekraft ihrer Ergebnisse ist begrenzt. Im Gegensatz dazu erfordern DL-Systeme mehr Aufwand bei der Einrichtung, liefern dann aber sofort Ergebnisse. Während ML mit strukturierten Daten arbeitet und traditionelle Algorithmen wie die lineare Regression verwendet, arbeitet DL mit neuronalen Netzen und wurde speziell für die Verarbeitung großer Mengen unstrukturierter Daten entwickelt.
Schlussfolgerung
Jeden Tag werden innovative Technologien in unseren Alltag integriert. Gleichzeitig steigen die Anforderungen der Verbraucher an die Dienste und Anwendungen der Unternehmen. Um mit den Erwartungen der Verbraucher Schritt zu halten, verlassen sich Unternehmen zunehmend auf lernende Algorithmen, die ihnen die Arbeit erleichtern. Man muss nicht im Kaffeesatz lesen können, um vorauszusagen, dass maschinelles Lernen und Deep Learning derzeit die effektivsten KI-Technologien für zahlreiche Anwendungen sind und dass sie unser Leben und das der nächsten Generation in einer Weise verändern werden, die vor Jahrzehnten noch unmöglich war.
Aber das ist noch nicht alles. In den kommenden Jahren wird die Technologieforschung Lernmethoden und Modelle entwickeln und verfeinern, die das menschliche Verhalten besser nachahmen können. KI-Technologien wie diese sind auch ein wichtiger Bestandteil der Prozessautomatisierung. Sie machen das "Hyper" in Hyperautomation und das "Intelligent" in Intelligent Automation aus.