ChatGPT, GenAI und die Macht von Algorithmen machen Schlagzeilen und befeuern die KI-Debatte. Aber was steckt hinter diesen Technologien? Ein Überblick.
ChatGPT des US-amerikanisches Softwareunternehmens OpenAI hat einen weltweiten Hype rund um künstliche Intelligenz (KI) ausgelöst. Als der KI-Textroboter vor einem Jahr in den USA vorgestellt wurde, dauerte es nur fünf Tage, bis die Marke von einer Millionen Nutzer erreicht wurde. Mittlerweile haben viele Menschen und Firmen praktische Erfahrungen mit KI-Anwendungen gesammelt. Auch Amazon schließt sich dem Chatbot-Trend an. Die Cloud-Sparte AWS hat jüngst einen KI-Chatbot für Unternehmen vorgestellt, ein für Geschäftskunden gedachtes Programm mit dem Namen Q. Der KI-Chatbot kann zum Beispiel Zusammenfassungen von Dokumenten oder Entwürfe von Texten erstellen. Amazon tritt damit in den Wettbewerb zu ähnlichen Produkten von Microsoft und Google.
KI-Chatbots wie ChatGPT können menschenähnliche Konversationen mit Benutzern in natürlicher Sprache führen und Texte auf dem sprachlichen Niveau eines Menschen formulieren. Das Prinzip dahinter: Sie werden anhand umfangreicher Textdatensätze vorab trainiert, um Grammatik, Kontext und Semantik zu lernen. Bei einer Eingabeaufforderung sagen sie das nächste Wort oder den nächsten Satz auf der Grundlage der gelernten Muster voraus. Das "GPT" in ChatGPT steht für "Generative Pre-trained Transformer". "Ein 'Transformer' stellt hier eine Architektur für maschinelles Lernen dar. Diese ist bereits vortrainiert ('pretrained'), sodass im Gegensatz zu vielen Chatbots ein Training durch den Anwender nicht mehr erforderlich ist. Außerdem ist GPT schöpferisch tätig, deshalb das Adjektiv 'generative'", erklärt Springer-Autor Ralf T. Kreutzer im Buchkapitel Was versteht man unter Künstlicher Intelligenz und wie kann man sie nutzen?. ChatGPT ist damit ein großer Schritt in der KI-Entwicklung – und ein aktuelles Beispiel für generative KI, die auch als "GenAI" bezeichnet wird.
Generative versus prädiktive KI
Grundsätzlich wird zwischen zwei Arten von KI unterschieden: Der generativen und der "traditionellen", prädiktiven KI. GenAI ist eine Untergruppe des Deep Learning, das wiederum eine Art des Machine Learning ist. GenAI befasst sich mit der Generierung neuer Daten durch das Lernen aus großen Datensätzen und Erkennen von Mustern darin – die Fähigkeiten umfassen Text, Bild und Ton. GenAI arbeitet mit unstrukturierten Daten, ist ergebnisoffen und kreativ. Beispiele für GenAI sind das bereits erwähnte ChatGPT (Text), StyleGAN von Nvidia (Bild) und NSynth von Google (Ton).
"Traditionelle" KI oder prädikative KI befasst sich hingegen mit der Lösung spezifischer Aufgaben durch Vorhersagen auf der Grundlage zuvor analysierter Datensätze und vordefinierter Regeln. Diese Art von KI erfordert strukturierte Daten, ist zielorientiert und spezifisch. Beispiele für "traditionelle" KI sind die Optimierung von Routen, Absatzprognosen oder Sentiment Detection.
Schöpferische KI
Die Anwendungen der KI basieren auf den Erkenntnissen, die durch neuronale Netze gewonnen werden. Es werden Konzepte des Machine Learnings beziehungsweise des Deep Learnings eingesetzt. Zu den gebräuchlichen neuronalen Netzen gehört unter anderem das Generative Adversarial Network (GAN). Ein GAN ist ein System aus zwei gekoppelten neuronalen Netzen. Es wird zum Beispiel zur Erzeugung täuschend echter Bilder oder Videos, sogenannter Deep Fakes, eingesetzt, wie Springer-Auto Patrick Krauss im Buchkapitel Kreativität: Generative Künstliche Intelligenz erklärt. Es besteht aus einem Generator-Netz und einem Diskriminator-Netz. "Der Generator erzeugt immer neue Kandidatenbilder oder -videos, während der Diskriminator gleichzeitig versucht, reale Bilder und Videos von künstlich erzeugten zu unterscheiden. Im Verlauf des Trainings werden beide Netze in ihrer jeweiligen Aufgabe iterativ immer besser", so Krauss weiter. Die so erzeugten Deep Fakes seien dann meist nicht mehr von echten Bildern und Videos zu unterscheiden.
Die GenAI nutzt verschiedene Methoden des maschinellen Lernens, "um zu erkennen, wie bestimmte Datenstrukturen aussehen und wie sie generiert werden können", erklärt Autor Kreutzer. "Die Algorithmen werden trainiert, indem sie auch hier eine große Menge an Daten analysieren und versuchen, Muster in diesen Daten zu finden. Sobald das Modell trainiert ist, kann es verwendet werden, um 'neue', noch nicht gesehene Daten zu generieren", so der Autor.
Komponenten der KI
In eine Übersicht gebracht, ergibt sich damit nach den Springer-Autoren um Akshay Kulkarni folgendes Bild über die Leistungsbestandteile der KI, das sie im Buchkapitel Introduction to Generative AI skizzieren: Demnach ist GenAI eine Komponente der künstlichen Intelligenz und lässt sich folgendermaßen von Machine Learning und Deep Learning abgrenzen.
Künstliche Intelligenz (KI): Es handelt sich dabei um die umfassendere Disziplin des maschinellen Lernens zur Durchführung von Aufgaben, die normalerweise menschliche Intelligenz erfordern würden. Autoren wie Markus H. Dahm und Valentin Zehnder unterscheiden im Buchkapitel Grundlagen der KI noch zwischen starker und schwacher KI. Die Differenzierung bezieht sich auf den Grad von Intelligenz und Autonomie, die eine KI aufweist. Schwache KI (auch narrow AI = Artificial Narrow Intelligence) bezieht sich auf KIs, welche auf eine spezifische Aufgabe trainiert wurden und nur begrenzte Fähigkeiten haben, starke KI (auch general AI) auf Systeme, die allgemeine Intelligenz besitzen und in der Lage sind, eine Vielzahl von Aufgaben zu lösen.
Machine Learning (ML): Als Teilbereich der KI umfasst ML Algorithmen, die es Computern ermöglichen, aus Daten zu lernen, ohne ausdrücklich dafür programmiert zu werden. Nach Springer-Autor Kreutzer sind beim ML verschiedene Arten des Lernens zu unterscheiden: Supervised Learning (beaufsichtigtes bzw. überwachtes Lernen), Unsupervised Learning (unbeaufsichtigtes bzw. unüberwachtes Lernen), Reinforcement Learning (verstärkendes Lernen/Verstärkungslernen bzw. Lernen durch Belohnung) und Self-supervised Learning.
Deep Learning (DL): Eine spezielle Untergruppe des maschinellen Lernens. Deep Learning umfasst neuronale Netzwerke mit drei oder mehr Schichten, die verschiedene Faktoren eines Datensatzes analysieren können.
Generative KI: Als fortgeschrittene Untergruppe von KI und DL konzentriert sich die generative KI auf die Erzeugung neuer und einzigartiger Ergebnisse. Sie geht über die einfache Analyse von Daten hinaus und schafft neue Kreationen auf der Grundlage erlernter Muster.