Skip to main content

2024 | Buch

Sprachmodelle verstehen

Chatbots und generative künstliche Intelligenz im Zusammenhang

verfasst von: Hans-Peter Stricker

Verlag: Springer Berlin Heidelberg

insite
SUCHEN

Über dieses Buch

Dieses Buch befasst sich mit Fragen rund um Sprachmodelle wie ChatGPT und um das Verstehen:

Verstehen Chatbots, was wir ihnen sagen und meinen? Wie können uns Chatbots helfen, etwas besser zu verstehen - einen Text oder ein Konzept? Verstehen Sprachmodelle sich selbst - was sie sagen und warum sie es sagen?Können wir Sprachmodelle verstehen und wie?

Das Buch richtet sich an technisch und philosophisch interessierte Laien, aber auch an Didaktiker aller Couleur, von der Lehrkraft bis zu Wissenschaftsjournalist:innen.

Inhaltsverzeichnis

Frontmatter
Kapitel 1. Einleitung und Begriffliches
Zusammenfassung
Vom Kleinen zum Großen. Es gibt keinen einfach zu beschreitenden Königsweg, moderne künstliche Intelligenz (KI), insbesondere modern Sprachmodelle, bottom-up, also vom ganz Kleinen ausgehend in einem großen Bogen hin zum ganz Großen zu verstehen – oder in umgekehrter Richtung, also top-down. Es ist fast so schwer, wie in der Natur vom Atom über die lebende Zelle zum Verständnis eines komplexen Organismus – oder gar einer Gesellschaft von Organismen – zu gelangen, oder im Falle des Gehirns vom einzelnen Neuron über den präfrontalen Kortex zum Bewusstsein.
Hans-Peter Stricker
Kapitel 2. Was sind Sprachmodelle?
Zusammenfassung
Wir gehen einigen Dingen, die Sprachmodelle sind, einzeln nach: Chatbots, Beispiele für (generative) KI, neuronale Netze, statistische Modelle und maschinelles Lernen. Dabei sind nur einige Sprachmodelle Chatbots, aber alle sind Beispiele für künstliche Intelligenz (KI). Nicht alle wiederum sind Beispiele für generative KI. Moderne Sprachmodelle sind ausnahmslos neuronale Netze und als neuronale Netze sind sie statistische Modelle.
Hans-Peter Stricker
Kapitel 3. Was können Sprachmodelle?
Zusammenfassung
In diesem Kapitel fassen wir nicht nur Fähigkeiten von Sprachmodellen zusammen, also das, was sie im herkömmlichen Sinne „können“, sondern auch, was sie „wissen” und „verstehen“. Das erscheint gerechtfertigt, weil der Unterschied zwischen Können, Wissen und Verstehen kein besonders scharfer ist. Natürlich kann man ihn scharf herauszuarbeiten versuchen, wir wollen aber vom begrifflich Verbindenden ausgehen. Dieses kommt in verschiedenen Redeweisen zum Ausdruck, in denen die Grenzen eher verschwimmen. Zum einen sind Wissen und Verstehen selbst Fähigkeiten, denn man kann etwas wissen oder verstehen, im Sinne von „in der Lage sein“ – oder auch nicht. Man denke dabei an Begriffe wie „die Grenzen des Verstehbaren“ oder Kants Bedingungen der Möglichkeit.
Hans-Peter Stricker
Kapitel 4. Wie funktionieren Sprachmodelle?
Zusammenfassung
Was Sprachmodelle verstehen und generieren, kann man aus zwei Perspektiven betrachten. Einerseits verstehen und generieren sie Texte (die grammatikalisch korrekt und inhaltlich plausibel und kohärent sind), und andererseits verstehen und generieren sie Worte, aus denen die Texte am Ende aufgebaut sind. Dabei ist das Ganze (der Text) natürlich mehr als die Summe seiner Teile (der Worte). Konzeptionell stehen zwischen Texten und Worten die Sätze, deren syntaktische Struktur ihre Bedeutung mitbestimmt – über die Bedeutung der Worte hinaus, aus denen sie bestehen –, und deren wechselseitige Beziehungen auf der anderen Seite die Bedeutung des Textes mitbestimmen.
Hans-Peter Stricker
Kapitel 5. Verstehen wir Sprachmodelle?
Zusammenfassung
Mit dieser Frage wollen wir das Buch beschließen und den Bogen zurück zu seinem Anfang schlagen. Die Frage, ob wir Sprachmodelle verstehen, ist noch vielschichtiger als die Frage, ob Sprachmodelle uns verstehen, weil sie auf noch mehr Ebenen gestellt werden kann und noch mehr Aspekte und Facetten berührt. Nicht allein, ob wir Sprachmodelle verstehen, ist dabei von Interesse, sondern was an ihnen und inwiefern.
Hans-Peter Stricker
Backmatter
Metadaten
Titel
Sprachmodelle verstehen
verfasst von
Hans-Peter Stricker
Copyright-Jahr
2024
Verlag
Springer Berlin Heidelberg
Electronic ISBN
978-3-662-68280-7
Print ISBN
978-3-662-68279-1
DOI
https://doi.org/10.1007/978-3-662-68280-7

Premium Partner