Skip to main content

1992 | Buch | 2. Auflage

Prinzipien der Künstlichen Intelligenz

Wissensrepräsentation, Inferenz und Expertensysteme

verfasst von: Prof. Dr. rer. nat. Michael M. Richter

Verlag: Vieweg+Teubner Verlag

Buchreihe : Leitfäden und Monographien der Informatik

insite
SUCHEN

Inhaltsverzeichnis

Frontmatter

Vorbemerkungen

0. Vorbemerkungen
Zusammenfassung
Wir werden es in diesem Buche mit der Repräsentation und Verarbeitung von Wissen zu tun haben. Dies sind Fähigkeiten und Tätigkeiten, die bei Erfolg mit dem Prädikat “intelligent” belegt werden können. Wir fragen uns hier, ob und vor allem in wie weit ein Computer uns hier helfen kann. Dazu müßte er allerdings das für seine jeweilige Aufgabe benötigte Wissen auch zur Verfügung haben, wir müssen es ihm also “eintrichtern”, was mit dem Fachausdruck “repräsentieren” belegt wird. Es gibt nun traditionell viele Wege, Wissen zu repräsentieren. Dazu gehören Lexika, Tabellen und Datenbanken. Jedes dieser Medien hat seine eigene Formulierungssprache. Bei manchen Ausdrucksweisen hat man das Gefühl, daß sie das Problem verfremden und bei anderen, daß sie dem Problem angepaßt sind. Diese Ausdrucksweisen wollen wir etwas genauer analysieren. Von einer solchen Analyse und den daraus zu ziehenden Konsequenzen hängt der Erfolg der Methoden der Künstlichen Intelligenz ganz wesentlich ab.
Michael M. Richter

Wissensrepräsentation und Inferenz in der Prädikatenlogik erster Stufe

1. Syntax und Semantik der Prädikatenlogik
Zusammenfassung
Die klassische Prädikatenlogik ist die bekannteste, am meisten studierte und genutzte Logik. Durch die Tatsache, daß sie am Anfang dieses Buches behandelt wird soll man sich nicht zu der Annahme verleiten lassen, die Künstliche Intelligenz sei ein Teilgebiet der Logik. Vielmehr wird hier ein begrifflicher und methodischer Rahmen erstellt, auf dem sich viele der eigentlich interessanten Probleme erst formulieren lassen. Der an deduktiven Methoden weniger interessierte Leser kann die fortgeschritteneren Teile dieses Paragraphen vorerst überspringen und dann von Fall zu Fall hier nachschlagen. Wegen der grundlegenden Bedeutung der Prädikatenlogik diskutieren wir ihre Begriffswelt recht genau und formal; bei einer etwaigen Implementierung muß man dies sowieso machen. Die Sprache der Prädikatenlogik soll es ermöglichen, über (endlichen und unendlichen) Bereichen, auf denen eine bestimmte Anzahl von Funktionen und Relationen vorgegeben ist, entsprechende relationale und funktionale Eigenschaften bezüglich der Elemente dieser Bereiche auszudrücken. Die sprachlichen Symbole haben dabei für sich genommen noch keine Bedeutung, sie gewinnen sie erst durch die semantische Zuordnung zu den konkreten Relationen und Funktionen des betrachteten Bereiches.
Michael M. Richter
2. Allgemeine deduktive Methoden
Zusammenfassung
Eine klassische Aufgabe deduktiver Verfahren ist es, logische Beweise zu kalkülisieren. Wir werden im Verlaufe dieses Buches vielen Formen der Inferenz begegnen. Manche sind von “streng logischer Art”, andere haben einen ganz anderen Charakter. Dieser Paragraph dient zur Analyse der logischen Beweise und der Methoden zu ihrer Mechanisierung. Logische Beweise garantieren die Richtigkeit ihrer Resultate und sind insofern auch als Erklärungen zu verstehen. Trotzdem wird man sie meist nicht als befriedigende Erklärungen ansehen, weil sie gewöhnlich keinerlei kognitive Aspekte berücksichtigen; vgl. dazu §18.
Michael M. Richter
3. Der Spezialfall der Gleichheit, Reduktionssysteme
Zusammenfassung
Das anscheinend harmlose Gleichheitsprädikat bereitet in Deduktionssystemen Schwierigkeiten, die sehr leicht zu einer kombinatorischen Explosion oder sogar zu grundsätzlichen Unentscheidbarkeiten führen können. Nehmen wir eine Gleichung t ≡ s, wobei die Terme t und s noch Variable enthalten können. Diese Gleichung erlaubt uns, ein jegliches Beispiel von t (d.h. Substitutionsergebnis) durch das entsprechende von s zu ersetzen und umgekehrt.
Michael M. Richter
4. Prädikatenlogik und deklaratives Programmieren; Regelsysteme
Zusammenfassung
Der klassische Stil des Programmierens wird häufig durch die Adjektive prozedural oder imperativ gekennzeichnet. Der Grund dafür ist, daß man beim Programmieren die Arbeitsweise eines Algorithmus durch Angabe von Befehlen und Prozeduren auf detaillierte Weise beschreibt. Etwas genauer besehen geht dieser Prozeß schrittweise vor sich. Zuerst hat man gewöhnlich eine informell gestellte Aufgabe vor sich, die man dann sinngemäß in eine formale Spezifikation überführt. Darunter versteht man eine formale Beschreibung der Eingabegrößen, der Ausgabegrößen und ihrer wechselseitigen Beziehungen. Hier liegen häufig schon Fehlerquellen,weil die informelle Beschreibung oft in der Umgangssprache (mit all ihren Kontextabhängigkeiten) und die Spezifikation meist in einem davon ganz verschiedenen Formalismus notiert werden. Für die Spezifikation wird dann (häufig erst nach weiteren Transformationen) das Programm geschrieben, und man kann dann sagen, ob dieses bezüglich der Spezifikation korrekt ist oder nicht. Die höheren Programmiersprachen enthalten nun Elemente, die bestimmte komplexere Operationen direkt ausführen, den Programmierer also von den sonst anfallenden Details entlasten. Derart einmal auf den Geschmack gekommen, fragt man sich nun, wie weit man solch einen Service treiben kann. Am bequemsten wäre es natürlich, nur noch die Spezifikation anzugeben und den ganzen Rest dem System zu überlassen. Das ist in der Tat die Grundidee des deklarativen Programmierens.
Michael M. Richter

Erweiterte Ausdrucksmöglichkeiten

5. Der praktische Gebrauch der logischen Symbole
Zusammenfassung
Die Leitmotive beim klassischen Wahrheitsbegriff waren Dichotomie (eine Aussage ist entweder wahr oder falsch) und Extensionalität (die Wahrheit einer zusammengesetzten Aussage hängt nur von der Wahrheit der Teilaussagen und nicht von deren Bedeutung ab). Im Prinzip war dann die “Wahrheit” als eine rekursive Funktion (und zwar rekursiv über den Aufbau der Aussagen) erklärt und im Prinzip hat dann auch jede Aussage bei jeder Interpretation (nach Belegung aller Variablen) einen wohlbestimmten Wahrheitswert. Dies bedeutet jedoch keineswegs, daß man ein Verfahren hat, diesen Wahrheitswert auch grundsätzlich zu bestimmen. Und selbst wenn es theoretisch möglich ist, muß es praktisch nicht gelingen. Aus diesem Grunde wäre eine effektiv (und effizient) nachprüfbare Bedingung für das Vorliegen der Wahrheit erwünscht. Wir wollen die einzelnen logischen Symbole in dieser Hinsicht diskutieren.
Michael M. Richter
6. Unzulänglichkeiten der Prädikatenlogik
Zusammenfassung
Zu Beginn von §1 hatten wir bemerkt, daß sich viele auftretende Sachverhalte ohne Schwierigkeiten in die Prädikatenlogik übersetzen lassen. Wir wollen jedoch darauf hinweisen, daß man hier besonders dann genau vorzugehen hat, wenn die ursprüngliche Situation in der natürlichen Sprache geschildert wurde. In der natürlichen Sprache haben Ausdrucksweisen doch oft eine größere oder andere Tragweite als in der Prädikatenlogik. Betrachten wir dazu einmal den aussagenlogischen Schluß “Aus den Voraussetzungen A und A → B folgt B”. Eine scheinbare Anwendung dieses Schlusses liegt im folgenden natürlichsprachlichen Beispiel von Voraussetzung 1: Wenn es regnet, wird es naß. Voraussetzung 2: Es regnet. Schluß: Es wird naß.
Michael M. Richter
7. Prädikatenlogik höherer Stufe
Zusammenfassung
Ausgangspunkt für die Einführung der Prädikatenlogik höherer Stufe ist der Vorschlag, auch für Prädikate Variable einzuführen, sie durch stellengerechte Relationen zu belegen und, als wichtigstes, Quantifizierungen über sie zu erlauben. Auf diese Weise gelangt man in der Tat sofort zur Logik der zweiten Stufe. Weil man diesen Prozeß der Erweiterung aber noch iterieren möchte, ist eine gewisse Notation darüber am Platze, auf welcher höheren Stufe man sich befindet Die folgenden Typdefinitionen erledigen gerade diese Aufgabe.
Michael M. Richter
8. Spezielle Darstellungsarten und Inferenzmechanismen
Zusammenfassung
In den Darstellungsformen dieses Abschnittes werden verschiedene Paradigmen zur Problemlösung angeboten. Zwischen ihnen bestehen manchmal mehr und manchmal weniger Zusammenhänge. Das liegt daran, daß sie für die Behandlung teilweise sehr unterschiedlicher Problemklassen gedacht sind.
Michael M. Richter
9. Veränderliche Welten und modale Ausdrucksweisen
Zusammenfassung
In der klassischen Logik wurden Eigenschaften jeweils eines Modelles beschrieben. Im Gegensatz dazu ist es die Grundvorstellung modallogischer Betrachtungen, gleichzeitig ein ganzes System möglicher Welten oder denkbarer Situationen zu erfassen. Dabei stehen diese Welten nicht völlig zusammenhangslos nebeneinander, sondern es bestehen unter Umständen verschiedene Übergangsmöglichkeiten von einer Welt oder Situation zu einigen anderen. Dies könnte etwa durch eine die Welt verändernde Handlung oder einfach durch zeitlichen Fortschritt geschehen. Modellhaft kann man diese intuitive Vorstellung von Welten und Übergangsmöglichkeiten mit einem Graphen beschreiben, in dem die einzelnen Welten durch Knoten und die Übergangsmöglichkeiten durch gerichtete Pfeile dargestellt werden.
Michael M. Richter
10. Induktive Logik, Hypothesenbildung und Analogieschlüsse
Zusammenfassung
Bei unseren bisherigen Inferenzen haben wir es mit sogenannten “streng logischen Schlüssen” zu tun gehabt, an deren Korrektheit sich nicht zweifeln ließ. Für solche Schlußweisen wollen wir den Namen deduktive Schlüsse reservieren. In allen Erfahrungswissenschaften und erst recht im Alltag sind solche strengen Überlegungen aber doch recht selten. Sie dienen mehr der Konsistenzüberprüfung als der Erzeugung neuen Wissens. Die meisten Überlegungen führen nur zu plausiblen aber trotz ihrer Unsicherheit nützlichen Konklusionen. Wir teilen sie in zwei Kategorien ein:
(A)
Induktive Schlüsse
 
(B)
Analogieschlüsse
 
Michael M. Richter
11. Nichtmonotonie und Revisionsmechanismen
Zusammenfassung
Wir betrachten ein allgemeines Regelsystem R, dessen einzelne Regeln es gestatten, nach Zutreffen einer Menge B von Bedingungen eine Aktion A auszuführen. Dies wollen wir notieren als
$$ {\text{B }}|_{ - R} {\text{ A}} $$
Der Fall von (deduktiven und induktiven) logischen Schlüssen wird hier subsumiert, dann besteht A im “Hinschreiben der Konklusion”.
Michael M. Richter
12. Die Logik von Frage und Antwort
Zusammenfassung
In den bisherigen Situationen haben wir nur sprachliche Konstrukte behandelt, auf die man sinnvollerweise einen Wahrheitsbegriff anwenden konnte. Bei einer Frage (und ebenso auch bei einem Befehl) ist dies nun nicht mehr gegeben. Zwar spielt der Wahrheitsbegriff auch im Zusammenhang mit Fragen eine Rolle, aber nur in Bezug auf die Beantwortung der Frage. Die Antwort ist eine notwendige Ergänzung zur Frage, und man sollte beide Begriffe zusammen analysieren. Als erstes fällt auf, daß die Wahrheit oder Falschheit einer Antwort gar nicht das einzige und in gewissem Sinne noch nicht einmal das wichtigste Kriterium zu ihrer Beurteilung ist. Zunächst einmal interessiert es nämlich, ob die Antwort überhaupt eine Antwort auf die Frage ist. So wird man etwa auf die Frage “Welches ist die Hauptstadt von Frankreich?” die Antwort “Die Donau fließt ins Schwarze Meer” wohl kaum als vernünftig bezeichnen, obwohl sie einen wahren Sachverhalt repräsentiert.
Michael M. Richter

Expertensysteme

13. Allgemeine Vorbemerkungen
Zusammenfassung
In diesem Abschnitt beschäftigen wir uns mit allgemeinen und sehr abstrakten Aspekten von Expertensystemen. Konkreteres Material findet man z.B. in §20; es wird empfohlen, nach und bei dessen Studium gelegentlich zu diesen Vorbemerkungen zurückzuschlagen.
Michael M. Richter
14. Behandlung von Unsicherheit und Vagheit
Zusammenfassung
Die wenigsten Aussagen im täglichen Leben und in Expertensystemen sind entweder “ganz wahr” oder “ganz falsch”. Außerhalb des rein mathematischen Bereiches lassen sich nur sehr schwer Beispiele für solche idealisierten klaren Verhältnisse finden. Bereits in §10 hatten wir die Bildung von Hypothesen diskutiert; in der Realität sind viele Aussagen explizit oder implizit von hypothetischem und etwas unpräzisem Charakter. Selbst in Gebieten von ausgeprägt exaktem Charakter wie in der Mathematik sind die meisten Überlegungen unscharf. Das klingt etwas überraschend, aber es leuchtet ein, wenn man bedenkt, daß Unschärfe nicht nur in das Endergebnis einer ßberlegung eingehen kann (bei mathematischen Beweisen hoffentlich nicht), sondern vor allem in die ßberlegungen zur Lösungsfindung. Nebenbei bemerkt: Auch in der Mathematik sind manche Leute durch (richtige oder falsche) Vermutungen berühmter geworden als durch Beweise.
Michael M. Richter
15. Suchverfahren
Zusammenfassung
Früher hatten wir die Konflikte als den Preis für die Annehmlichkeiten des deklarativen Programmierens bezeichnet. In Regelsprachen wie Prolog oder OPS5 gab es feste Mechanismen zur Konfliktlösung, im Falle eines Mißlingens der Vorgehensweise wurde dann ein neuer Versuch gestartet. Dieser Prozeß kann eventuell durch gewisse Backtrackingverfahren gesteuert werden; spezielle Vorkehrungen, ihm besondere inhaltlich gestützte Aufmerksamkeit zu schenken, waren jedoch nicht vorgesehen. Den hiermit zusammenhängenden Fragen wollen wir uns jetzt zuwenden.
Michael M. Richter
16. Modellierung zeitlichen Verhaltens
Zusammenfassung
Alle Ereignisse in der Welt finden in der Zeit statt. Oft kann der zeitliche Gesichtspunkt in Beschreibungen vernachlässigt werden und zwar genau dann, wenn die betrachteten Phänomene ganz oder nahezu zeitlich invariant sind. Dies ist etwa der Fall bei geometrischen Untersuchungen oder der Erstellung der Statik für ein Haus. Bei den meisten Prozessen und Aktionen ist die Sache jedoch ganz anders gelagert. Man muß wissen, was früher und später ist, man muß Zeitdauern erörtern, gelegentlich Zeit einplanen und dergleichen mehr. Für alle diese Dinge ist es zweckmäßig, ein Zeitmodell zu haben, ganz unabhängig davon, ob man es nun explizit im System repräsentieren möchte oder nicht. Dabei sollte jedoch das Zeitmodell stets adäquat für die intendierte Anwendungsklasse sein, d.h. es sollte alle interessierenden Aspekte zu modellieren gestatten, aber nach Möglichkeit auch nicht unnötig mehr.
Michael M. Richter
17. Abstraktion und qualitatives Schließen
Zusammenfassung
Einem System ohne die Fähigkeit zur Abstraktion wird man sicherlich kaum “intelligentes Verhalten” zubilligen können. Das Gegenstück zur Abstraktion ist die Konkretisierung, beide Begriffe sind nur zusammen genommen sinnvoll. Wir wollen ein Abstraktum auch ein Muster und ein Konkretum auch ein Beispiel nennen. Sie bedingen sich in dem Sinne, daß Muster stets Muster von Beispielen und Beispiele stets Beispiele von Mustern sind. Auch sind diese Begriffe relativ, denn Muster können wiederum Beispiele anderer Muster sein.
Michael M. Richter
18. Erklärung
Zusammenfassung
In §10 hatten wir induktive Schlüsse diskutiert, deren Resultate Begründungen für Beobachtungen abgaben. Solche Begründungen erklären die Beobachtungen in gewisser Hinsicht; den Terminus “Erklärungen” hatten wir jedoch dort mit Absicht vermieden. Erstens können Erklärungen auch von anderer Art sein, vor allem aber beinhaltet der Erklärungsbegriff mehr als eine logische oder kausale Begründung, er enthält eine starke Komponente der Kommunikation.
Michael M. Richter
19. Wissensakquisition und Lernen
Zusammenfassung
Der umgangssprachliche Begriff des Lernens ist wie die meisten solcher Konzepte sehr allgemein und umfaßt eine große Vielfalt von Ausprägungen, die je nach Lage und Intention sehr verschieden ausfallen können. Einige von ihnen werden wir konkret diskutieren. Wir betrachten ein System, in dem in einer bestimmten wohldefinierten Sprache gewisse Einträge stehen, die sowohl extern manipuliert werden können (durch Löschen und Modifizieren alter Einträge, durch Hinzufügen neuer Einträge) als auch auf dieselbe Weise intern mit Mitteln des Systems verändert werden können. Die externe Manipulation ist die Wissenseingabe und die interne eine Inferenz. In beiden Fällen findet beim System ein Lernprozeß statt, denn es “weiß” hinterher mehr als vorher. Bei einer Eingabe ist das Lernen aber von recht trivialer Natur und verdient diesen Namen eigentlich nicht. Nichtdestoweniger findet auch in diesem Zusammenhang ein Lernen statt, nämlich beim Benutzer bzw. beim Ersteller des Systems. Er hat das zu kodierende Wissen bei einem Experten zu erfragen, zu verstehen und dann geeignet zu repäsentieren. Diesen Vorgang nennt man Wissensakquisition. Er läßt sich als Teil eines Softwareengineeringprozesses auffassen und bildet bei der Expertensystementwicklung ein als “Flaschenhals” bekanntes Problem. Zur Bewältigung dieser Aufgabe sind zum einen Methoden zu Unterstützung des Wissensakquisition selbst entwickelt worden und zum anderen versucht man, durch maschinelle Lernverfahren den selbständigen Wissenserwerb des Systems zu fördern.
Michael M. Richter
20. Analytische und synthetische Systeme
Zusammenfassung
In einem Analysesystem werden existierende Objekte untersucht, in einem Synthesesystem werden vorher noch nicht existierende Objekte zusammengesetzt. Eine typische Analysesituation besteht bei der Diagnose, während etwa eine Konstruktion oder allgemeiner eine Planung eine echte Syntheseaufgabe ist. Das diagnostische Problem besteht darin, die richtige Hypothese aus der Menge der Konkurrenzkandidaten zu selektieren. Die richtige Diagnose zeichnet sich dadurch aus, daß sie wahr ist, wohingegen die Alternativen nicht zutreffen. Bei dem Ergebnis einer Konstruktion kann man nicht davon sprechen, daß es wahr ist, sondern höchstens, daß es gewisse Bedingungen erfüllt und darüber hinaus etwaigen Optimalitätskriterien genügt.
Michael M. Richter

Ergänzungen

21. Entscheidungsunterstützende Systeme
Zusammenfassung
Entscheidungsunterstützende Systeme (auch DSS genannt, vom englischen “Decision Support System”) sollen helfen, bessere Entscheidungen zu treffen. Diese Aufgabe hat sowohl mit diagnostischen Klassifikationsaufgaben wie auch mit Planungsaufgaben Gemeinsamkeiten. Wie in einer Diagnosesituation sind mögliche Alternativen gegeben, unter denen die Entscheidung eine auszuwählen hat. Die getroffene Auswahl ist aber im allgemeinen weder “wahr” noch “falsch”, sondern kann allenfalls gewissen Bedingungen genügen und darüber hinaus “besser” oder “schlechter” sein. Diese Kriterien sind uns bereits beim Planen begegnet; in der Tat besteht die Entscheidungsfindung oft in der Auswahl oder Bestimmung eines Planes.
Michael M. Richter
22. Expertensysteme und Datenbanken
Zusammenfassung
Eine simplifizierende Annahme ist, daß alles “Wissen” eines Expertensystems schlicht und einfach in einer sogenannten Wissensbasis steht, und man sich um genauere Zugriffsmöglichkeiten, Verwaltung, Fehlerbehandlung, kurz um die Probleme der Datenbanken, nicht zu kümmern braucht. Diese Annahme ist bei kleinen Wissensbasen gerechtfertigt. Bei größeren Datenmengen ist das hingegen keineswegs mehr der Fall. Die Repräsentationsebene eines an der deklarativen Methodik orientierten Expertensystems hat nun grundsätzliche Schwierigkeiten mit der effizienten Verarbeitung großer Datenmengen. Von der kognitiven Ebene her ist hier bei der gegenwärtigen Vorgehensweise keine Unterstüzung zu erhoffen, weil solche Fragen dort gar nicht vorgesehen sind. Gerade die Datenbankebene ist aber extra hierfür da und deshalb sollten ihr auch solche Techniken übertragen werden. In §13 sprachen wir das Interfaceproblem zwischen schnellen Algorithmen (wozu die Datenbankoperationen gehören) und der Wissensrepräsentationsebene an. Die Diskrepanz zwischen diesen Ebenen rührt im Prinzip daher, daß es sich einmal um flexible, aber langsame und zum anderen um schnelle, aber relativ starre Operationen handelt.
Michael M. Richter
23. KI-Programmiersprachen
Zusammenfassung
Wir hatten bereits verschiedentlich Programmierstile und Programmiersprachen diskutiert. Es ist dies aber kein Lehrbuch für Programmiersprachen, man kann sie nicht so nebenbei abtun und sollte sie theoretisch wie praktisch richtig erlernen. Dies trifft auch und gerade auf LISP zu. Hier werden wir einige Sprachen nur kommentieren und auf spezielle Aspekte hinweisen. Die einzigen etwas ausführlicher behandelten Sprachen sind die deklarativen und hier vor allem die logischen (vgl. Teil I), weil sie sich organisch aus dem behandelten Stoff ergeben.
Michael M. Richter
24. Aspekte der Kognitionswissenschaften
Zusammenfassung
Wir haben zwar schon häufiger von der “kognitiven Ebene” gesprochen; trotzdem fragt man sich nach dem Sinn eines Abschnittes über Kognitionswissenschaften in einem Informatikbuch. Diese Disziplin beschäftigt sich nicht zuletzt mit der Modellierung menschlicher Methoden bei der Verarbeitung von Information. Das ist in dieser Allgemeinheit aber auch ein Thema der Informatik. Die klassische Vorgehensweise bestand dabei in der Entwicklung geeigneter Algorithmen. Durch die Künstliche Intelligenz wurde die deklarative Vorgehensweise ins Spiel gebracht, über die auf der Repräsentations- und Implementationsebene bisher wenig Erfahrung vorhanden war.
Michael M. Richter
Backmatter
Metadaten
Titel
Prinzipien der Künstlichen Intelligenz
verfasst von
Prof. Dr. rer. nat. Michael M. Richter
Copyright-Jahr
1992
Verlag
Vieweg+Teubner Verlag
Electronic ISBN
978-3-322-84870-3
Print ISBN
978-3-519-12269-2
DOI
https://doi.org/10.1007/978-3-322-84870-3