Skip to main content

2019 | OriginalPaper | Buchkapitel

12. Datenvorverarbeitung

Aktivieren Sie unsere intelligente Suche um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Die n-dimensionale Eingangsstruktur eines konnektionistischen Systems zur Klassifizierung von Objekten setzt sich aus verschiedenen Quellen, wie z. B. Signalen von Temperaturmessgeräten, Weggebern, Mikrofonen, Kameras, Spektrometern oder Daten aus anderen Messgeräten zusammen. Die von diesen Sensoren gelieferten Rohdaten sind unterschiedlich strukturiert, weisen eine verschiedene Anzahl von Dimensionen auf und können parametrisiert als verbundene Werte in Paketform oder diskret vorliegen. Die Verteilung dieser Messwerte wird in der Datenvorverarbeitung analysiert. Dabei werden statistische Kennwerte ermittelt, unbrauchbare Werte entfernt und die Kennwerte im Modell M des Trainingsdatensatzes (TDS) gespeichert. Zur Anpassung der Werte an die Eingangsstruktur des Netzes kommen verschiedene Methoden zum Einsatz. Zur Bildung des Eingangsvektors sind einzelne Messwerte, spektrale Komponenten und andere Informationsquellen auch kombinierbar, um robuste charakteristische Objekteigenschaften zu bilden.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Fußnoten
1
,,Ein mit fg bandbegrenztes Signal wird vollständig durch einzelne Signalwerte beschrieben, die im Abstand \(T = \frac {1}{2 f_{g}}\) entnommen werden“, Nyquist-Shannon-Abtasttheorem [10, S. 82].
 
2
Als Distanzfunktion lassen sich verschiedene Metriken verwenden, beispielsweise die L1-Norm (Manhattan-Distanz) oder die L2-Norm (euklidische Distanz) [4, S. 602].
 
3
Haar-Wavelet, siehe Anhang E.
 
4
Die Modellkomplexität wird in Verbindung mit der Wavelet-Transformation optimiert und so eingestellt, dass die in Abschn. 11.​1 erörterte Generalisierungsfähigkeit gewährleistet ist. Weiterhin kann ein Objekt durch die Verwendung verschiedener Messkanäle identifiziert werden.
 
5
Distanzfehlerentwicklung und Anzahl der Dimensionen Abb. 6.​11 und Tab. 6.​6.
 
6
Der Nächste-Nachbarn-Bereich der Anzahl K nächster Nachbarn (K-NN) des Trainingsdatensatzes (TDS).
 
7
Einen Überblick zu den fatalen Auswirkungen von Ausreißern auf die Rechenergebnisse statistischer Art und die Belastung der Schätzer durch Ausreißer bietet [5]. Es wird dort mit einem sogenannten Bruchpunkt erörtert, wie viele Ausreißer ein Datensatz verkraften kann und welche Maßnahmen getroffen werden müssen, um fehlerfreie Datensätze sicherzustellen.
 
8
Bei der Berechnung der Stichprobenvarianz gilt statt σ das Formelzeichen s.
 
9
Die in Abschn. 7.​5 zur Glättung einer MF eingesetzten kubischen Splines eignen sich weit besser zur Topologieerhaltung als Polynome.
 
10
Der Hodges-Lehmann-Schätzer ist ein robuster nichtparametrischer Schätzer für symmetrische Verteilungen, z. B. zur Schätzung des Medians von m × n Differenzen der Datenpunkte einer Verteilung [13].
 
11
Bei der Berechnung der Stichprobenvarianz oder Berechnungen aus Teilen der Grundgesamtheit gilt statt σ das Formelzeichen s.
 
12
Siehe dazu: Der Bruchpunkt von Schätzern, Universität der Bundeswehr [5].
 
13
In Abschn. 12.3.4 ist die Füllwertmethode zur Glättung der MF beschrieben.
 
14
Referenzskala zur Zuordnung der Trainingsdatenpunkte TPi in Abschn. 4.​4, 12.2.2, 10.​3.​2 und Abb. 12.18.
 
15
In der Literatur wird die Anzahl der erforderlichen Dimensionen anhand der Größe der Eigenwerte entschieden. Dieser Sachverhalt wird in Abschn. 10.​7.​6 erörtert.
 
Literatur
2.
Zurück zum Zitat Backhaus K, Erichson B, Plinke W, Weiber R (2005) Multivariate Analysemethoden. 11. Auflage Springer, Berlin, Heidelberg, New YorkMATH Backhaus K, Erichson B, Plinke W, Weiber R (2005) Multivariate Analysemethoden. 11. Auflage Springer, Berlin, Heidelberg, New YorkMATH
3.
Zurück zum Zitat Breuer D (2014) Abstandsmaße für die multivariate adaptive Einbettung. Masterarbeit, FernUni Hagen Breuer D (2014) Abstandsmaße für die multivariate adaptive Einbettung. Masterarbeit, FernUni Hagen
4.
Zurück zum Zitat Bronstein IN, Semendjajew KA, Musiol G, Mühlig H (1999) Taschenbuch der Mathematik, 4th edn. Verlag Harri Deutsch, Frankfurt am Main and ThunMATH Bronstein IN, Semendjajew KA, Musiol G, Mühlig H (1999) Taschenbuch der Mathematik, 4th edn. Verlag Harri Deutsch, Frankfurt am Main and ThunMATH
6.
Zurück zum Zitat Diehl JM, Kohr H (2004) Deskriptive Statistik.13. Auflage, ISBN 3-88074-110-. Verlag Dietmar Klotz, Eschborn Diehl JM, Kohr H (2004) Deskriptive Statistik.13. Auflage, ISBN 3-88074-110-. Verlag Dietmar Klotz, Eschborn
7.
Zurück zum Zitat Faloutsos C (1996) Searching Multimedia Databases by Content. Kluwer Academic Publishers, DordrechtCrossRef Faloutsos C (1996) Searching Multimedia Databases by Content. Kluwer Academic Publishers, DordrechtCrossRef
8.
Zurück zum Zitat Gottwald S, Köstner H, Hullwich M (1986) Handbuch der Mathematik. VEB Bibligraphisches Institut, Leipzig Gottwald S, Köstner H, Hullwich M (1986) Handbuch der Mathematik. VEB Bibligraphisches Institut, Leipzig
9.
Zurück zum Zitat Kriegel HP, Kroger P, Schubert E, Zimek A (2011) Interpreting and Unifying Outlier Scores. In: Liu B, Liu H, Clifton CW, Washio T, Kamath C (eds) Proceedings of the 2011 SIAM International Conference on Data Mining, [Society for Industrial and Applied Mathematics], [Philadelphia, Pennsylvania], pp 13–24, https://doi.org/10.1137/1.9781611972818.2 Kriegel HP, Kroger P, Schubert E, Zimek A (2011) Interpreting and Unifying Outlier Scores. In: Liu B, Liu H, Clifton CW, Washio T, Kamath C (eds) Proceedings of the 2011 SIAM International Conference on Data Mining, [Society for Industrial and Applied Mathematics], [Philadelphia, Pennsylvania], pp 13–24, https://​doi.​org/​10.​1137/​1.​9781611972818.​2
10.
Zurück zum Zitat Mildenberger O (1995) System- und Signaltheorie, 3rd edn. Friedr. Vieweg & Sohn Verlagsgesellschaft GmbH, Braunschweig, WiesbadenCrossRef Mildenberger O (1995) System- und Signaltheorie, 3rd edn. Friedr. Vieweg & Sohn Verlagsgesellschaft GmbH, Braunschweig, WiesbadenCrossRef
11.
Zurück zum Zitat Patzelt R (1996) Elektrische Meßtechnik. Springer-Verlag, Wien, New York Patzelt R (1996) Elektrische Meßtechnik. Springer-Verlag, Wien, New York
12.
Zurück zum Zitat Pfeifer T, Profos P (2008) Handbuch der industriellen Messtechnik. Oldenbourg Industrieverlag Pfeifer T, Profos P (2008) Handbuch der industriellen Messtechnik. Oldenbourg Industrieverlag
14.
Zurück zum Zitat Sartorius G (2009) Multivariate Adaption mit modularisierten künstlichen neuronalen Netzen: Zugl.: Hagen, Fernuniv., Fachbereich Elektrotechnik, Diss., 2009, Fortschritt-Berichte VDI Reihe 10, Informatik/Kommunikation, vol 799, als ms. gedr edn. VDI-Verl., Düsseldorf Sartorius G (2009) Multivariate Adaption mit modularisierten künstlichen neuronalen Netzen: Zugl.: Hagen, Fernuniv., Fachbereich Elektrotechnik, Diss., 2009, Fortschritt-Berichte VDI Reihe 10, Informatik/Kommunikation, vol 799, als ms. gedr edn. VDI-Verl., Düsseldorf
Metadaten
Titel
Datenvorverarbeitung
verfasst von
Gerhard Sartorius
Copyright-Jahr
2019
DOI
https://doi.org/10.1007/978-3-658-23576-5_12

Neuer Inhalt