Skip to main content
Top

2019 | OriginalPaper | Chapter

12. Datenvorverarbeitung

Activate our intelligent search to find suitable subject content or patents.

search-config
loading …

Zusammenfassung

Die n-dimensionale Eingangsstruktur eines konnektionistischen Systems zur Klassifizierung von Objekten setzt sich aus verschiedenen Quellen, wie z. B. Signalen von Temperaturmessgeräten, Weggebern, Mikrofonen, Kameras, Spektrometern oder Daten aus anderen Messgeräten zusammen. Die von diesen Sensoren gelieferten Rohdaten sind unterschiedlich strukturiert, weisen eine verschiedene Anzahl von Dimensionen auf und können parametrisiert als verbundene Werte in Paketform oder diskret vorliegen. Die Verteilung dieser Messwerte wird in der Datenvorverarbeitung analysiert. Dabei werden statistische Kennwerte ermittelt, unbrauchbare Werte entfernt und die Kennwerte im Modell M des Trainingsdatensatzes (TDS) gespeichert. Zur Anpassung der Werte an die Eingangsstruktur des Netzes kommen verschiedene Methoden zum Einsatz. Zur Bildung des Eingangsvektors sind einzelne Messwerte, spektrale Komponenten und andere Informationsquellen auch kombinierbar, um robuste charakteristische Objekteigenschaften zu bilden.

Dont have a licence yet? Then find out more about our products and how to get one now:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Footnotes
1
,,Ein mit fg bandbegrenztes Signal wird vollständig durch einzelne Signalwerte beschrieben, die im Abstand \(T = \frac {1}{2 f_{g}}\) entnommen werden“, Nyquist-Shannon-Abtasttheorem [10, S. 82].
 
2
Als Distanzfunktion lassen sich verschiedene Metriken verwenden, beispielsweise die L1-Norm (Manhattan-Distanz) oder die L2-Norm (euklidische Distanz) [4, S. 602].
 
3
Haar-Wavelet, siehe Anhang E.
 
4
Die Modellkomplexität wird in Verbindung mit der Wavelet-Transformation optimiert und so eingestellt, dass die in Abschn. 11.​1 erörterte Generalisierungsfähigkeit gewährleistet ist. Weiterhin kann ein Objekt durch die Verwendung verschiedener Messkanäle identifiziert werden.
 
5
Distanzfehlerentwicklung und Anzahl der Dimensionen Abb. 6.​11 und Tab. 6.​6.
 
6
Der Nächste-Nachbarn-Bereich der Anzahl K nächster Nachbarn (K-NN) des Trainingsdatensatzes (TDS).
 
7
Einen Überblick zu den fatalen Auswirkungen von Ausreißern auf die Rechenergebnisse statistischer Art und die Belastung der Schätzer durch Ausreißer bietet [5]. Es wird dort mit einem sogenannten Bruchpunkt erörtert, wie viele Ausreißer ein Datensatz verkraften kann und welche Maßnahmen getroffen werden müssen, um fehlerfreie Datensätze sicherzustellen.
 
8
Bei der Berechnung der Stichprobenvarianz gilt statt σ das Formelzeichen s.
 
9
Die in Abschn. 7.​5 zur Glättung einer MF eingesetzten kubischen Splines eignen sich weit besser zur Topologieerhaltung als Polynome.
 
10
Der Hodges-Lehmann-Schätzer ist ein robuster nichtparametrischer Schätzer für symmetrische Verteilungen, z. B. zur Schätzung des Medians von m × n Differenzen der Datenpunkte einer Verteilung [13].
 
11
Bei der Berechnung der Stichprobenvarianz oder Berechnungen aus Teilen der Grundgesamtheit gilt statt σ das Formelzeichen s.
 
12
Siehe dazu: Der Bruchpunkt von Schätzern, Universität der Bundeswehr [5].
 
13
In Abschn. 12.3.4 ist die Füllwertmethode zur Glättung der MF beschrieben.
 
14
Referenzskala zur Zuordnung der Trainingsdatenpunkte TPi in Abschn. 4.​4, 12.2.2, 10.​3.​2 und Abb. 12.18.
 
15
In der Literatur wird die Anzahl der erforderlichen Dimensionen anhand der Größe der Eigenwerte entschieden. Dieser Sachverhalt wird in Abschn. 10.​7.​6 erörtert.
 
Literature
2.
go back to reference Backhaus K, Erichson B, Plinke W, Weiber R (2005) Multivariate Analysemethoden. 11. Auflage Springer, Berlin, Heidelberg, New YorkMATH Backhaus K, Erichson B, Plinke W, Weiber R (2005) Multivariate Analysemethoden. 11. Auflage Springer, Berlin, Heidelberg, New YorkMATH
3.
go back to reference Breuer D (2014) Abstandsmaße für die multivariate adaptive Einbettung. Masterarbeit, FernUni Hagen Breuer D (2014) Abstandsmaße für die multivariate adaptive Einbettung. Masterarbeit, FernUni Hagen
4.
go back to reference Bronstein IN, Semendjajew KA, Musiol G, Mühlig H (1999) Taschenbuch der Mathematik, 4th edn. Verlag Harri Deutsch, Frankfurt am Main and ThunMATH Bronstein IN, Semendjajew KA, Musiol G, Mühlig H (1999) Taschenbuch der Mathematik, 4th edn. Verlag Harri Deutsch, Frankfurt am Main and ThunMATH
6.
go back to reference Diehl JM, Kohr H (2004) Deskriptive Statistik.13. Auflage, ISBN 3-88074-110-. Verlag Dietmar Klotz, Eschborn Diehl JM, Kohr H (2004) Deskriptive Statistik.13. Auflage, ISBN 3-88074-110-. Verlag Dietmar Klotz, Eschborn
7.
go back to reference Faloutsos C (1996) Searching Multimedia Databases by Content. Kluwer Academic Publishers, DordrechtCrossRef Faloutsos C (1996) Searching Multimedia Databases by Content. Kluwer Academic Publishers, DordrechtCrossRef
8.
go back to reference Gottwald S, Köstner H, Hullwich M (1986) Handbuch der Mathematik. VEB Bibligraphisches Institut, Leipzig Gottwald S, Köstner H, Hullwich M (1986) Handbuch der Mathematik. VEB Bibligraphisches Institut, Leipzig
9.
go back to reference Kriegel HP, Kroger P, Schubert E, Zimek A (2011) Interpreting and Unifying Outlier Scores. In: Liu B, Liu H, Clifton CW, Washio T, Kamath C (eds) Proceedings of the 2011 SIAM International Conference on Data Mining, [Society for Industrial and Applied Mathematics], [Philadelphia, Pennsylvania], pp 13–24, https://doi.org/10.1137/1.9781611972818.2 Kriegel HP, Kroger P, Schubert E, Zimek A (2011) Interpreting and Unifying Outlier Scores. In: Liu B, Liu H, Clifton CW, Washio T, Kamath C (eds) Proceedings of the 2011 SIAM International Conference on Data Mining, [Society for Industrial and Applied Mathematics], [Philadelphia, Pennsylvania], pp 13–24, https://​doi.​org/​10.​1137/​1.​9781611972818.​2
10.
go back to reference Mildenberger O (1995) System- und Signaltheorie, 3rd edn. Friedr. Vieweg & Sohn Verlagsgesellschaft GmbH, Braunschweig, WiesbadenCrossRef Mildenberger O (1995) System- und Signaltheorie, 3rd edn. Friedr. Vieweg & Sohn Verlagsgesellschaft GmbH, Braunschweig, WiesbadenCrossRef
11.
go back to reference Patzelt R (1996) Elektrische Meßtechnik. Springer-Verlag, Wien, New York Patzelt R (1996) Elektrische Meßtechnik. Springer-Verlag, Wien, New York
12.
go back to reference Pfeifer T, Profos P (2008) Handbuch der industriellen Messtechnik. Oldenbourg Industrieverlag Pfeifer T, Profos P (2008) Handbuch der industriellen Messtechnik. Oldenbourg Industrieverlag
14.
go back to reference Sartorius G (2009) Multivariate Adaption mit modularisierten künstlichen neuronalen Netzen: Zugl.: Hagen, Fernuniv., Fachbereich Elektrotechnik, Diss., 2009, Fortschritt-Berichte VDI Reihe 10, Informatik/Kommunikation, vol 799, als ms. gedr edn. VDI-Verl., Düsseldorf Sartorius G (2009) Multivariate Adaption mit modularisierten künstlichen neuronalen Netzen: Zugl.: Hagen, Fernuniv., Fachbereich Elektrotechnik, Diss., 2009, Fortschritt-Berichte VDI Reihe 10, Informatik/Kommunikation, vol 799, als ms. gedr edn. VDI-Verl., Düsseldorf
Metadata
Title
Datenvorverarbeitung
Author
Gerhard Sartorius
Copyright Year
2019
DOI
https://doi.org/10.1007/978-3-658-23576-5_12