Skip to main content
Top

Hint

Swipe to navigate through the chapters of this book

2017 | OriginalPaper | Chapter

9. Methoden des maschinellen Lernens und der Computational Intelligence zur Auswertung heterogener Daten in der digitalen Forensik

Authors : Dr. Tina Geweniger, Dr. rer. nat. Marika Kaden, Prof. Dr. rer. nat. habil. Thomas Villmann

Published in: Forensik in der digitalen Welt

Publisher: Springer Berlin Heidelberg

share
SHARE

Zusammenfassung

In diesem Beitrag werden aktuelle Methoden der angewandten Datenanalyse zum Clustern und Klassifizieren vorgestellt. Das automatische Klassifizieren und Clustern von großen Datenmengen von zum Teil heterogenen Datenstrukturen ist ein zentrales Thema in vielen Bereichen der Forensik. Daher sollen hier neuere Methoden der Computational Intelligence zu diesem Problemfeld vorgestellt werden, welche sich als robuste und intuitive Verfahren herausgestellt haben. Dabei wird auf leicht interpretierbare Modelle Wert gelegt. Insbesondere liegt der Fokus auf sogenannten prototypbasierten Modellen der Vektorquantisierung. Ausgehend von einer kurzen Thematisierung des Begriffs der mathematischen Ähnlichkeit von Datenobjekten, werden verschiedene adaptive Verfahren vorgestellt, denen aber einige wenige Prinzipien und Heuristiken zu Grunde liegen. Das betrifft das Stellvertreterprinzip für Daten durch repräsentative Prototypen sowie die robuste Anpassungsfähigkeit der Modelle auf der Basis mathematisch verifizierter Algorithmen. Der Beitrag vermittelt dazu einen einführenden Überblick.

To get access to this content you need the following product:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 69.000 Bücher
  • über 500 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt 90 Tage mit der neuen Mini-Lizenz testen!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 50.000 Bücher
  • über 380 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe



 


Jetzt 90 Tage mit der neuen Mini-Lizenz testen!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 58.000 Bücher
  • über 300 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko





Jetzt 90 Tage mit der neuen Mini-Lizenz testen!

Footnotes
1
Eine für nichtkommerzielle Zwecke freie MATLAB\(\circledR\)-Toolbox für SOMs ist verfügbar [27, 50].
 
2
Testdaten sind hier nicht im Sinne einer Modellvalidierung zu verstehen, sondern als zu bearbeitende Daten im Anwendungsfall.
 
Literature
1.
go back to reference Ball, G., Hall, D.: Isodata an iterative method of multivariate data analysis and pattern classification (1965) Ball, G., Hall, D.: Isodata an iterative method of multivariate data analysis and pattern classification (1965)
2.
go back to reference Ball, G.H., Hall, D.J.: A clustering technique for summarizing multivariate data. Behavioral Science 12(2), 153–155 (1967) CrossRefPubMed Ball, G.H., Hall, D.J.: A clustering technique for summarizing multivariate data. Behavioral Science 12(2), 153–155 (1967) CrossRefPubMed
3.
go back to reference Bauer, H.U., Pawelzik, K.R.: Quantifying the neighborhood preservation of Self-Organizing Feature Maps. IEEE Trans. on Neural Networks 3(4), 570–579 (1992) CrossRefPubMed Bauer, H.U., Pawelzik, K.R.: Quantifying the neighborhood preservation of Self-Organizing Feature Maps. IEEE Trans. on Neural Networks 3(4), 570–579 (1992) CrossRefPubMed
4.
go back to reference Becker, P.: Wie big sind die Big Five. Zeitschrift für Differentielle und Diagnostische Psychologie 17(4), 209–221 (1996) Becker, P.: Wie big sind die Big Five. Zeitschrift für Differentielle und Diagnostische Psychologie 17(4), 209–221 (1996)
5.
go back to reference Bezdek, J.: A convergence theorem for the fuzzy isodata clustering algorithms. IEEE Transactions on Pattern Analysis and Machine Intelligence 2(1), 1–8 (1980) CrossRefPubMed Bezdek, J.: A convergence theorem for the fuzzy isodata clustering algorithms. IEEE Transactions on Pattern Analysis and Machine Intelligence 2(1), 1–8 (1980) CrossRefPubMed
6.
7.
go back to reference Bishop, C.: Pattern Recognition and Machine Learning. Springer Science+Business Media, LLC, New York, NY (2006) Bishop, C.: Pattern Recognition and Machine Learning. Springer Science+Business Media, LLC, New York, NY (2006)
8.
go back to reference Borkenau, P., Ostendorf, F.: Untersuchung zum Fünf-Faktorenmodell der Persönlichkeit und seiner diagnostischen Erfassung. Zeitschrift für Differentielle und Diagnostische Psychologie 10(4), 239–251 (1989) Borkenau, P., Ostendorf, F.: Untersuchung zum Fünf-Faktorenmodell der Persönlichkeit und seiner diagnostischen Erfassung. Zeitschrift für Differentielle und Diagnostische Psychologie 10(4), 239–251 (1989)
9.
go back to reference Cilibrasi, R., Vitányi, P.: Clustering by compression. IEEE Transactions on Information Theory 51(4), 1523–1545 (2005) CrossRef Cilibrasi, R., Vitányi, P.: Clustering by compression. IEEE Transactions on Information Theory 51(4), 1523–1545 (2005) CrossRef
10.
go back to reference Cottrell, M., Hammer, B., Hasenfuss, A., Villmann, T.: Batch and median neural gas. Neural Networks 19, 762–771 (2006) CrossRefPubMed Cottrell, M., Hammer, B., Hasenfuss, A., Villmann, T.: Batch and median neural gas. Neural Networks 19, 762–771 (2006) CrossRefPubMed
11.
go back to reference Duda, R., Hart, P.: Pattern Classification and Scene Analysis. Wiley, New York (1973) Duda, R., Hart, P.: Pattern Classification and Scene Analysis. Wiley, New York (1973)
12.
go back to reference Dunn, J.C.: A fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters. Journal of Cybernetics 3(3), 32–57 (1973). doi: 10.1080/01969727308546046 CrossRef Dunn, J.C.: A fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters. Journal of Cybernetics 3(3), 32–57 (1973). doi: 10.1080/01969727308546046 CrossRef
14.
go back to reference Frey, B.J., Dueck, D.: Clustering by passing messages between data points. Science 315, 972–976 (2007) CrossRefPubMed Frey, B.J., Dueck, D.: Clustering by passing messages between data points. Science 315, 972–976 (2007) CrossRefPubMed
17.
go back to reference Hammer, B., Villmann, T.: Generalized relevance learning vector quantization. Neural Networks 15(8–9), 1059–1068 (2002) CrossRefPubMed Hammer, B., Villmann, T.: Generalized relevance learning vector quantization. Neural Networks 15(8–9), 1059–1068 (2002) CrossRefPubMed
18.
go back to reference Hathaway, R., Bezdek, J.: Local convergence of the fuzzy c-means algorithm. Pattern recognition 19(6), 477–480 (1986) CrossRef Hathaway, R., Bezdek, J.: Local convergence of the fuzzy c-means algorithm. Pattern recognition 19(6), 477–480 (1986) CrossRef
19.
go back to reference Haykin, S.: Neural Networks - A Comprehensive Foundation. IEEE Press, New York (1994) Haykin, S.: Neural Networks - A Comprehensive Foundation. IEEE Press, New York (1994)
20.
go back to reference Heskes, T.: Energy functions for self-organizing maps. In: Oja, E., Kaski, S. (Hrsg.) Kohonen Maps, S. 303–316. Elsevier, Amsterdam (1999) CrossRef Heskes, T.: Energy functions for self-organizing maps. In: Oja, E., Kaski, S. (Hrsg.) Kohonen Maps, S. 303–316. Elsevier, Amsterdam (1999) CrossRef
21.
go back to reference Kacprzyk, J., Pedrycz, W. (Hrsg.): Springer Handbook of Computational Intelligence. Springer, Dordrecht, Heidelberg (2014) Kacprzyk, J., Pedrycz, W. (Hrsg.): Springer Handbook of Computational Intelligence. Springer, Dordrecht, Heidelberg (2014)
22.
go back to reference Kaden, M., Riedel., M., Hermann, W., Villmann, T.: Border-sensitive learning in generalized learning vector quantization: an alternative to support vector machines. Soft Computing, S. in press (2015) Kaden, M., Riedel., M., Hermann, W., Villmann, T.: Border-sensitive learning in generalized learning vector quantization: an alternative to support vector machines. Soft Computing, S. in press (2015)
23.
go back to reference Kästner, M., Villmann, T.: Fuzzy supervised self-organizing map for semi-supervised vector quantization. In: Rutkowski, L., Korytkowski, M., Scherer, R., Tadeusiewicz, R., Zadeh, L., Zurada, J. (Hrsg.) Artificial Intelligence and Soft Computing, Lecture Notes in Computer Science, Bd. 7267, S. 256–265. Springer Berlin Heidelberg (2012) CrossRef Kästner, M., Villmann, T.: Fuzzy supervised self-organizing map for semi-supervised vector quantization. In: Rutkowski, L., Korytkowski, M., Scherer, R., Tadeusiewicz, R., Zadeh, L., Zurada, J. (Hrsg.) Artificial Intelligence and Soft Computing, Lecture Notes in Computer Science, Bd. 7267, S. 256–265. Springer Berlin Heidelberg (2012) CrossRef
24.
go back to reference Kiviluoto, K.: Topology preservation in self-organizing maps. In: ICNN 96. The 1996 IEEE International Conference on Neural Networks, Bd. 1, S. 294–9. IEEE, New York, NY, USA (1996) Kiviluoto, K.: Topology preservation in self-organizing maps. In: ICNN 96. The 1996 IEEE International Conference on Neural Networks, Bd. 1, S. 294–9. IEEE, New York, NY, USA (1996)
25.
go back to reference Kohonen, T.: Self-Organization and Associative Memory, Springer Series in Information Sciences, Bd. 8. Springer, Berlin, Heidelberg (1984). 3. Aufl. 1989. Kohonen, T.: Self-Organization and Associative Memory, Springer Series in Information Sciences, Bd. 8. Springer, Berlin, Heidelberg (1984). 3. Aufl. 1989.
26.
go back to reference Kohonen, T.: Self-Organizing Maps, Springer Series in Information Sciences, Bd. 30. Springer, Berlin, Heidelberg (1995). (2. erweiterte Aufl. 1997). Kohonen, T.: Self-Organizing Maps, Springer Series in Information Sciences, Bd. 30. Springer, Berlin, Heidelberg (1995). (2. erweiterte Aufl. 1997).
27.
go back to reference Kohonen, T.: MATLAB Implementations and Applications of the Self-Organizing Map. Unigrafia Oy, Helsinki, Finland (2014) Kohonen, T.: MATLAB Implementations and Applications of the Self-Organizing Map. Unigrafia Oy, Helsinki, Finland (2014)
28.
go back to reference Kolmogorov, A.: On tables of random numbers. Sankhya: The Indian Journal of Statistics. Ser. A 25, 369–375 (1963) Kolmogorov, A.: On tables of random numbers. Sankhya: The Indian Journal of Statistics. Ser. A 25, 369–375 (1963)
29.
go back to reference Läuter, H., Pincus, R.: Mathematisch-statistische Datenanalyse. Akademie-Verlag (1989) Läuter, H., Pincus, R.: Mathematisch-statistische Datenanalyse. Akademie-Verlag (1989)
30.
go back to reference Levenshtein, V.: Binary codes capable of correcting deletions, insertions, and reversals. Doklady Akademii Nauk SSSR 163(4), 845–848 (1965) Levenshtein, V.: Binary codes capable of correcting deletions, insertions, and reversals. Doklady Akademii Nauk SSSR 163(4), 845–848 (1965)
31.
go back to reference Lowe, D.: Object recognition from local scale-invariant features. In: The Proceedings of the Seventh IEEE International Conference on Computer Vision, Bd. 2, S. 1150–1157 (1999) Lowe, D.: Object recognition from local scale-invariant features. In: The Proceedings of the Seventh IEEE International Conference on Computer Vision, Bd. 2, S. 1150–1157 (1999)
32.
go back to reference Lowe, D.: Distinctive image features from scale-invariant keypoints. International Journal of Computer Vision 60(2), 91–110 (2004) CrossRef Lowe, D.: Distinctive image features from scale-invariant keypoints. International Journal of Computer Vision 60(2), 91–110 (2004) CrossRef
33.
go back to reference Maltoni, D., Maio, D., Jain, A., Prabhakar, S.: Handbook of Fingerprint Recognition. Springer, Berlin-Heidelberg (2009) CrossRef Maltoni, D., Maio, D., Jain, A., Prabhakar, S.: Handbook of Fingerprint Recognition. Springer, Berlin-Heidelberg (2009) CrossRef
34.
go back to reference Martinetz, T.M., Berkovich, S.G., Schulten, K.J.: ‘‘neural-gas’’ network for vector quantization and its application to time-series prediction. IEEE Transactions on Neural Networks 4(4), 558–569 (1993) CrossRefPubMed Martinetz, T.M., Berkovich, S.G., Schulten, K.J.: ‘‘neural-gas’’ network for vector quantization and its application to time-series prediction. IEEE Transactions on Neural Networks 4(4), 558–569 (1993) CrossRefPubMed
35.
go back to reference Mergenthaler, E.: Emotions-Abstraktionsmuster in Verbatimprotokollen. Verlag für Akademische Schriften, Frankfurt (1997) Mergenthaler, E.: Emotions-Abstraktionsmuster in Verbatimprotokollen. Verlag für Akademische Schriften, Frankfurt (1997)
36.
go back to reference Miyamoto, S., Ichihashi, H., Honda, K.: Algorithms for Fuzzy Clustering, Studies in Fuzziness and Soft Computing, Bd. 229. Springer (2008) Miyamoto, S., Ichihashi, H., Honda, K.: Algorithms for Fuzzy Clustering, Studies in Fuzziness and Soft Computing, Bd. 229. Springer (2008)
38.
go back to reference Pekalska, E., Duin, R.: The Dissimilarity Representation for Pattern Recognition: Foundations and Applications. World Scientific (2006) Pekalska, E., Duin, R.: The Dissimilarity Representation for Pattern Recognition: Foundations and Applications. World Scientific (2006)
40.
go back to reference Rissanen, J.: Modeling by shortest data description. Automatica 14, 149–162 (1978) CrossRef Rissanen, J.: Modeling by shortest data description. Automatica 14, 149–162 (1978) CrossRef
42.
go back to reference Salton, G., McGill, M.: Introduction to modern information retrieval. McGraw-Hill, New York (1983) Salton, G., McGill, M.: Introduction to modern information retrieval. McGraw-Hill, New York (1983)
43.
go back to reference Sato, A.S., Yamada, K.: Generalized learning vector quantization. In: G. Tesauro, D. Touretzky, T. Leen (Hrsg.) Advances in Neural Information Processing Systems, Bd. 7, S. 423–429. MIT Press (1995) Sato, A.S., Yamada, K.: Generalized learning vector quantization. In: G. Tesauro, D. Touretzky, T. Leen (Hrsg.) Advances in Neural Information Processing Systems, Bd. 7, S. 423–429. MIT Press (1995)
44.
go back to reference Schneider, P., Hammer, B., Biehl, M.: Adaptive relevance matrices in learning vector quantization. Neural Computation 21, 3532–3561 (2009) CrossRefPubMed Schneider, P., Hammer, B., Biehl, M.: Adaptive relevance matrices in learning vector quantization. Neural Computation 21, 3532–3561 (2009) CrossRefPubMed
45.
go back to reference Schneider, P., Schleif, F.M., Villmann, T., Biehl, M.: Generalized matrix learning vector quantizer for the analysis of spectral data. In: Verleysen, M. (Hrsg.) Proc. Of European Symposium on Artificial Neural Networks (ESANN’2008), S. 451–456. d-side publications, Evere, Belgium (2008) Schneider, P., Schleif, F.M., Villmann, T., Biehl, M.: Generalized matrix learning vector quantizer for the analysis of spectral data. In: Verleysen, M. (Hrsg.) Proc. Of European Symposium on Artificial Neural Networks (ESANN’2008), S. 451–456. d-side publications, Evere, Belgium (2008)
46.
go back to reference Schölkopf, B., Smola, A.: Learning with Kernels. MIT Press (2002) Schölkopf, B., Smola, A.: Learning with Kernels. MIT Press (2002)
47.
go back to reference Seo, S., Obermayer, K.: Soft learning vector quantization. Neural Computation 15, 1589–1604 (2003) CrossRefPubMed Seo, S., Obermayer, K.: Soft learning vector quantization. Neural Computation 15, 1589–1604 (2003) CrossRefPubMed
48.
go back to reference Vesanto, J.: Som-based data visualization methods. Intelligent Data Analysis 3, 111–26 (1999) CrossRef Vesanto, J.: Som-based data visualization methods. Intelligent Data Analysis 3, 111–26 (1999) CrossRef
49.
go back to reference Vesanto, J., Alhoniemi, E.: Clustering of the self-organizing map. IEEE Transaction on Neural Networks 11(3), 586–600 (2000) CrossRefPubMed Vesanto, J., Alhoniemi, E.: Clustering of the self-organizing map. IEEE Transaction on Neural Networks 11(3), 586–600 (2000) CrossRefPubMed
50.
go back to reference Vesanto, J., Alhoniemi, E., Himberg, J., Kiviluoto, K., Parviainen, J.: Self-organizing map for data mining in matlab: The som toolbox. Simulation News Europe (25), 54 (1999) Vesanto, J., Alhoniemi, E., Himberg, J., Kiviluoto, K., Parviainen, J.: Self-organizing map for data mining in matlab: The som toolbox. Simulation News Europe (25), 54 (1999)
51.
go back to reference Villmann, T., Der, R., Herrmann, M., Martinetz, T.M.: Topology preservation in self-organizing feature maps: exact definition and measurement. IEEE Transactions on Neural Networks 8(2), 256–266 (1997) CrossRefPubMed Villmann, T., Der, R., Herrmann, M., Martinetz, T.M.: Topology preservation in self-organizing feature maps: exact definition and measurement. IEEE Transactions on Neural Networks 8(2), 256–266 (1997) CrossRefPubMed
52.
go back to reference Villmann, T., Hammer, B., Biehl, M.: Some theoretical aspects of the neural gas vector quantizer. In: M. Biehl, B. Hammer, M. Verleysen, T. Villmann (Hrsg.) Similarity-based Clustering, LNAI, Bd. 5400, S. 23–34. Springer, Berlin (2009) CrossRef Villmann, T., Hammer, B., Biehl, M.: Some theoretical aspects of the neural gas vector quantizer. In: M. Biehl, B. Hammer, M. Verleysen, T. Villmann (Hrsg.) Similarity-based Clustering, LNAI, Bd. 5400, S. 23–34. Springer, Berlin (2009) CrossRef
53.
go back to reference Villmann, T., Seiffert, U., Schleif, F.M., Brüß, C., Geweniger, T., Hammer, B.: Fuzzy labeled self-organizing map with label-adjusted prototypes. In: Schwenker, F., Marinai, S. (Hrsg.) Proceedings of Conference Artificial Neural Networks in Pattern Recognition (ANNPR) 2006, Ulm, Germany, LNAI 4087, S. 46–56. Springer (2006) Villmann, T., Seiffert, U., Schleif, F.M., Brüß, C., Geweniger, T., Hammer, B.: Fuzzy labeled self-organizing map with label-adjusted prototypes. In: Schwenker, F., Marinai, S. (Hrsg.) Proceedings of Conference Artificial Neural Networks in Pattern Recognition (ANNPR) 2006, Ulm, Germany, LNAI 4087, S. 46–56. Springer (2006)
54.
go back to reference Watson, J., Crick, F.: Molecular structure of nucleic acids. a structure for deoxyribose nucleic acid. Nature 171(4356), 737–738 (1953) CrossRefPubMed Watson, J., Crick, F.: Molecular structure of nucleic acids. a structure for deoxyribose nucleic acid. Nature 171(4356), 737–738 (1953) CrossRefPubMed
55.
go back to reference Ziv, J., Lempel, A.: Compression of individual sequences via variable-rate coding. IEEE Transactions on Information Theory 24(5), 530–536 (1978) CrossRef Ziv, J., Lempel, A.: Compression of individual sequences via variable-rate coding. IEEE Transactions on Information Theory 24(5), 530–536 (1978) CrossRef
56.
go back to reference Zühlke, D.: Vector quantization based learning algorithms for mixed data types and their application in cognitive support systems for biomedical research. Ph.D. thesis, University Groningen, Johann-Bernoulli-Institute for Mathematics and Computer Sciences (2012) Zühlke, D.: Vector quantization based learning algorithms for mixed data types and their application in cognitive support systems for biomedical research. Ph.D. thesis, University Groningen, Johann-Bernoulli-Institute for Mathematics and Computer Sciences (2012)
Metadata
Title
Methoden des maschinellen Lernens und der Computational Intelligence zur Auswertung heterogener Daten in der digitalen Forensik
Authors
Dr. Tina Geweniger
Dr. rer. nat. Marika Kaden
Prof. Dr. rer. nat. habil. Thomas Villmann
Copyright Year
2017
Publisher
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/978-3-662-53801-2_9

Premium Partner