Skip to main content

2011 | OriginalPaper | Buchkapitel

4. Learning Multivariate Correlations in Data

verfasst von : Boris Mirkin

Erschienen in: Core Concepts in Data Analysis: Summarization, Correlation and Visualization

Verlag: Springer London

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

After a short introduction of the general concept of decision rule to relate input and target features, this chapter describes most popular methods for decision rule building. Two of them pertain to quantitative targets (linear regression, neural network), and four to categorical ones (linear discrimination, support vector machine, naïve Bayes classifier and classification tree). Of these, classification trees are treated in a most detailed way including a number of theoretical results that are not well known. These establish firm relations between popular scoring functions and, first, bivariate measures described in Chapter 3– Quetelet indexes in contingency tables, first of all – and, second, normalization options for dummy variables representing target categories. Some related concepts such as Bayes decision rule, bag-of-word model in text analysis, VC-complexity and kernel for non-linear classification are introduced too.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
Zurück zum Zitat Breiman, L., Friedman, J.H., Olshen, R.A., Stone, C.J.: Classification and Regression Trees. Wadswarth, Belmont, CA (1984)MATH Breiman, L., Friedman, J.H., Olshen, R.A., Stone, C.J.: Classification and Regression Trees. Wadswarth, Belmont, CA (1984)MATH
Zurück zum Zitat Bring, J.: How to standardize regression coefficients. Am. Stat. 48(3), 209–213 (1994) Bring, J.: How to standardize regression coefficients. Am. Stat. 48(3), 209–213 (1994)
Zurück zum Zitat Cybenko, G.: Approximation by superposition of sigmoidal functions. Math. Control Signals Systems 2(4), 303–314 (1989) Cybenko, G.: Approximation by superposition of sigmoidal functions. Math. Control Signals Systems 2(4), 303–314 (1989)
Zurück zum Zitat Duda, R.O., Hart, P.E., Stork D.G.: Pattern Classification. Wiley-Interscience, New York, NY, ISBN 0-471-05669-3 (2001)MATH Duda, R.O., Hart, P.E., Stork D.G.: Pattern Classification. Wiley-Interscience, New York, NY, ISBN 0-471-05669-3 (2001)MATH
Zurück zum Zitat Esposito, F., Malerba, D., Semeraro, G.: A comparative analysis of methods for pruning decision trees. IEEE Trans. Pattern Anal.Mach. Intell. 19(5), 476–491 (1997)CrossRef Esposito, F., Malerba, D., Semeraro, G.: A comparative analysis of methods for pruning decision trees. IEEE Trans. Pattern Anal.Mach. Intell. 19(5), 476–491 (1997)CrossRef
Zurück zum Zitat Fawcett, T.: An introduction to ROC analysis. Pattern Recognition Letters 27, 861–874 (2006)CrossRef Fawcett, T.: An introduction to ROC analysis. Pattern Recognition Letters 27, 861–874 (2006)CrossRef
Zurück zum Zitat Fisher, R.A.: The use of multiple measurements in taxonomic problems. Annu. Eugen. 7, Part II, 179–188 (1936); also in “Contributions to Mathematical Statistics” (Wiley, New York, NY, 1950) Fisher, R.A.: The use of multiple measurements in taxonomic problems. Annu. Eugen. 7, Part II, 179–188 (1936); also in “Contributions to Mathematical Statistics” (Wiley, New York, NY, 1950)
Zurück zum Zitat Fisher, D.H.: Knowledge acquisition via incremental conceptual clustering. Machine Learning, 2, 139–172 (1987) Fisher, D.H.: Knowledge acquisition via incremental conceptual clustering. Machine Learning, 2, 139–172 (1987)
Zurück zum Zitat Green, S.B., Salkind, N.J.: Using SPSS for the Windows and Mackintosh: Analyzing and Understanding Data. Prentice Hall, Upper Saddle River, NJ (2003) Green, S.B., Salkind, N.J.: Using SPSS for the Windows and Mackintosh: Analyzing and Understanding Data. Prentice Hall, Upper Saddle River, NJ (2003)
Zurück zum Zitat Groenen, P.J.F., Nalbantov, G.I., Bioch, J.C.: SVM-Maj: A majorization approach to linear support vector machines with different hinge errors. Adv. Data Anal. Classification 2(1), 17–43 (2008) Groenen, P.J.F., Nalbantov, G.I., Bioch, J.C.: SVM-Maj: A majorization approach to linear support vector machines with different hinge errors. Adv. Data Anal. Classification 2(1), 17–43 (2008)
Zurück zum Zitat Grünwald, P.D.: The Minimum Description Length Principle, MIT Press (2007) Grünwald, P.D.: The Minimum Description Length Principle, MIT Press (2007)
Zurück zum Zitat Haykin, S. S.: Neural Networks, 2nd edn. Prentice Hall, ISBN 0132733501 (1999) Haykin, S. S.: Neural Networks, 2nd edn. Prentice Hall, ISBN 0132733501 (1999)
Zurück zum Zitat Loh, W.-Y., Shih, Y.-S.: Split selection methods for classification trees. Stat. Sin. 7, 815–840 (1997) Loh, W.-Y., Shih, Y.-S.: Split selection methods for classification trees. Stat. Sin. 7, 815–840 (1997)
Zurück zum Zitat Manning, C.D., Raghavan, P., Schütze, H.: Introduction to Information Retrieval. Cambridge University Press, Cambridge, England (2008)MATHCrossRef Manning, C.D., Raghavan, P., Schütze, H.: Introduction to Information Retrieval. Cambridge University Press, Cambridge, England (2008)MATHCrossRef
Zurück zum Zitat Mirkin, B.: Methods for Grouping in Socioeconomic Research. Finansy i Statistika Publishers, Moscow (in Russian) (1985) Mirkin, B.: Methods for Grouping in Socioeconomic Research. Finansy i Statistika Publishers, Moscow (in Russian) (1985)
Zurück zum Zitat Mirkin, B.: Mathematical Classification and Clustering. Kluwer Academic Press, Dordrecht/Boston (1996) Mirkin, B.: Mathematical Classification and Clustering. Kluwer Academic Press, Dordrecht/Boston (1996)
Zurück zum Zitat Mirkin, B.: Clustering for Data Mining: A Data Recovery Approach. Chapman & Hall/CRC, London, ISBN 1-58488-534-3 (2005)MATHCrossRef Mirkin, B.: Clustering for Data Mining: A Data Recovery Approach. Chapman & Hall/CRC, London, ISBN 1-58488-534-3 (2005)MATHCrossRef
Zurück zum Zitat Mitchell, T.M.: Machine Learning. McGraw Hill, New York, NY (2010) Mitchell, T.M.: Machine Learning. McGraw Hill, New York, NY (2010)
Zurück zum Zitat Polyak, B.: Introduction to Optimization. Optimization Software, Los Angeles, CA, ISBN: 0911575146 (1987) Polyak, B.: Introduction to Optimization. Optimization Software, Los Angeles, CA, ISBN: 0911575146 (1987)
Zurück zum Zitat Quinlan, J.R.: C4.5: Programs for Machine Learning. Morgan Kaufmann, San Mateo, CA (1993) Quinlan, J.R.: C4.5: Programs for Machine Learning. Morgan Kaufmann, San Mateo, CA (1993)
Zurück zum Zitat Schölkopf, B., A.J. Smola, A.J.: (2005) Learning with Kernels. The MIT Press, Cambridge, MA (2005) Schölkopf, B., A.J. Smola, A.J.: (2005) Learning with Kernels. The MIT Press, Cambridge, MA (2005)
Zurück zum Zitat Vapnik, V.: Estimation of Dependences Based on Empirical Data, 2d edn. Springer Science + Business Media Inc. (2006) Vapnik, V.: Estimation of Dependences Based on Empirical Data, 2d edn. Springer Science + Business Media Inc. (2006)
Metadaten
Titel
Learning Multivariate Correlations in Data
verfasst von
Boris Mirkin
Copyright-Jahr
2011
Verlag
Springer London
DOI
https://doi.org/10.1007/978-0-85729-287-2_4