Top

Published in:

2024 | OriginalPaper | Chapter

7. Regularisierung

Author : Alexander Jung

Published in: Maschinelles Lernen

Publisher: Springer Nature Singapore

Activate our intelligent search to find suitable subject content or patents.

search-config

AI-assisted search

Off

Zusammenfassung

Viele ML-Methoden verwenden das Prinzip der ERM (siehe Kap. 4), um eine Hypothese aus einem Hypothesenraum zu lernen, indem sie den durchschnittlichen Verlust (Trainingsfehler) auf einer Menge von beschrifteten Datenpunkten (Trainingsset) minimieren.

Dont have a licence yet? Then find out more about our products and how to get one now:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

inform now

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 390 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Maschinenbau + Werkstoffe

Jetzt Wissensvorsprung sichern!

inform now

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

inform now

previous chapter Modellvalidierung und -auswahl

next chapter Clustering

Ein wichtiges Beispiel für eine solche strukturelle Ähnlichkeit im Falle von linearen Prädiktoren \(h^{(t)}(\mathbf{x}) =\big (\mathbf{w}^{(t)} \big )^{T} \mathbf{x}\) liegt vor, wenn die Gewichtsvektoren \(\mathbf{w}^{(T)}\) eine kleine gemeinsame Unterstützung \(\bigcup _{t=1,\ldots ,T} {{\,\mathrm{supp}\,}}( w^{(t)} )\) haben. Die Forderung, dass die Gewichtsvektoren eine kleine gemeinsame Unterstützung haben, entspricht der Forderung, dass der gestapelte Vektor \(\widetilde{\mathbf{w}}=\big (\mathbf{w}^{(1)},\ldots ,\mathbf{w}^{(T)} \big ) \) block- (gruppen-) spärlich ist [12].

O. Chapelle, B. Schölkopf, A. Zien (Hrsg.), Semi-Supervised Learning (The MIT Press, Cambridge, MA, 2006)

R. Caruana, Multitask learning. Mach. Learn. 28(1), 41–75 (1997)MathSciNetCrossRef

M. Wainwright, High-Dimensional Statistics: A Non-Asymptotic Viewpoint (Cambridge University Press, Cambridge, 2019)

P. Bühlmann, S. van de Geer, Statistics for High-Dimensional Data (Springer, New York, 2011)

S. Shalev-Shwartz, S. Ben-David, Understanding Machine Learning—From Theory to Algorithms (Cambridge University Press, Cambridge, 2014)

V.N. Vapnik, The Nature of Statistical Learning Theory (Springer, Berlin, 1999)

S. Boyd, L. Vandenberghe, Convex Optimization (Cambridge University Press, Cambridge, UK, 2004)

D.P. Bertsekas, Nonlinear Programming, 2. Aufl. (Athena Scientific, Belmont, MA, 1999)

T. Hastie, R. Tibshirani, J. Friedman, The Elements of Statistical Learning Springer Series in Statistics. (Springer, New York, 2001)

10.

T. Hastie, R. Tibshirani, M. Wainwright, Statistical Learning with Sparsity: The Lasso and Its Generalizations (CRC Press, Boca Raton, FL, 2015)

11.

A. Jung, A fixed-point of view on gradient methods for big data. Frontiers in Applied Mathematics and Statistics 3, 18 (2017)CrossRef

12.

Y.C. Eldar, P. Kuppinger, H. Bölcskei, Block-sparse signals: Uncertainty relations and efficient recovery. IEEE Trans. Signal Processing 58(6), 3042–3054 (2010). (June)MathSciNetCrossRef

13.

S. Pan, Q. Yang, A survey on transfer learning. IEEE Trans. Knowl. Data Eng. 22(10), 1345–1359 (2010)CrossRef

14.

J. Howard, S. Ruder, Universal language model fine-tuning for text classification, in Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (Association for Computational Linguistics, Stroudsburg, 2018), S. 328–339

Title: Regularisierung
Author: Alexander Jung
Publisher: Springer Nature Singapore
Book: Maschinelles Lernen
Print ISBN: 978-981-9979-71-4

Electronic ISBN: 978-981-9979-72-1

Copyright Year: 2024
DOI: https://doi.org/10.1007/978-981-99-7972-1_7

Springer Professional

Zusammenfassung

Please log in to get access to your license.

Dont have a licence yet? Then find out more about our products and how to get one now:

Springer Professional "Wirtschaft+Technik"

Springer Professional "Technik"

Springer Professional "Wirtschaft"

Premium Partner