Top

Published in:

2019 | OriginalPaper | Chapter

21. Baumbasierte Verfahren

Author : Sebastian Sauer

Published in: Moderne Datenanalyse mit R

Publisher: Springer Fachmedien Wiesbaden

Activate our intelligent search to find suitable subject content or patents.

search-config

AI-assisted search

Off

Zusammenfassung

In diesem Kapitel werden einige Varianten sog. „baumbasierter Verfahren“ vorgestellt. Als erster Vertreter werden Entscheidungsbäume diskutiert, gefolgt von einer kurzen Darstellung von Bagging-Modellen und dann, ausführlicher, von Random-Forest-Modellen. Da Entscheidungsbäume die konzeptionelle Grundlage dieser Familie stellen, erörtern wir diese Modelle relativ detailliert. Schließlich werden noch Vor- und Nachteile dieser Modellfamilie einander gegenübergestellt. Zum Abschluss bestimmen Sie die Relevanz von Prädiktoren bei diesen Modellen.

Dont have a licence yet? Then find out more about our products and how to get one now:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

inform now

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 390 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Maschinenbau + Werkstoffe

Jetzt Wissensvorsprung sichern!

inform now

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

inform now

previous chapter Fallstudie: Titanic

next chapter Fallstudie: Kreditwürdigkeit mit caret

Z. B. mit tally(~is_halodrie, data = train_df, format = ″percent″); der Anteil der häufigsten Kategorie ist die Vorhersage des Nullmodells.

https://topepo.github.io/caret/train-models-by-tag.html#bagging.

Man könnte ntree daher eher als Schokoladenparameter bezeichnen: Eine gewisse Menge wünscht man sich, aber mehr bringt keinen Zusatznutzen; randomforest und damit caret als Schnittstelle zu randomforest nimmt ntree = 500 als Standard, vgl. ?randomForest.

Vgl. Abschn. 21.1.2.

baum2a <- rpart(is_halodrie ~ rating + age, data = train_df); plot(as.party(baum2a)); es resultiert ein anderer Baum. Interessant ist, dass die Variable age mehr als einmal in den Baum einging, wie im baum2 auch.

Z. B. so: baum2a[[″control″]].

baum2a[[″variable.importance″]].

train(kiterium ~ praediktor, data = meine_daten, method = ″rpart″).

Ja.

Nein; wird die Anzahl der Knoten im Baum zu groß, so sinkt die Modellgüte im Test-Sample wieder.

Nein; in der Regel sind viel kleinere Werte besser. Als Faustregel kann man mit \(\sqrt{(k)}\) beginnen, wobei \(k\) die Anzahl der Prädiktoren im Modell bezeichnet.

Ca. 50 Prozentpunkte; s. Abb. 21.3 im Vergleich von Knoten 6 und Knoten 7. In Abb. 21.2 kennzeichnet das linke, mittlere Rechteck (sowohl bei Männern als auch bei Frauen) diesen Unterschied (also Menschen mit geringer Ehezufriedenheit und mittlerem Alter).

Title: Baumbasierte Verfahren
Author: Sebastian Sauer
Publisher: Springer Fachmedien Wiesbaden
Book: Moderne Datenanalyse mit R
Print ISBN: 978-3-658-21586-6

Electronic ISBN: 978-3-658-21587-3

Copyright Year: 2019
DOI: https://doi.org/10.1007/978-3-658-21587-3_21

Springer Professional

Zusammenfassung

Please log in to get access to your license.

Dont have a licence yet? Then find out more about our products and how to get one now:

Springer Professional "Wirtschaft+Technik"

Springer Professional "Technik"

Springer Professional "Wirtschaft"