Skip to main content

2019 | OriginalPaper | Buchkapitel

9. Praxisprobleme der Datenaufbereitung

verfasst von : Sebastian Sauer

Erschienen in: Moderne Datenanalyse mit R

Verlag: Springer Fachmedien Wiesbaden

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Dieses Kapitel stellt eine Auswahl typischer Probleme vor, auf die man beim Arbeiten mit echten Datensätzen immer wieder trifft. Dazu gehören der Umgang mit fehlenden Werten genauso wie das Umkodieren von Werten oder das Zusammenfassen von Zeilen eines Dataframes zu einem Wert.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
fortunes::fortune(52).
 
2
mosaic::inspect() oder skimr::skim() bieten sich an.
 
3
Prägnanter geht es so: sum(is.na(stats_test$self_eval)).
 
4
sum(is.na(stats_test$score)).
 
5
extra %>% select(i01:i10) %>% filter(complete.cases(.)) %>% nrow.
 
6
Sie ist quadratisch, auf der Hauptdiagonalen steht NA, und gespiegelt an der Hauptdiagonalen, d. h., das obere Dreieck der Matrix ist redundant.
 
7
head(extra).
 
8
Es gibt auch weniger schöne Wege, um Spalten umzubenennen: names(stats_test)[names(stats_test) == ″​bestanden″​] <- ″​jippiejey″​.
 
9
ggplot2 muss geladen sein; wenn man tidyverse lädt, wird ggplot2 automatisch auch geladen.
 
10
Allerdings gibt es Pakete mit diesem Befehl, z. B. miscTools.
 
11
F, R, F, F, F, R, F, F, F, R, R, R.
 
Metadaten
Titel
Praxisprobleme der Datenaufbereitung
verfasst von
Sebastian Sauer
Copyright-Jahr
2019
DOI
https://doi.org/10.1007/978-3-658-21587-3_9