Skip to main content
Erschienen in: HMD Praxis der Wirtschaftsinformatik 4/2014

01.08.2014

Fehlende Daten beim Data-Mining

verfasst von: Dieter William Joenssen, Thomas Müllerleile

Erschienen in: HMD Praxis der Wirtschaftsinformatik | Ausgabe 4/2014

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Der Beitrag zeigt, in welchem Schritt der Analyse von großen Datenmengen die Behandlung von fehlenden Daten stattfindet und warum ein angemessener Umgang mit diesen unerlässlich ist. Vorgestellt werden zudem Methoden zum Umgang mit fehlenden Werten, die sich insbesondere im Kontext von Data-Mining eignen, da hier die Komplexität der Algorithmen eine übergeordnete Rolle spielt. Abgerundet wird der Beitrag mit einer Fallstudie, in der die Verfahren auf einen Beispieldatensatz des US Census Bureau angewandt werden, der in ähnlicher Weise oft in CRM-Systemen der betrieblichen Umwelt anzutreffen ist. Thematisiert werden die Auswirkungen der Methoden sowie in der Praxis zu erwartende Herausforderungen.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Weitere Produktempfehlungen anzeigen
Fußnoten
1
Daten des ACS sowie weitere Public-Use-Microdata Datensätze sind unter https://​usa.​ipums.​org/​usa/​ verfügbar.
 
Literatur
Zurück zum Zitat Bankhofer U (1995) Unvollständige Daten- und Distanzmatrizen in der Multivariaten Datenanalyse. Eul, Köln Bankhofer U (1995) Unvollständige Daten- und Distanzmatrizen in der Multivariaten Datenanalyse. Eul, Köln
Zurück zum Zitat Chapman P, Clinton J, Khabaza T, Reinartz T, Wirth R (1999) The CRISP-DM Process Model. CRISP-DM Consortium Chapman P, Clinton J, Khabaza T, Reinartz T, Wirth R (1999) The CRISP-DM Process Model. CRISP-DM Consortium
Zurück zum Zitat Collins L, Schafer J, Kam C (2001) A comparison of inclusive and restrictive strategies in modern missing data procedures. Psychological Methods 6(4):330–351CrossRef Collins L, Schafer J, Kam C (2001) A comparison of inclusive and restrictive strategies in modern missing data procedures. Psychological Methods 6(4):330–351CrossRef
Zurück zum Zitat Enders C (2010) Applied missing data analysis. The Guilford Press, New York Enders C (2010) Applied missing data analysis. The Guilford Press, New York
Zurück zum Zitat Flyvbjerg B (2006) Five misunderstandings about case-study research. Qualitative Inquiry 12(2):219–245CrossRef Flyvbjerg B (2006) Five misunderstandings about case-study research. Qualitative Inquiry 12(2):219–245CrossRef
Zurück zum Zitat Ford B (1983) An overview of hot-deck procedures. In: Madow W, Nisselson H, Olkin I (Hrsg) Incomplete data in sample surveys, vol. 2. Academic Press, New York, S 185–207 Ford B (1983) An overview of hot-deck procedures. In: Madow W, Nisselson H, Olkin I (Hrsg) Incomplete data in sample surveys, vol. 2. Academic Press, New York, S 185–207
Zurück zum Zitat Hippner H, Wilde K (2001) Der Prozess des Data Mining im Marketing. In: Hippner H, Küsters U, Meyer M, Wilde K (Hrsg) Handbuch Data Mining im Marketing. Vieweg, Braunschweig, S 22–91 Hippner H, Wilde K (2001) Der Prozess des Data Mining im Marketing. In: Hippner H, Küsters U, Meyer M, Wilde K (Hrsg) Handbuch Data Mining im Marketing. Vieweg, Braunschweig, S 22–91
Zurück zum Zitat Little R, Rubin D (2002) Statistical analysis with missing data. John Wiley and Sons, New YorkMATH Little R, Rubin D (2002) Statistical analysis with missing data. John Wiley and Sons, New YorkMATH
Zurück zum Zitat Ruggles S, Alexander J, Genadek K, Goeken R, Schroeder M, Sobek M (2010) Integrated public use microdata series: version 5.0 [Machine-readable database]. Minnesota Population Center, Minneapolis Ruggles S, Alexander J, Genadek K, Goeken R, Schroeder M, Sobek M (2010) Integrated public use microdata series: version 5.0 [Machine-readable database]. Minnesota Population Center, Minneapolis
Metadaten
Titel
Fehlende Daten beim Data-Mining
verfasst von
Dieter William Joenssen
Thomas Müllerleile
Publikationsdatum
01.08.2014
Verlag
Springer Fachmedien Wiesbaden
Erschienen in
HMD Praxis der Wirtschaftsinformatik / Ausgabe 4/2014
Print ISSN: 1436-3011
Elektronische ISSN: 2198-2775
DOI
https://doi.org/10.1365/s40702-014-0038-8

Weitere Artikel der Ausgabe 4/2014

HMD Praxis der Wirtschaftsinformatik 4/2014 Zur Ausgabe