Skip to main content

2022 | OriginalPaper | Buchkapitel

17. Wie man unverzerrte Daten generiert

verfasst von : Tobias Bär

Erschienen in: Algorithmic Bias: Verzerrungen durch Algorithmen verstehen und verhindern

Verlag: Springer Berlin Heidelberg

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Ein Motto unserer Zeit könnte lauten: „Daten sind das neue Gold“ – allerdings glänzen sie nur, wenn sie rein und frei von Schmutz sind. Verzerrte Daten können tödlich verunreinigt und damit wertlos sein. Dieses Kapital diskutiert die wesentlichen Komplikationen, die der Gewinnung von unverzerrten Daten im Wege stehen können, und bietet Lösungsvorschläge an.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
Dies ist die einfache Version der Regel. Die komplizierte Version der Regel würde eine Technik berücksichtigen, die als Stratifizierung bezeichnet wird. Wenn ich z. B. glaube, dass die Person des Reeders wichtiger ist als der einzelne Container, könnte eine effizientere Stichprobenstrategie fünf Container von jedem Schiff zufällig auswählen, unabhängig von der Schiffsgröße. Dies bedeutet zwar, dass die Wahrscheinlichkeit, dass ein bestimmter Container kontrolliert wird, auf einem Schiff der Triple-E-Klasse (das bis zu 18.000 Container befördern kann) viel geringer ist als auf einem kleinen Schiff mit nur 250 Containern, aber es handelt sich immer noch um eine Zufallsstichprobe, und durch die Anwendung von Gewichten (die für jeden Container erfassen, welchen Anteil er an der Gesamtfracht des Schiffes hat) können wir unsere Stratifizierung bei der Schätzung der Koeffizienten des Algorithmus herausrechnen.
 
Metadaten
Titel
Wie man unverzerrte Daten generiert
verfasst von
Tobias Bär
Copyright-Jahr
2022
Verlag
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/978-3-662-66315-8_17