Skip to main content
main-content

Über dieses Buch

​In Zeiten von „Big Data“ wird es zunehmend wichtiger, Datenprozesse automatisieren zu können. In diesem Buch wird die Programmsprache Python dazu eingesetzt, Daten automatisiert zu erheben, diese auszuwerten und Zusammenhänge zu visualisieren. Die Beispiele sind einfach gehalten und können jedoch auf eigene, komplexere Vorhaben übertragen werden. Daher eignet sich das Buch für all jene, die noch keine Erfahrung mit der Programmierung gesammelt haben.

Inhaltsverzeichnis

Frontmatter

Kapitel 1. Einleitung

Zusammenfassung
Im einleitenden Kapitel des Buchs wird zum einen dargelegt, warum es heute wichtig ist, über Kenntnisse der Programmierung zu verfügen und zum anderen gezeigt, wie man Python auf seinem Rechner installieren kann. Python zählt aktuell zu den beliebtesten Programmiersprachen, auch weil die Anwendung relativ einfach zu erlernen ist. Neben der Installation werden daher auch erste Code-Beispiele gezeigt, die dies demonstrieren sollen. Letztlich ist Python auch deshalb so gut lesbar, da sich alle an bestimmte Formatierungsvorgaben halten. Auch diese werden in der Einleitung besprochen.
Markus Feiks

Kapitel 2. Python verstehen und anwenden

Zusammenfassung
In diesem Kapitel werden die Basis-Konzepte und Datentypen von Python dargestellt. Es zielt darauf ab, Python danach verstehen und eigenständig anwenden zu können. Zunächst werden dazu alle wichtigen Datentypen sowie Datencontainer vorgestellt. Zudem wird geklärt, wie man Programmabläufe steuern und beeinflussen kann. Da im Programmablauf auch Fehler auftreten können, wird ferner besprochen, wie man mit diesen umgehen kann. Abschließend lernen wir eigene Funktionen zu schreiben sowie Daten einzulesen bzw. zu speichern.
Markus Feiks

Kapitel 3. Verarbeitung tabellarischer Daten in Python

Zusammenfassung
In Python stehen zur Berechnung und Verarbeitung unterschiedliche Bibliotheken bereit. Standardmäßig wird hierzu auf die Bibliotheken NumPy und Pandas zurückgegriffen. NumPy dient dabei zur Berechnung und Pandas wiederum für die tabellarische Verarbeitung und Darstellungen von Daten. In diesem Kapitel wird gezeigt, wie NumPy und Pandas genutzt werden können. Hierzu zählen der Zugriff auf Daten, sowie deren Bearbeitung mithilfe von Funktionen. Außerdem wird aufgezeigt, wie Daten eingelesen und Datentabellen exportiert werden können.
Markus Feiks

Kapitel 4. Datenerhebung mit Python am Beispiel von Twitter und Nachrichten-Medien

Zusammenfassung
In diesem Kapitel wird exemplarisch gezeigt, wie Python zur automatisierten Datenerhebung genutzt werden kann. Im ersten Beispiel greifen wir auf Daten von Twitter zurück. Hierzu erstellen wir uns zunächst einen Developer-Account sowie eine App mit Zugangsdaten. Anschließend stellen wir mit dem Modul tweepy eine Verbindung zur Twitter-API her und greifen hierdurch auf die Datenbank zu. Im zweiten Beispiel laden wir Artikel von einer großen deutschen Nachrichten-Webseite herunter (Spiegel Online). Hierzu nutzen wir das Modul requests, mit dem sich die Webseiten-Aufrufe vereinfachen lassen. Die Inhalte laden der Artikel laden wir aus dem Seiten-Quelltext der Artikel. Dazu nutzen wir wieder das Modul beautifulsoup.
Markus Feiks

Kapitel 5. Statistische Berechnungen mit Python

Zusammenfassung
In diesem Kapitel schreiben wir unterschiedliche Funktionen zur statistischen Berechnung. Darunter befinden sich einfache Lagemaßzahlen, wie der Mittelwert, aber auch komplexe Berechnungen, wie der Korrelationskoeffizient nach Karl Pearson. Zudem schreiben wir eine Funktion zur Standardisierung von Daten und zur Berechnung der Stichprobengröße. Alle Funktionen können dabei unabhängig voneinander genutzt werden. Außerdem werden zum besseren Verständnis auch Anwendungsbeispiele präsentiert.
Markus Feiks

Kapitel 6. Daten visualisieren

Zusammenfassung
In diesem Kapitel lernen wir, Python für die Visualisierung von Daten bzw. Zusammenhängen zu nutzen. Ziel der Forschung ist es, Erkenntnisse zu generieren. Mithilfe von Abbildungen ist es möglich, sich „auf einen Blick“ zu informieren. Wir nutzen dazu die Bibliothek Matplotlib sowie Seaborn und besprechen zahlreiche Formate. Unter anderem wird gezeigt, wie Balken- oder Liniendiagramme erstellen werden können. Zudem wird demonstriert wird Streudiagramme in Abhängigkeit zu den Daten eingefärbt und die Punktgröße variiert werden kann.
Markus Feiks

Kapitel 7. Ausblick

Zusammenfassung
In diesem Kapitel werden weiterführende Links bereitgestellt, um sich intensiver mit Python zu beschäftigen.
Markus Feiks

Backmatter

Weitere Informationen