Skip to main content

2011 | Buch

Medizinische Statistik mit R und Excel

Einführung in die RExcel- und R-Commander-Oberflächen zur statistischen Auswertung

verfasst von: Rainer Muche, Stefanie Lanzinger, Michael Rau

Verlag: Springer Berlin Heidelberg

Buchreihe : Springer-Lehrbuch

insite
SUCHEN

Über dieses Buch

MS Excel ist das am häufigsten eingesetzte Tabellenkalkulationsprogramm zur Datenverarbeitung in Tabellenform. Für statistische Analysen ist Excel allerdings weniger geeignet. Seit 2009 gibt es jedoch „RExcel“ als Add-In, mit dem die Statistiksoftware R und deren menügesteuerte Oberfläche (R-Commander) eingebunden werden können. Statistische Verfahren in R können so von Excel aus aufgerufen werden.

Das vorliegende Buch eignet sich zum Selbststudium: Nach einer Einführung in die Benutzung der RExcel- und R-Commander-Oberflächen werden in einem Beispieldatensatz Deskriptive Statistik, Korrelation/Regression, statistische Tests, Überlebenszeitanalyse und Fallzahlplanung durch Screen-Shots nachvollziehbar dargestellt. Eine Anleitung zur kostenlosen Installation von RExcel sowie praktische Tipps zur Nutzung vervollständigen dieses Buch.

Die Nutzung von RExcel wird auf der Basis der beiden Excel-Versionen 2003 und 2007 dargestellt.

Inhaltsverzeichnis

Frontmatter
Kapitel 1. Allgemeine Information
Zusammenfassung
Microsoft Excel ist ein weit verbreitetes Tabellenkalkulationsprogramm, es wird häufig für die Erfassung, Bearbeitung und Speicherung von Daten verwendet. Elementare und weniger aufwendige mathematische und statistische Funktionen werden in Excel bereitgestellt. Für komplexere und fortgeschrittenere statistische Analysen reicht Excel alleine allerdings nicht aus, hierfür kann Excel mit dem Add-In „RExcel“ erweitert werden. RExcel ist eine Schnittstelle, mit der die statistische Software R und die darin eingebundene menügesteuerte Oberfläche R-Commander in Excel verwendet werden kann.
Rainer Muche, Stefanie Lanzinger, Michael Rau
Kapitel 2. RExcel starten und beenden
Zusammenfassung
Die folgenden Abschn. 2.1 und 2.2 zeigen, wie die RExcel-Oberfläche geöffnet und wieder beendet wird.
Wurde RExcel erfolgreich installiert (s. Anhang A.1) befinden sich zwei bzw. drei neue Icons auf dem Desktop, je nachdem welche Excel-Versionen installiert sind.
Klickt man auf das R-Icon, wird die „normale“ R-Console, mit der man das Statistikpaket R bedienen kann, gestartet. Mit dem Icon RExcel2007 with RCommander bzw. RExcel with RCommander (Excel 2003) wird RExcel gestartet.
Ebenso kann man RExcel auch über ein geöffnetes Excel-Fenster starten. Ein Excel-Fenster öffnet man mit der Auswahl Start → Alle Programme →Microsoft Office →Microsoft Office Excel 2007 bzw. 2003.
Rainer Muche, Stefanie Lanzinger, Michael Rau
Kapitel 3. Datenverwaltung mit Excel und RExcel
Zusammenfassung
In Abschn. 3.1 wird aufgezeigt, wie eine einheitliche Dezimalschreibweise erreicht wird. Das ist wichtig damit R mit Excel-Dateien problemlos arbeiten kann. Es gibt mehrere Möglichkeiten Daten in Excel einzulesen, z. B. kann man Daten direkt in das Excel-Tabellenblatt eintragen, das wird in Abschn. 3.2 beschrieben. In Abschn. 3.3 wird gezeigt, wie eine vorhandene Excel-Datei geöffnet wird. Damit die R-Funktionen aufgerufen werden können, muss eine Datenübertragung von Excel nach R erfolgen, dies zeigt das Abschn. 3.4.
Rainer Muche, Stefanie Lanzinger, Michael Rau
Kapitel 4. Datenmanagement in Excel bzw. R-Commander
Zusammenfassung
Bevor statistische Auswertungen mit einem Datensatz durchgeführt werden können, muss dieser oft zuerst aufbereitet werden. Dazu gehört das Ändern von Variablennamen und Variablenwerten (Abschn. 4.1), die Korrektur von Variablenformaten (Abschn. 4.2), das Hinzufügen (Abschn. 4.3) oder Löschen von Variablen (Abschn. 4.5) oder Beobachtungen (Abschn. 4.6), die Einteilung von Datenwerten in Klassen (Abschn. 4.4) sowie das Zusammenfügen von Dateien (Abschn. 4.7) und die Sortierung der Daten nach bestimmten Variablen (Abschn. 4.8). Des Weiteren ist dargestellt, wie Teilmengen eines Datensatzes (Abschn. 4.9) ausgewählt werden können und wie die Datenübertragung von R nach Excel (Abschn. 4.10) möglich ist. Die Bearbeitung des Datensatzes erfolgt in Excel oder mit Hilfe des R-Commander.
Rainer Muche, Stefanie Lanzinger, Michael Rau
Kapitel 5. Vorbemerkungen und Informationen zur statistischen Analyse medizinischer Daten
Zusammenfassung
In den folgenden Kapiteln 6–12 werden Auswertungsmöglichkeiten, die mit RExcel ausgeführt werden können, beschrieben. Es werden allerdings nicht alle in RExcel realisierte Möglichkeiten dargestellt, sondern wir orientieren uns am Stoffplan der Vorlesung „Medizinische Biometrie“, einer Pflichtveranstaltung für Studenten der Humanmedizin. Ausführliche statistische Hintergründe möchten wir im Rahmen dieses Buches nicht darstellen. Dazu verweisen wir auf die entsprechenden Literaturangaben im (Anhang A.7), besonders empfehlen wir hierfür das Buch von Christel Weiss: Basiswissen Medizinische Statistik.
Rainer Muche, Stefanie Lanzinger, Michael Rau
Kapitel 6. Deskriptive Statistikdeskriptive Statistik
Zusammenfassung
Mit den Methoden der deskriptiven Statistik versucht man, die Daten anhand von Grafiken und statistischen Maßzahlen zu beschreiben. Die deskriptive Statistik ermöglicht, wichtige Informationen aus der Fülle der Daten herauszufiltern. In diesem Abschnitt werden die Möglichkeiten, die RExcel dazu bietet, beschrieben. Bei den Auswertungen unterscheidet man Methoden für qualitativ/diskrete und stetige Variablen (s. Abschn. 5.1). Zuerst werden in Abschn. 6.1 Methoden der deskriptiven Statistik für qualitative bzw. diskrete Merkmale vorgestellt. In Abschn. 6.2 finden sich dann die Methoden für stetige Merkmale. Wie man stetige Merkmale gruppenspezifisch auswertet zeigt dann der Abschn. 6.3.
Rainer Muche, Stefanie Lanzinger, Michael Rau
Kapitel 7. Zusammenhang von Variablen Korrelation und Regression
Zusammenfassung
In diesem Kapitel geht es um den Zusammenhang zwischen zwei Variablen. Im Fall qualitativer bzw. diskreter Variablen wird dieser Zusammenhang mit zweidimensionalen Kreuztabellen anhand von absoluten und relativen Häufigkeiten beschrieben (Abschn. 7.1). Statistische Tests, die prüfen, ob diese beobachteten Zusammenhänge zufällig sind, werden in den Kap. 8 (unabhängige Beobachtungen) und 9 (abhängige Beobachtungen) beschrieben. Im Abschn. 7.2 wird die lineare Abhängigkeit zwischen zwei stetigen Variablen durch Berechnung des Korrelationskoeffizienten (Abschn. 7.2.2) bzw. durch lineare Regression (Abschn. 7.2.3) untersucht. Im Vorfeld solcher Auswertungen sollten auf jeden Fall bivariate grafische Darstellungen betrachtet werden. Im Abschn. 7.2.1 wird veranschaulicht, wie diese Grafiken in der RExcel-Oberfläche erzeugt werden können.
Rainer Muche, Stefanie Lanzinger, Michael Rau
Kapitel 8. Statistische Tests für unabhängige Beobachtungen statistische Tests unabhängige Beobachtungen
Zusammenfassung
Der Sinn und Zweck statistischer Tests und deren Grundlagen sind im Abschn. 5.5 ausführlich dargestellt worden. Unterteilt werden die Testverfahren in diesem Buch danach, ob unabhängige oder abhängige Daten ausgewertet werden sollen (s. Abschn. 5.6). Voraussetzung für die in diesem Kapitel beschriebenen Tests ist also die Unabhängigkeit der Daten, d. h., dass die zu vergleichenden Beobachtungen von unterschiedlichen Patienten oder Probanden stammen. Im Abschn. 8.1 werden Tests angegeben, mit denen die Unabhängigkeit zweier qualitativer bzw. diskreter Variablen untersucht werden können. Für den Vergleich von stetigen Variablen unabhängiger Gruppen gibt es einmal Tests, die darauf basieren, dass diese Messwerte zumindest annähernd normalverteilt sind.
Rainer Muche, Stefanie Lanzinger, Michael Rau
Kapitel 9. Statistische Tests für abhängige Beobachtungen statistische Tests abhängige Beobachtungen
Zusammenfassung
Auf Vorbemerkungen allgemeiner Art kann in diesem Kapitel weitgehend verzichtet werden. Diese finden sich hauptsächlich im Kap. 5: Einführung in statistische Tests, Voraussetzung der Normalverteilung, Bemerkungen zu nichtparametrischen Verfahren (Abschn. 5.5) und Unterscheidung von unabhängigen und abhängigen Daten (Abschn. 5.6). Voraussetzung für die folgenden Tests ist die Abhängigkeit der Daten, d. h. dass die zu vergleichenden Beobachtungen jeweils von derselben Untersuchungseinheit (in der Medizin meist ein Patient) stammen. Für den Vergleich von zwei qualitativen bzw. diskreten abhängigen Merkmalen wird im Abschn. 9.1 der McNemar-Test vorgestellt.
Rainer Muche, Stefanie Lanzinger, Michael Rau
Kapitel 10. Einstichprobentests Einstichprobentest und Konfidenzintervalle Konfidenzintervall
Zusammenfassung
In diesem Kapitel werden zwei statistische Konzepte vorgestellt. Das sind einmal die Einstichprobentest s, mit denen statistische Kenngrößen einer Variablen mit vorgegebenen Werten (z. B. aus der Literatur) verglichen werden können. Solche Tests sind z. B. in der Qualitätskontrolle wichtig, in der Stichprobenwerte mit Angaben des Herstellers verglichen werden müssen. Auch in der Klinischen Chemie im Labor sind in Ringversuchen Messwerte mit einem vorgegebenen Wert einer Standardprobe zu vergleichen. Die RExcel-Oberfläche ermöglicht solche Vergleiche für Anteile und Proportionen als Kenngröße qualitativer bzw.
Rainer Muche, Stefanie Lanzinger, Michael Rau
Kapitel 11. ÜberlebenszeitanalyseÜberlebenszeitanalyse
Zusammenfassung
In diesem Kapitel geht es um grundlegende Methoden der Überlebenszeitanalyse und zwar um die Kaplan-Meier-Überlebenskurven und –Wahrscheinlichkeiten sowie den Log-Rank-Test (für eine kurze Einführung siehe Abschn. 5.8). Im Abschn. 11.2 werden die Überlebenswahrscheinlichkeiten nach der Methode von Kaplan-Meier geschätzt und grafisch dargestellt. Des Weiteren wird in Abschn. 11.3 aufgezeigt, wie ein Konfidenzbereich für den Kaplan-Meier-Schätzer und die Kaplan-Meier-Kurve ausgegeben werden kann. Für den Vergleich der Überlebenszeiten von unabhängigen Gruppen kann der Log-Rank-Test eingesetzt werden.
Rainer Muche, Stefanie Lanzinger, Michael Rau
Kapitel 12. Fallzahlberechnungen Fallzahlberechnung
Zusammenfassung
Die Notwendigkeit von Fallzahlberechnungen ist in Abschn. 5.9 dargestellt. In diesem Kapitel werden drei Fallzahlberechnungen vorgestellt. Diese sind der t -Test für unabhängige Stichproben (Abschn. 12.1), der t-Test für gepaarte Stichproben (Abschn. 12.2) und der χ²-Test für Proportionen (Abschn. 12.3). Um mit dem R-Commander Fahlzahlen berechnen zu können, wählen wir Extras → Lade Rcmdr Plugin(s) und laden das Plug-in IPSUR (s. Anhang A.4).
Rainer Muche, Stefanie Lanzinger, Michael Rau
Backmatter
Metadaten
Titel
Medizinische Statistik mit R und Excel
verfasst von
Rainer Muche
Stefanie Lanzinger
Michael Rau
Copyright-Jahr
2011
Verlag
Springer Berlin Heidelberg
Electronic ISBN
978-3-642-19484-9
Print ISBN
978-3-642-19483-2
DOI
https://doi.org/10.1007/978-3-642-19484-9