The Fundamentals of People Analytics
With Applications in R
- Open Access
- 2023
- Open Access
- Buch
- Verfasst von
- Craig Starbuck
- Verlag
- Springer International Publishing
Über dieses Buch
Über dieses Buch
This open access book prepares current and aspiring analytics professionals to effectively address this need by curating key concepts spanning the entire analytics lifecycle, along with step-by-step instructions for their applications to real-world problems, using ubiquitous and freely available open-source software. This book does not assume prior knowledge of statistics, how to query databases, or how to write performant code; early chapters include an introduction to R and SQL as well as an overview of statistical foundations.
Human capital is an organization’s most important asset. Without the knowledge and skills of people, an organization can accomplish nothing. The acquisition, development, and retention of critical talent has become increasingly more complex and challenging, and organizations are making significant investments to gain a deeper, data-informed understanding of organizational phenomena impacting the bottom line.
By the end of this book, readers will be able to:
• Design and conduct empirical research
• Query and wrangle data using SQL
• Profile, clean, and analyze data using R
• Apply appropriate statistical and ML models to a range of people analytics use cases
• Package and present analyses to communicate impactful insights to stakeholders
Inhaltsverzeichnis
-
Getting Started
- Open Access
PDF-Version jetzt herunterladenDieses Kapitel untersucht die transformative Kraft der People Analytics und hebt ihre Fähigkeit hervor, umsetzbare Einsichten an die Oberfläche zu bringen und organisatorischen Erfolg voranzutreiben. Er diskutiert die Entwicklung datengestützter Entscheidungen im Talentbereich und die zunehmenden Investitionen in die Fähigkeiten der Personalanalyse. Der Text betont die Komplexität der Herausforderungen für Arbeitnehmer und die entscheidende Rolle der Analytik bei der Bewältigung dieser Herausforderungen. Er führt Schlüsselprinzipien wie arbeitnehmerfreundliches Denken, Qualität und Priorisierung ein, die für den Erfolg von Analysefähigkeiten von grundlegender Bedeutung sind. Das Kapitel skizziert außerdem ein 4D-Rahmenwerk zur Strukturierung von Analyseprojekten, um klar definierte Problemstellungen und aussagekräftige Kapitalrenditen sicherzustellen. Darüber hinaus bietet es praktische Anleitungen zu Werkzeugen, Datensätzen und dem Analyseprozess, was es zu einer unschätzbaren Ressource für Fachleute macht, die Personenanalyse effektiv umsetzen wollen.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter outlines guiding principles and a framework to support the success of people analytics projects. In addition, analytics tooling and data sets utilized in this book are discussed. -
Introduction to R
- Open Access
PDF-Version jetzt herunterladenDieses Kapitel führt in die Grundlagen von R ein, einschließlich der Installationsverfahren für R und RStudio und der Installation wichtiger Pakete. Es behandelt grundlegende Datenstrukturen und -funktionen, wobei der Schwerpunkt auf Best Practices für die Arbeit in R. liegt. Das Kapitel erklärt auch, wie Daten aus verschiedenen Quellen geladen werden können und unterstreicht die Bedeutung der Sensitivität von Fällen in R. Detaillierte Dokumentationen und praktische Beispiele werden bereitgestellt, um neuen Benutzern einen reibungslosen Start zu erleichtern.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter covers the basics of R, including how to install the software and packages, load libraries and data, and work with various types of objects and functions. -
Introduction to SQL
- Open Access
PDF-Version jetzt herunterladenDieses Kapitel bietet eine umfassende Einführung in SQL, die am häufigsten verwendete Sprache für die Abfrage von relationalen Datenbanken. Es behandelt die wesentlichen Klauseln von SQL-Abfragen wie SELECT, FROM und WHERE und erklärt, wie man aggregierte Funktionen und Verbindungen verwendet, um Daten effektiv zu manipulieren. Der Text geht auch auf Techniken zur Leistungsoptimierung ein und betont die Bedeutung der Datenfilterung auf der Datenbankseite, bevor diese in Analysetools wie R geladen werden. Zur Veranschaulichung dieser Konzepte werden praktische Beispiele und Code-Schnipsel bereitgestellt, was ihn zu einer unschätzbaren Ressource für Datenanalytiker und Datenbankadministratoren macht, die ihre SQL-Fähigkeiten verbessern wollen.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter covers the basics of SQL and how to implement SQL statements within the R environment. Concepts and examples span SQL clauses, aggregate functions, joins, subqueries, virtual tables, window functions, and common table expressions (CTEs). -
Research Design
- Open Access
PDF-Version jetzt herunterladenDas Kapitel betont die entscheidende Rolle geeigneter Forschungsmethoden und -konzepte bei der Erzielung präziser Erkenntnisse. Es beginnt damit, die Bedeutung von Forschungsfragen für die Leitung der Studie und die Festlegung der Methodik hervorzuheben. Das Kapitel stellt dann Forschungshypothesen, interne und externe Validität und die Bedeutung der Kontrolle von Verwirrungsvariablen vor. Sie vertieft sich in verschiedene Forschungsmethoden, darunter quantitative, qualitative und gemischte Methoden, von denen jede ihre eigenen Stärken und Grenzen hat. Das Kapitel untersucht auch verschiedene Forschungsdesigns, wie experimentelle, quasi-experimentelle und nicht-experimentelle, und liefert Beispiele, um jeden Typ zu veranschaulichen. Abschließend werden die Herausforderungen und Überlegungen bei der Umsetzung dieser Konzepte, wie etwa der Hawthorne-Effekt, diskutiert und Überprüfungsfragen zur Stärkung des Lernens gestellt.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter provides an overview of the elements of research, including research questions, hypotheses, methods, and designs. Factors influencing internal and external validity are also discussed. -
Measurement and Sampling
- Open Access
PDF-Version jetzt herunterladenDieses Kapitel vertieft sich in die Feinheiten der Variablentypen, einschließlich unabhängiger, abhängiger, kontrollierender, moderierender und vermittelnder Variablen und ihrer Klassifizierung als endogene oder exogene Variablen. Es untersucht Messskalen und unterscheidet zwischen diskreten (nominalen und ordinalen) und kontinuierlichen (Intervall- und Verhältnisvariablen) Variablen. Das Kapitel befasst sich auch mit Stichprobenmethoden und betont die Bedeutung von Wahrscheinlichkeitsprobenverfahren wie einfachen zufälligen, geschichteten Zufalls-, Cluster- und systematischen Stichprobenmethoden. Darüber hinaus werden Nichterkennungsmethoden und ihre Grenzen diskutiert. Darüber hinaus wird in dem Kapitel auf die Zuverlässigkeit und Gültigkeit des Maßstabs eingegangen und die entscheidende Rolle dieser Maßnahmen bei der Gewährleistung der Genauigkeit und Konsistenz der Forschungsergebnisse hervorgehoben. Durch die Bereitstellung eines gründlichen Verständnisses dieser grundlegenden Konzepte stattet das Kapitel Forscher mit den notwendigen Werkzeugen aus, um robuste Studien zu entwerfen und Daten effektiv zu analysieren.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter surveys variable types and measurement scales as well as probability and non-probability sampling methods. In addition, topics in sampling and nonsampling error and scale reliability and validity are covered. -
Data Preparation
- Open Access
PDF-Version jetzt herunterladenDie Datenaufbereitung ist ein grundlegender Schritt in der Datenanalyse, der Aufgaben wie Datenextraktion, -reinigung und -organisation umfasst. Das Kapitel vertieft sich in die Feinheiten der Datenarchitektur, einschließlich Datenseen, Data Warehouses und Data Marts. Er erklärt die Unterschiede zwischen Typ-1- und Typ-2-Tabellen in Data Warehouses und betont die Bedeutung von Datenintegrität und -konsistenz. Darüber hinaus wird in diesem Kapitel die moderne Dateninfrastruktur und die Art und Weise diskutiert, wie Cloud Computing das Datenmanagement verändert und Analysen effizienter und zugänglicher gemacht hat. Der Text behandelt auch grundlegende Datenreinigungstechniken wie den Umgang mit fehlenden Werten und Ausreißern und unterstreicht die Bedeutung der Datenqualität für die Gewährleistung zuverlässiger Analysen. Darüber hinaus werden Konzepte wie Data Binning und One-Hot-Coding eingeführt, die für die Aufbereitung von Daten für fortgeschrittene Analysen und Modellierungen von entscheidender Bedeutung sind. Das Kapitel schließt mit der Betonung der Bedeutung von Feature Engineering, bei dem neue Variablen aus bestehenden Daten abgeleitet werden, um analytische Erkenntnisse zu verbessern.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter explains data architecture concepts needed to properly integrate and extract data from analytics platforms as well as methods of screening and cleaning data (e.g., missingness, outliers, data binning, one-hot encoding, feature engineering). -
Descriptive Statistics
- Open Access
PDF-Version jetzt herunterladenDieses Kapitel vertieft die grundlegenden Konzepte der univariaten und bivariaten Analyse, die für das Verständnis komplexerer statistischer Methoden von entscheidender Bedeutung sind. Er untersucht Messgrößen der zentralen Tendenz (Mittelwert, Median, Modus) und der Spreizung (Varianz, Standardabweichung, Bereich, Quartil) und diskutiert, wie diese Messgrößen zur Interpretation der Datenverteilungen beitragen. Zusätzlich behandelt das Kapitel Schiefe und Kurtosis, die Einblicke in die Form von Datenverteilungen bieten. Bivariate Analysetechniken, wie Kovarianz und Korrelation, werden ebenfalls erklärt, wobei hervorgehoben wird, wie diese Methoden Beziehungen zwischen Variablen aufdecken können. Das Kapitel enthält praktische Beispiele und R-Code-Schnipsel, um diese Konzepte zu illustrieren, was es zu einer ansprechenden und informativen Lektüre für alle macht, die ihr Verständnis deskriptiver Statistiken stärken möchten.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter reviews types of univariate analyses (e.g., measures of central tendency and spread) and bivariate analyses (e.g., covariance and correlation). -
Statistical Inference
- Open Access
PDF-Version jetzt herunterladenDieses Kapitel untersucht die grundlegenden Konzepte statistischer Folgerungen, die Folgerungen über eine Grundgesamtheit auf der Grundlage von Stichprobendaten beinhalten. Es beginnt mit einer Einführung in Wahrscheinlichkeiten und Zufälle, in der das Gesetz der großen Zahlen und die Bedeutung des Verständnisses von Wahrscheinlichkeitsverteilungen diskutiert werden. Das Kapitel geht dann auf diskrete und kontinuierliche Wahrscheinlichkeitsverteilungen ein und erklärt, wie man verschiedene Variablentypen modelliert. Darüber hinaus wird der zentrale Grenzwertsatz behandelt, der für das Verständnis des Verhaltens von Stichprobenmitteln von entscheidender Bedeutung ist. Das Kapitel behandelt auch Hypothesentests, Konfidenzintervalle und die Bedeutung statistischer Macht. Es endet mit einer Diskussion über die Bonferroni-Korrektur und die Interpretation der p-Werte. Im gesamten Kapitel werden praktische Beispiele und Visualisierungen verwendet, um komplexe Konzepte zu veranschaulichen, was sie zu einer wertvollen Ressource für alle macht, die ihr Verständnis statistischer Schlussfolgerungen vertiefen wollen.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter covers the fundamentals of statistical inference. Topics include discrete and continuous probability distributions, conditional probability, Central Limit Theorem (CLT), confidence intervals, hypothesis testing, multiple testing, and statistical power. -
Analysis of Differences
- Open Access
PDF-Version jetzt herunterladenDas Kapitel vertieft sich in die Analyse von Unterschieden in der Personenanalyse, wobei der Schwerpunkt auf parametrischen und nichtparametrischen Tests liegt. Es werden die Zusammenhänge für Unterschiede und die jeweils anwendbaren Tests diskutiert, einschließlich der Annahmen und Anforderungen für parametrische Tests und der Vorteile nichtparametrischer Tests für qualitative Daten. Das Kapitel behandelt auch den Chi-Square-Unabhängigkeitstest und Fishers exakten Test auf diskrete Daten und demonstriert deren Anwendung anhand praktischer Beispiele und Visualisierungen. Zusätzlich wird der Wilcoxon Signed-Rank-Test als nichtparametrische Alternative zum t-Test der gepaarten Stichproben eingeführt, der Code-Snippets für die Implementierung in R. bereitstellt. Im Laufe des Kapitels betont der Autor die Bedeutung des Verständnisses der Datenverteilung und der Annahmen, die verschiedenen statistischen Tests zugrunde liegen.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter examines parametric tests and nonparametric alternatives for testing whether statistical differences are observed in data measured on discrete and continuous scales. Methods of quantifying the magnitude of observed differences are also reviewed. -
Linear Regression
- Open Access
PDF-Version jetzt herunterladenDas Kapitel geht auf die Grundprinzipien linearer Regression ein und verwendet eine anschauliche Analogie zur Schätzung der jährlichen Vergütung in einem Park, um das Thema zugänglich zu machen. Sie unterstreicht die Bedeutung der Berücksichtigung relevanter Variablen und des Zusammenspiels zwischen ihnen und veranschaulicht, wie bestimmte Faktoren angesichts bedeutsamerer Faktoren an Bedeutung verlieren können. Der Text diskutiert auch das Konzept der ungeklärten Varianz und die Grenzen der Vorhersagemodelle und betont die Notwendigkeit einer sorgfältigen Variablenauswahl, um die Schätzgenauigkeit zu verbessern. Darüber hinaus bietet es ein praktisches Beispiel einer linearen Modellzusammenfassung und eines Normalitätstests und bietet einen umfassenden Überblick über das Thema für Fachleute in der People Analytics.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter covers one of the most valuable tools for people analytics professionals: linear regression. Concepts, assumptions, and step-by-step implementations are presented for both simple and multiple linear regression as well as methods for testing more complex moderated and mediated relationships. -
Linear Model Extensions
- Open Access
PDF-Version jetzt herunterladenDieses Kapitel vertieft sich in die Erweiterung linearer Regressionsrahmen, um komplexere Hypothesentests zu ermöglichen. Es werden Modellvergleiche und die strategische Untersetzung von Daten diskutiert, um zu untersuchen, wie Prädiktoren Reaktionen zwischen verschiedenen Gruppen beeinflussen. Die Methodik wird anhand einer Fallstudie zum Verständnis der Treiber von YTD-Verkäufen für Verkäufer mit und ohne Überstunden demonstriert, in der die Anwendung mehrerer Regressionsmodelle und die Interpretation von Koeffizienten dargestellt werden. Das Kapitel unterstreicht auch die Bedeutung dieser Techniken in Pay-Equity-Studien und anderen Kontexten, in denen gruppenspezifische Analysen von entscheidender Bedeutung sind.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter covers methods of extending the linear regression model for mixed effects, non-linear relationships, and use cases that involve examining changes to variable and model-level performance with stepwise variable selection procedures. Comparing and interpreting coefficients across multiple models is also discussed. -
Logistic Regression
- Open Access
PDF-Version jetzt herunterladenDas Kapitel befasst sich mit logistischer Regression, einer Art generalisiertem linearem Modell zur Vorhersage kategorischer Ergebnisse. Sie erklärt, wie sich logistische Regression von linearer Regression unterscheidet, insbesondere im Umgang mit nicht-kontinuierlichen Ergebnissen. Das Kapitel behandelt den Einsatz der logistischen Funktion zur Beschränkung der Wahrscheinlichkeiten innerhalb des [0,1] -Intervalls und interpretiert Koeffizienten in Form von Log Odds und Odds Ratios. Praxisbeispiele im Bereich R werden bereitgestellt, darunter die Modellierung der Fluktuationswahrscheinlichkeit von Mitarbeitern auf Grundlage von Bewertungsquoten. Das Kapitel diskutiert auch die Bedeutung von Koeffizienten und die Verwendung von Abweichungsmessungen zur Bewertung der Modellanpassung.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter covers a type of generalized linear model, logistic regression, that is applied to settings in which the outcome variable is not measured on a continuous scale. Binomial, multinomial, and ordinal logistic regression models are covered. -
Predictive Modeling
- Open Access
PDF-Version jetzt herunterladenDas Kapitel befasst sich mit der Anwendung prädiktiver Modellierung in der Personenanalyse und betont den Einsatz von Techniken des maschinellen Lernens, um zukünftige Werte vorherzusagen und die Auswirkungen von Prädiktoren zu verstehen. Er erklärt die philosophischen Unterschiede zwischen Statistik und maschinellem Lernen, wobei der Schwerpunkt auf der praktischen Umsetzung von Vorhersagemodellen liegt. Der Text enthält einen detaillierten Workflow für die Erstellung und Bewertung von Vorhersagemodellen anhand von Beispielen wie der Abnutzungsprognose von Mitarbeitern. Es wird auch die Bedeutung der Quervalidierung, der Kennzahlen für die Modellleistung und des Zielkonflikts zwischen Voreingenommenheit und Abweichung diskutiert. Darüber hinaus hebt das Kapitel die Verwendung interpretierbarer baumbasierter Algorithmen wie Entscheidungsbäume und zufällige Wälder in der Personenanalyse hervor. Überall betont der Text die Notwendigkeit der Interpretierbarkeit von Modellen und die potenziellen Fallstricke, die es mit sich bringt, sich auf Black-Box-Modelle zu verlassen.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter progresses from explanatory to predictive models. Topics include cross-validation, model performance metrics, prediction intervals, bias–variance tradeoff, tree-based algorithms, and various types of models with utility in classification and forecasting applications. -
Unsupervised Learning
- Open Access
PDF-Version jetzt herunterladenDieses Kapitel vertieft sich in die Feinheiten des unbeaufsichtigten Lernens und konzentriert sich insbesondere auf Techniken zur Dimensionsreduzierung, die für die Analyse hochdimensionaler Daten unverzichtbar sind. Darin geht es um die Herausforderung des "Fluchs der Dimensionalität" in der Personenanalyse und die Bedeutung der Verringerung der Datendimensionen zur Stärkung der statistischen Macht. Das Kapitel stellt Faktoranalyse und Hauptkomponentenanalyse (PCA) als Schlüsselmethoden zur Dimensionsreduzierung vor und bietet Schritt-für-Schritt-Anleitungen und Pseudocodes für die Implementierung. Außerdem werden die praktischen Anwendungsmöglichkeiten dieser Techniken in der Umfrageforschung und in der Personenanalyse untersucht, wobei hervorgehoben wird, wie sie die Datenanalyse optimieren und die Interpretierbarkeit der Ergebnisse verbessern können.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter covers dimension reduction techniques that have utility in exploring and confirming the factor structure of psychological instrumentation; techniques include exploratory factor analysis (EFA), confirmatory factor analysis (CFA), and principal components analysis (PCA). K-means and hierarchical clustering methods are examined for surfacing patterns and insights in unsupervised settings in which there is no outcome variable. -
Data Visualization
- Open Access
PDF-Version jetzt herunterladenDie Visualisierung von Daten ist mehr eine Kunst als eine Wissenschaft, abhängig von der Art der Daten, Schlüsselbotschaften, dem Publikum und dem Kontext. Dieses Kapitel enthält allgemeine Best Practices und spezifische Strategien für verschiedene Datentypen. Es deckt wesentliche Elemente wie Farbpaletten ab, respektiert Farbenblindheit, hält sich an Markenfarben und verwendet Farben konsequent. Darüber hinaus vertieft es sich in intuitive Layouts, präachtsame Attribute und schrittweise visuelle Verbesserungen mittels ggplot2 in R. Das Kapitel untersucht auch verschiedene Arten von Visualisierungen, darunter Tabellen, Heatmaps, Streudiagramme, Liniendiagramme, Balkendiagramme und fortgeschrittene Visualisierungen wie Sankey-Diagramme und Waffeldiagramme. Jeder Abschnitt unterstreicht die Bedeutung einer klaren und effektiven Kommunikation von Daten sowohl an technische als auch an nichttechnische Akteure.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter provides best practices for visualizing data and discusses common types of data visualizations and their respective applications in people analytics contexts. Types of data visualizations include tables, heatmaps, scatterplots, line graphs, slopegraphs, bar charts, combination charts, waterfall charts, waffle charts, Sankey diagrams, and pie charts. -
Data Storytelling
- Open Access
PDF-Version jetzt herunterladenDas Kapitel geht der entscheidenden Rolle des Datenerzählens bei der Umwandlung analytischer Ergebnisse in überzeugende Narrative nach, die bei nicht-technischen Akteuren auf Resonanz stoßen. Es unterstreicht die Wichtigkeit, Ihr Publikum zu kennen und Inhalte auf ihre spezifischen Bedürfnisse und Präferenzen zuzuschneiden. Der Autor bietet einen schrittweisen Ansatz zur Strukturierung und Verfeinerung von Präsentationen, wobei der Schwerpunkt auf der Verwendung klarer, nicht technischer Sprache liegt. Darüber hinaus unterstreicht das Kapitel die Bedeutung der Definition von Erfolg im Voraus und schließt mit umsetzbaren nächsten Schritten zur Förderung des Engagements von Stakeholdern. Praktische Tipps zur Bewältigung gemeinsamer Herausforderungen und zur Gewährleistung effektiver Kommunikation sind ebenfalls enthalten, was dieses Kapitel zu einer unschätzbaren Ressource für alle macht, die ihre Fähigkeiten beim Erzählen von Daten verbessern möchten.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis chapter provides best practices for effectively communicating to stakeholders with data. Topics include knowing the audience, implementing a status taxonomy for analysis documents, and various structural elements of analysis presentations (e.g., TL;DR, purpose, methodology, results, limitations, next steps, appendix).
- Titel
- The Fundamentals of People Analytics
- Verfasst von
-
Craig Starbuck
- Copyright-Jahr
- 2023
- Electronic ISBN
- 978-3-031-28674-2
- Print ISBN
- 978-3-031-28673-5
- DOI
- https://doi.org/10.1007/978-3-031-28674-2
Informationen zur Barrierefreiheit für dieses Buch folgen in Kürze. Wir arbeiten daran, sie so schnell wie möglich verfügbar zu machen. Vielen Dank für Ihre Geduld.