Skip to main content
main-content

Über dieses Buch

This book is a practical guide on using the Apache Hadoop projects including MapReduce, HDFS, Apache Hive, Apache HBase, Apache Kafka, Apache Mahout and Apache Solr. From setting up the environment to running sample applications each chapter is a practical tutorial on using a Apache Hadoop ecosystem project. While several books on Apache Hadoop are available, most are based on the main projects MapReduce and HDFS and none discusses the other Apache Hadoop ecosystem projects and how these all work together as a cohesive big data development platform.

What you'll learnHow to set up environment in Linux for Hadoop projects using Cloudera Hadoop Distribution CDH 5.
How to run a MapReduce job
How to store data with Apache Hive, Apache HBase
How to index data in HDFS with Apache Solr
How to develop a Kafka messaging system
How to develop a Mahout User Recommender System
How to stream Logs to HDFS with Apache Flume
How to transfer data from MySQL database to Hive, HDFS and HBase with Sqoop
How create a Hive table over Apache Solr

Who this book is for:
The primary audience is Apache Hadoop developers. Pre-requisite knowledge of Linux and some knowledge of Hadoop is required.

Inhaltsverzeichnis

Frontmatter

Fundamentals

Frontmatter

2016 | OriginalPaper | Buchkapitel

Chapter 1. Introduction

Deepak Vohra

2016 | OriginalPaper | Buchkapitel

Chapter 2. HDFS and MapReduce

Deepak Vohra

Storing & Querying

2016 | OriginalPaper | Buchkapitel

Chapter 3. Apache Hive

Deepak Vohra

2016 | OriginalPaper | Buchkapitel

Chapter 4. Apache HBase

Deepak Vohra

Bulk Transferring & Streaming

2016 | OriginalPaper | Buchkapitel

Chapter 5. Apache Sqoop

Deepak Vohra

2016 | OriginalPaper | Buchkapitel

Chapter 6. Apache Flume

Deepak Vohra

Serializing

Frontmatter

2016 | OriginalPaper | Buchkapitel

Chapter 7. Apache Avro

Deepak Vohra

2016 | OriginalPaper | Buchkapitel

Chapter 8. Apache Parquet

Deepak Vohra

Messaging & Indexing

2016 | OriginalPaper | Buchkapitel

Chapter 9. Apache Kafka

Deepak Vohra

2016 | OriginalPaper | Buchkapitel

Chapter 10. Apache Solr

Deepak Vohra

2016 | OriginalPaper | Buchkapitel

Chapter 11. Apache Mahout

Deepak Vohra

Backmatter

Weitere Informationen

Premium Partner

Neuer Inhalt

BranchenIndex Online

Die B2B-Firmensuche für Industrie und Wirtschaft: Kostenfrei in Firmenprofilen nach Lieferanten, Herstellern, Dienstleistern und Händlern recherchieren.

Whitepaper

- ANZEIGE -

Product Lifecycle Management im Konzernumfeld – Herausforderungen, Lösungsansätze und Handlungsempfehlungen

Für produzierende Unternehmen hat sich Product Lifecycle Management in den letzten Jahrzehnten in wachsendem Maße zu einem strategisch wichtigen Ansatz entwickelt. Forciert durch steigende Effektivitäts- und Effizienzanforderungen stellen viele Unternehmen ihre Product Lifecycle Management-Prozesse und -Informationssysteme auf den Prüfstand. Der vorliegende Beitrag beschreibt entlang eines etablierten Analyseframeworks Herausforderungen und Lösungsansätze im Product Lifecycle Management im Konzernumfeld.
Jetzt gratis downloaden!

Bildnachweise