Skip to main content

2020 | OriginalPaper | Buchkapitel

Latency Estimation of Big Data Processing Under the MapReduce Framework with Coupling Effects

verfasst von : Di Lin, Lingshuang Cai, Xiaofeng Zhang, Xiao Zhang, Jiazhi Huo

Erschienen in: Artificial Intelligence in China

Verlag: Springer Singapore

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

MapReduce is a model of processing large-scaled data with parallel and distributed algorithms at a cluster, and it is composed of two stages: a map stage for filtering and sorting data and a reduce stage for the operation of summary. We develop a model with two connected queues: one upstream queue for the data flow to access the mappers and one downstream queue for the data flow to access the reducers. Also, we analyze the latency of processing a large scale of data using queueing models, in consideration of the coupling effects between these two queues for map and reduce, respectively. Our analysis results on various datasets and with various algorithms show that the MapReduce framework can almost linearly speed up with increasingly more processors, and adding mappers is usually more efficient than adding reducers to reduce the latency when processing a large-scaled dataset.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Grolinger K, Hayes M, Higashino WA, Heureux A, Allison DS, Capretz MAM (2014) Challenges for MapReduce in big data. In: IEEE World Congress Services (SERVICES), pp 182–189 Grolinger K, Hayes M, Higashino WA, Heureux A, Allison DS, Capretz MAM (2014) Challenges for MapReduce in big data. In: IEEE World Congress Services (SERVICES), pp 182–189
2.
Zurück zum Zitat Najafabadi MM, Villanustre F, Khoshgoftaar TM, Seliya N, Wald R, Muharemagic E (2015) Deep learning applications and challenges in big data analytics. J. Big Data 2(1):1CrossRef Najafabadi MM, Villanustre F, Khoshgoftaar TM, Seliya N, Wald R, Muharemagic E (2015) Deep learning applications and challenges in big data analytics. J. Big Data 2(1):1CrossRef
3.
Zurück zum Zitat Kune R, Konugurthi PK, Agarwal A, Chillarige RR, Buyya R (2016) The anatomy of big data computing. Softw Pract Experience 46(1):79–105CrossRef Kune R, Konugurthi PK, Agarwal A, Chillarige RR, Buyya R (2016) The anatomy of big data computing. Softw Pract Experience 46(1):79–105CrossRef
4.
Zurück zum Zitat Jagadish HV et al (2014) Big data and its technical challenges. Commun ACM 57(7):86–94CrossRef Jagadish HV et al (2014) Big data and its technical challenges. Commun ACM 57(7):86–94CrossRef
5.
Zurück zum Zitat Lin D, Patrick J, Labeau F (2014) Estimating the waiting time of multi-priority emergency patients with downstream blocking. Health Care Manage Sci 17(1):88–99CrossRef Lin D, Patrick J, Labeau F (2014) Estimating the waiting time of multi-priority emergency patients with downstream blocking. Health Care Manage Sci 17(1):88–99CrossRef
7.
Zurück zum Zitat Schölkopf B, Platt J, Hofmann T (2007) Map-reduce for machine learning on multicore. In: Advances in neural information processing systems. Proceedings of the 2006 conference. MIT Press, pp 281–288 Schölkopf B, Platt J, Hofmann T (2007) Map-reduce for machine learning on multicore. In: Advances in neural information processing systems. Proceedings of the 2006 conference. MIT Press, pp 281–288
Metadaten
Titel
Latency Estimation of Big Data Processing Under the MapReduce Framework with Coupling Effects
verfasst von
Di Lin
Lingshuang Cai
Xiaofeng Zhang
Xiao Zhang
Jiazhi Huo
Copyright-Jahr
2020
Verlag
Springer Singapore
DOI
https://doi.org/10.1007/978-981-15-0187-6_12

Neuer Inhalt