Skip to main content

2015 | OriginalPaper | Buchkapitel

FoodBroker - Generating Synthetic Datasets for Graph-Based Business Analytics

verfasst von : André Petermann, Martin Junghanns, Robert Müller, Erhard Rahm

Erschienen in: Big Data Benchmarking

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

We present FoodBroker, a new data generator for benchmarking graph-based business intelligence systems and approaches. It covers two realistic business processes and their involved master and transactional data objects. The interactions are correlated in controlled ways to enable non-uniform distributions for data and relationships. For benchmarking data integration, the generated data is stored in two interrelated databases. The dataset can be arbitrarily scaled and allows comprehensive graph- and pattern-based analysis.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Angles, R., et al.: The linked data benchmark council: a graph and RDF industry benchmarking effort. ACM SIGMOD Rec. 43(1), 27–31 (2014)CrossRef Angles, R., et al.: The linked data benchmark council: a graph and RDF industry benchmarking effort. ACM SIGMOD Rec. 43(1), 27–31 (2014)CrossRef
2.
Zurück zum Zitat Boncz, P.: LDBC: benchmarks for graph and RDF data management. In: Proceedings of the 17th International Database Engineering and Applications Symposium. ACM (2013) Boncz, P.: LDBC: benchmarks for graph and RDF data management. In: Proceedings of the 17th International Database Engineering and Applications Symposium. ACM (2013)
3.
Zurück zum Zitat Chakrabarti, D., Zhan, Y., Faloutsos, C.: R-mat: a recursive model for graph mining. In: SDM, vol. 4, pp. 442–446. SIAM (2004) Chakrabarti, D., Zhan, Y., Faloutsos, C.: R-mat: a recursive model for graph mining. In: SDM, vol. 4, pp. 442–446. SIAM (2004)
4.
Zurück zum Zitat Dominguez-Sal, D., Urbón-Bayes, P., Giménez-Vañó, A., Gómez-Villamor, S., Martínez-Bazán, N., Larriba-Pey, J.L.: Survey of graph database performance on the HPC scalable graph analysis benchmark. In: Shen, H.T., Pei, J., Özsu, M.T., Zou, L., Lu, J., Ling, T.-W., Yu, G., Zhuang, Y., Shao, J. (eds.) WAIM 2010. LNCS, vol. 6185, pp. 37–48. Springer, Heidelberg (2010) CrossRef Dominguez-Sal, D., Urbón-Bayes, P., Giménez-Vañó, A., Gómez-Villamor, S., Martínez-Bazán, N., Larriba-Pey, J.L.: Survey of graph database performance on the HPC scalable graph analysis benchmark. In: Shen, H.T., Pei, J., Özsu, M.T., Zou, L., Lu, J., Ling, T.-W., Yu, G., Zhuang, Y., Shao, J. (eds.) WAIM 2010. LNCS, vol. 6185, pp. 37–48. Springer, Heidelberg (2010) CrossRef
5.
Zurück zum Zitat Ghazal, A., et al.: Bigbench: towards an industry standard benchmark for big data analytics. In: Proceedings of the 2013 international conference on Management of data. ACM Ghazal, A., et al.: Bigbench: towards an industry standard benchmark for big data analytics. In: Proceedings of the 2013 international conference on Management of data. ACM
6.
Zurück zum Zitat Gupta, A.: Generating large-scale heterogeneous graphs for benchmarking. In: Rabl, T., Poess, M., Baru, C., Jacobsen, H.-A. (eds.) WBDB 2012. LNCS, vol. 8163, pp. 113–128. Springer, Heidelberg (2014) CrossRef Gupta, A.: Generating large-scale heterogeneous graphs for benchmarking. In: Rabl, T., Poess, M., Baru, C., Jacobsen, H.-A. (eds.) WBDB 2012. LNCS, vol. 8163, pp. 113–128. Springer, Heidelberg (2014) CrossRef
7.
Zurück zum Zitat Holzschuher, F., Peinl, R.: Performance of graph query languages: comparison of cypher, gremlin and native access in Neo4j. In: Proceedings of the Joint EDBT/ICDT 2013 Workshops. ACM (2013) Holzschuher, F., Peinl, R.: Performance of graph query languages: comparison of cypher, gremlin and native access in Neo4j. In: Proceedings of the Joint EDBT/ICDT 2013 Workshops. ACM (2013)
9.
Zurück zum Zitat Park, Y., et al.: Graph databases for large-scale healthcare systems: a framework for efficient data management and data services. In: IEEE 30th International Conference on Data Engineering Workshops (ICDEW) (2014) Park, Y., et al.: Graph databases for large-scale healthcare systems: a framework for efficient data management and data services. In: IEEE 30th International Conference on Data Engineering Workshops (ICDEW) (2014)
10.
Zurück zum Zitat Petermann, A., Junghanns, M., Müller, R., Rahm, E.: BIIIG : enbabling business intelligence with integrated instance graphs. In: IEEE 30th International Conference on Data Engineering Workshops (ICDEW) (2014) Petermann, A., Junghanns, M., Müller, R., Rahm, E.: BIIIG : enbabling business intelligence with integrated instance graphs. In: IEEE 30th International Conference on Data Engineering Workshops (ICDEW) (2014)
11.
Zurück zum Zitat Pham, M.-D., Boncz, P., Erling, O.: S3G2: a scalable structure-correlated social graph generator. In: Nambiar, R., Poess, M. (eds.) TPCTC 2012. LNCS, vol. 7755, pp. 156–172. Springer, Heidelberg (2013) CrossRef Pham, M.-D., Boncz, P., Erling, O.: S3G2: a scalable structure-correlated social graph generator. In: Nambiar, R., Poess, M. (eds.) TPCTC 2012. LNCS, vol. 7755, pp. 156–172. Springer, Heidelberg (2013) CrossRef
13.
Zurück zum Zitat Vasilyeva, E., et al.: Leveraging flexible data management with graph databases. In: 1st International Workshop on Graph Data Management Experiences and Systems. ACM (2013) Vasilyeva, E., et al.: Leveraging flexible data management with graph databases. In: 1st International Workshop on Graph Data Management Experiences and Systems. ACM (2013)
14.
Zurück zum Zitat Vicknair, C., et al.: A comparison of a graph database and a relational database: a data provenance perspective. In: Proceedings of the 48th annual Southeast regional conference. ACM (2010) Vicknair, C., et al.: A comparison of a graph database and a relational database: a data provenance perspective. In: Proceedings of the 48th annual Southeast regional conference. ACM (2010)
Metadaten
Titel
FoodBroker - Generating Synthetic Datasets for Graph-Based Business Analytics
verfasst von
André Petermann
Martin Junghanns
Robert Müller
Erhard Rahm
Copyright-Jahr
2015
DOI
https://doi.org/10.1007/978-3-319-20233-4_13