Skip to main content

2020 | OriginalPaper | Buchkapitel

Running Experiments with Confidence and Sanity

verfasst von : Martin Aumüller, Matteo Ceccarello

Erschienen in: Similarity Search and Applications

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Analyzing data from large experimental suites is a daily task for anyone doing experimental algorithmics. In this paper we report on several approaches we tried for this seemingly mundane task in a similarity search setting, reflecting on the challenges it poses.
We conclude by proposing a workflow, which can be implemented using several tools, that allows to analyze experimental data with confidence.
The extended version of this paper and the support code are provided at https://​github.​com/​Cecca/​running-experiments.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
We would like to thank Michael Vesterli for the many code optimizations that we are using, that he developed for PUFFINN  [2].
 
2
Recently, such environments are included in programming IDE such as https://​code.​visualstudio.​com/​docs/​remote/​containers.
 
Literatur
1.
Zurück zum Zitat Arango, C., Dernat, R., Sanabria, J.: Performance evaluation of container-based virtualization for high performance computing environments. arXiv:1709.10140 (2017) Arango, C., Dernat, R., Sanabria, J.: Performance evaluation of container-based virtualization for high performance computing environments. arXiv:​1709.​10140 (2017)
2.
Zurück zum Zitat Aumüller, M., Christiani, T., Pagh, R., Vesterli, M.: PUFFINN: parameterless and universally fast finding of nearest neighbors. In: ESA 2019 (2019) Aumüller, M., Christiani, T., Pagh, R., Vesterli, M.: PUFFINN: parameterless and universally fast finding of nearest neighbors. In: ESA 2019 (2019)
5.
Zurück zum Zitat Boettiger, C.: An introduction to docker for reproducible research. Oper. Syst. Rev. 49(1), 71–79 (2015)CrossRef Boettiger, C.: An introduction to docker for reproducible research. Oper. Syst. Rev. 49(1), 71–79 (2015)CrossRef
7.
Zurück zum Zitat Callahan, S.P., Freire, J., Santos, E., Scheidegger, C.E., Silva, C.T., Vo, H.T.: VisTrails: visualization meets data management. In: SIGMOD 2006 (2006) Callahan, S.P., Freire, J., Santos, E., Scheidegger, C.E., Silva, C.T., Vo, H.T.: VisTrails: visualization meets data management. In: SIGMOD 2006 (2006)
8.
Zurück zum Zitat Collberg, C.S., Proebsting, T.A.: Repeatability in computer systems research. Commun. ACM 59, 62–69 (2016)CrossRef Collberg, C.S., Proebsting, T.A.: Repeatability in computer systems research. Commun. ACM 59, 62–69 (2016)CrossRef
9.
Zurück zum Zitat Davison, A.P., Mattioni, M., Samarkanov, D., Telenczuk, B.: Sumatra: a toolkit for reproducible research. In: Implementing Reproducible Research. CRC Press (2014) Davison, A.P., Mattioni, M., Samarkanov, D., Telenczuk, B.: Sumatra: a toolkit for reproducible research. In: Implementing Reproducible Research. CRC Press (2014)
11.
Zurück zum Zitat Guo, P.J.: CDE: a tool for creating portable experimental software packages. Comput. Sci. Eng. 14(4), 32–35 (2012)CrossRef Guo, P.J.: CDE: a tool for creating portable experimental software packages. Comput. Sci. Eng. 14(4), 32–35 (2012)CrossRef
12.
Zurück zum Zitat Hutson, M.: Artificial intelligence faces reproducibility crisis. 359(6377) (2018) Hutson, M.: Artificial intelligence faces reproducibility crisis. 359(6377) (2018)
13.
Zurück zum Zitat Kitzes, J., Turek, D., Deniz, F.: The Practice of Reproducible Research: Case Studies and Lessons from the Data-Intensive Sciences. Univ of California Press (2017) Kitzes, J., Turek, D., Deniz, F.: The Practice of Reproducible Research: Case Studies and Lessons from the Data-Intensive Sciences. Univ of California Press (2017)
14.
Zurück zum Zitat Kurtzer, G.M., Sochat, V., Bauer, M.W.: Singularity: scientific containers for mobility of compute. PLoS One 12(5), e0177459 (2017)CrossRef Kurtzer, G.M., Sochat, V., Bauer, M.W.: Singularity: scientific containers for mobility of compute. PLoS One 12(5), e0177459 (2017)CrossRef
15.
Zurück zum Zitat McGeoch, C.C.: Experimental algorithmics. Commun. ACM 50(11), 27–31 (2007)CrossRef McGeoch, C.C.: Experimental algorithmics. Commun. ACM 50(11), 27–31 (2007)CrossRef
17.
Zurück zum Zitat Moret, B.M.E., Shapiro, H.D.: Algorithms and experiments: the new (and old) methodology. J. UCS 7(5), 434–446 (2001)MathSciNetMATH Moret, B.M.E., Shapiro, H.D.: Algorithms and experiments: the new (and old) methodology. J. UCS 7(5), 434–446 (2001)MathSciNetMATH
18.
Zurück zum Zitat Rampin, R., Chirigati, F., Shasha, D.E., Freire, J., Steeves, V.: ReproZip: the reproducibility packer. J. Open Source Softw. 1(8), 107 (2016)CrossRef Rampin, R., Chirigati, F., Shasha, D.E., Freire, J., Steeves, V.: ReproZip: the reproducibility packer. J. Open Source Softw. 1(8), 107 (2016)CrossRef
19.
Zurück zum Zitat Stodden, V., Leisch, F., Peng, R.D.: Implementing Reproducible Research. CRC Press (2014) Stodden, V., Leisch, F., Peng, R.D.: Implementing Reproducible Research. CRC Press (2014)
Metadaten
Titel
Running Experiments with Confidence and Sanity
verfasst von
Martin Aumüller
Matteo Ceccarello
Copyright-Jahr
2020
DOI
https://doi.org/10.1007/978-3-030-60936-8_31

Neuer Inhalt