Skip to main content

2020 | OriginalPaper | Buchkapitel

Evaluating Interpretability in Machine Teaching

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Building interpretable machine learning agents is a challenge that needs to be addressed to make the agents trustworthy and align the usage of the technology with human values. In this work, we focus on how to evaluate interpretability in a machine teaching setting, a setting that involves a human domain expert as a teacher in relation to a machine learning agent. By using a prototype in a study, we discuss the interpretability definition and show how interpretability can be evaluated on a functional-, human- and application level. We end the paper by discussing open questions and suggestions on how our results can be transferable to other domains.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Biran, O., Cotton, C.: Explanation and justification in machine learning: a survey. IJCAI Workshop on Explain. AI (XAI) 8(August), 8–14 (2017) Biran, O., Cotton, C.: Explanation and justification in machine learning: a survey. IJCAI Workshop on Explain. AI (XAI) 8(August), 8–14 (2017)
2.
Zurück zum Zitat Boukhelifa, N., Bezerianos, A., Lutton, E.: Evaluation of interactive machine learning systems, pp. 1–20 (2018) Boukhelifa, N., Bezerianos, A., Lutton, E.: Evaluation of interactive machine learning systems, pp. 1–20 (2018)
3.
6.
Zurück zum Zitat Gilpin, L.H., Bau, D., Yuan, B.Z., Bajwa, A., Specter, M., Kagal, L.: Explaining explanations: an overview of interpretability of machine learning. In: Proceedings - 2018 IEEE 5th International Conference on Data Science and Advanced Analytics, DSAA 2018 (2019). https://doi.org/10.1109/DSAA.2018.00018 Gilpin, L.H., Bau, D., Yuan, B.Z., Bajwa, A., Specter, M., Kagal, L.: Explaining explanations: an overview of interpretability of machine learning. In: Proceedings - 2018 IEEE 5th International Conference on Data Science and Advanced Analytics, DSAA 2018 (2019). https://​doi.​org/​10.​1109/​DSAA.​2018.​00018
11.
Zurück zum Zitat Lakkaraju, H., Bach, S.H., Leskovec, J.: Interpretable decision sets: a joint framework for description and prediction. In: Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, vol. 13–17-August, pp. 1675–1684 (2016). https://doi.org/10.1145/2939672.2939874 Lakkaraju, H., Bach, S.H., Leskovec, J.: Interpretable decision sets: a joint framework for description and prediction. In: Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, vol. 13–17-August, pp. 1675–1684 (2016). https://​doi.​org/​10.​1145/​2939672.​2939874
12.
Zurück zum Zitat Lakkaraju, H., Kamar, E., Caruana, R., Leskovec, J.: Faithful and customizable explanations of black box models. In: Proceedings of the 2019 AAAI/ACM Conference on AI, Ethics, and Society, pp. 131–138. ACM (2019). www.aaai.org Lakkaraju, H., Kamar, E., Caruana, R., Leskovec, J.: Faithful and customizable explanations of black box models. In: Proceedings of the 2019 AAAI/ACM Conference on AI, Ethics, and Society, pp. 131–138. ACM (2019). www.​aaai.​org
15.
Zurück zum Zitat Lipton, Z.C.: The mythos of model interpretability. In: ICML Workshop on Human Interpretability in Machine Learning, WHI (2016) Lipton, Z.C.: The mythos of model interpretability. In: ICML Workshop on Human Interpretability in Machine Learning, WHI (2016)
17.
Zurück zum Zitat Lundberg, S., Lee, S.I.: An unexpected unity among methods for interpreting model predictions. arXiv preprint arXiv:1611.07478 (2016) Lundberg, S., Lee, S.I.: An unexpected unity among methods for interpreting model predictions. arXiv preprint arXiv:​1611.​07478 (2016)
20.
Metadaten
Titel
Evaluating Interpretability in Machine Teaching
verfasst von
Lars Holmberg
Paul Davidsson
Per Linde
Copyright-Jahr
2020
DOI
https://doi.org/10.1007/978-3-030-51999-5_5