Skip to main content

2020 | OriginalPaper | Buchkapitel

9. Kreative Künstliche Intelligenz und Emotionen

verfasst von : Gerhard Paaß, Dirk Hecker

Erschienen in: Künstliche Intelligenz

Verlag: Springer Fachmedien Wiesbaden

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Dieses Kapitel zeigt, dass tiefe neuronale Netze (TNN) auf kreative Art neuartige Bilder, Texte, Musik und Dialoge erzeugen können. Bei Bildern sind generative adversariale Netze (GAN) in der Lage, Bilder mit bestimmten Eigenschaften oder Stilmerkmalen zu generieren. Zudem können sie Bilder eines Typs in einen anderen Typ übertragen, z.B. ein Foto in ein Gemälde. Für die Erzeugung von Texten gibt es mittlerweile Sprachmodelle, welche neue komplexe Geschichten erfinden und in flüssiger Sprache formulieren können. Musik-TNN werden mit den Noten von Musikstücken trainiert und können neue Musikstücke „komponieren“, die nach Ansicht von Fachleuten eine gute Qualität erreichen. Zum Ende des Kapitels werden noch intelligente Sprachassistenten diskutiert, die in der Lage sind, die emotionale Befindlichkeit des Gesprächspartners in seinen Dialogbeiträgen zu erkennen. Sie können darauf adäquat reagieren und kreative und fokussierte Antworten geben, sodass sich der Gegenüber verstanden fühlt und motiviert ist, das Gespräch weiter zu führen. Im asiatischen Raum gibt es derartige Chatbots mit Hunderten von Millionen Nutzern.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
Zurück zum Zitat Adiwardana, D., et al. 2020. Towards a Human-like Open-Domain Chatbot. [Online] 2020. [Zitat vom: 10. 02. 2020.] arXiv preprint arXiv:2001.09977. Adiwardana, D., et al. 2020. Towards a Human-like Open-Domain Chatbot. [Online] 2020. [Zitat vom: 10. 02. 2020.] arXiv preprint arXiv:2001.09977.
Zurück zum Zitat Ba, J. L., Kiros, J. R., and Hinton, G. E. 2016. Layer normalization. [Online] 2016. [Zitat vom: 16. 05. 2019.] arXiv preprint arXiv:1607.06450. Ba, J. L., Kiros, J. R., and Hinton, G. E. 2016. Layer normalization. [Online] 2016. [Zitat vom: 16. 05. 2019.] arXiv preprint arXiv:1607.06450.
Zurück zum Zitat Brock, A., Donahue, J. und Simonyan, K. 2019. Large scale gan training for high fidelity natural image synthesis. ICLR. 2019. Brock, A., Donahue, J. und Simonyan, K. 2019. Large scale gan training for high fidelity natural image synthesis. ICLR. 2019.
Zurück zum Zitat Brown, Tom B.; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav; Sastry, Girish; Askell, Amanda; Agarwal, Sandhini; Herbert-Voss, Ariel; Krueger, Gretchen; Henighan, Tom; Child, Rewon; Ramesh, Aditya; Ziegler, Daniel M.; Wu, Jeffrey; Winter, Clemens; Hesse, Christopher; Chen, Mark; Sigler, Eric; Litwin, Mateusz; Gray, Scott; Chess, Benjamin; Clark, Jack; Berner, Christopher; McCandlish, Sam; Radford, Alec; Sutskever, Ilya; Amodei, Dario (July 22, 2020). „Language Models are Few-Shot Learners“. arXiv:2005.14165. Brown, Tom B.; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav; Sastry, Girish; Askell, Amanda; Agarwal, Sandhini; Herbert-Voss, Ariel; Krueger, Gretchen; Henighan, Tom; Child, Rewon; Ramesh, Aditya; Ziegler, Daniel M.; Wu, Jeffrey; Winter, Clemens; Hesse, Christopher; Chen, Mark; Sigler, Eric; Litwin, Mateusz; Gray, Scott; Chess, Benjamin; Clark, Jack; Berner, Christopher; McCandlish, Sam; Radford, Alec; Sutskever, Ilya; Amodei, Dario (July 22, 2020). „Language Models are Few-Shot Learners“. arXiv:2005.14165.
Zurück zum Zitat Cheng, W. F., et al. 2018. Image inspired poetry generation in xiaoice. [Online] 2018. [Zitat vom: 29. 12. 2019.] arXiv preprint arXiv:1808.03090 Cheng, W. F., et al. 2018. Image inspired poetry generation in xiaoice. [Online] 2018. [Zitat vom: 29. 12. 2019.] arXiv preprint arXiv:1808.03090
Zurück zum Zitat Child, R., et al. 2019. Generating Long Sequences with Sparse Transformers. [Online] 2019. [Zitat vom: 18. 05. 2019.] arXiv preprint arXiv:1904.10509 Child, R., et al. 2019. Generating Long Sequences with Sparse Transformers. [Online] 2019. [Zitat vom: 18. 05. 2019.] arXiv preprint arXiv:1904.10509
Zurück zum Zitat Cohen, Noam. 2019. Will California’s New Bot Law Strengthen Democracy? The New Yorker. 2019, 02.07.2019. Cohen, Noam. 2019. Will California’s New Bot Law Strengthen Democracy? The New Yorker. 2019, 02.07.2019.
Zurück zum Zitat Dathathri, S., et al. 2020. Plug and play language models: a simple approach to controlled text generation. [Online] 2020. arXiv preprint arXiv:1912.02164 Dathathri, S., et al. 2020. Plug and play language models: a simple approach to controlled text generation. [Online] 2020. arXiv preprint arXiv:1912.02164
Zurück zum Zitat Elgammal, A., et al. 2017. Can: Creative adversarial networks, generating „art“ by learning about styles and deviating from style norms. [Online] 2017. [Zitat vom: 10. 01. 2020.] arXiv preprint arXiv:1706.07068 Elgammal, A., et al. 2017. Can: Creative adversarial networks, generating „art“ by learning about styles and deviating from style norms. [Online] 2017. [Zitat vom: 10. 01. 2020.] arXiv preprint arXiv:1706.07068
Zurück zum Zitat Fan, A., Lewis, M. und Dauphin, Y. 2018. Hierarchical neural story generation. [Online] 2018. arXiv preprint arXiv:1805.04833 Fan, A., Lewis, M. und Dauphin, Y. 2018. Hierarchical neural story generation. [Online] 2018. arXiv preprint arXiv:1805.04833
Zurück zum Zitat Fernández, J. D. und Vico, F. 2013. AI methods in algorithmic composition: A comprehensive survey. Journal of Artificial Intelligence Research, 48, 513–582. 2013. Fernández, J. D. und Vico, F. 2013. AI methods in algorithmic composition: A comprehensive survey. Journal of Artificial Intelligence Research, 48, 513–582. 2013.
Zurück zum Zitat Gehrmann, S., et al. 2018. End-to-end content and plan selection for natural language generation. E2E NLG Challenge System Descriptions. 2018. Gehrmann, S., et al. 2018. End-to-end content and plan selection for natural language generation. E2E NLG Challenge System Descriptions. 2018.
Zurück zum Zitat Goodfellow, I., et al. 2014. Generative adversarial nets. In Advances in neural information processing systems (pp. 2672–2680). 2014. Goodfellow, I., et al. 2014. Generative adversarial nets. In Advances in neural information processing systems (pp. 2672–2680). 2014.
Zurück zum Zitat Guo, X., et al. 2018. Group-Level Emotion Recognition using Hybrid Deep Models based on Faces, Scenes, Skeletons and Visual Attentions. Proceedings of the 2018 on International Conference on Multimodal Interaction (pp. 635–639). ACM. 2018. Guo, X., et al. 2018. Group-Level Emotion Recognition using Hybrid Deep Models based on Faces, Scenes, Skeletons and Visual Attentions. Proceedings of the 2018 on International Conference on Multimodal Interaction (pp. 635–639). ACM. 2018.
Zurück zum Zitat Isola, P., et al. 2017. Image-to-image translation with conditional adversarial networks. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 1125–1134). 2017. Isola, P., et al. 2017. Image-to-image translation with conditional adversarial networks. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 1125–1134). 2017.
Zurück zum Zitat Karras, T., et al. 2018. Progressive growing of gans for improved quality, stability, and variation. ICLR 2018. 2018. Karras, T., et al. 2018. Progressive growing of gans for improved quality, stability, and variation. ICLR 2018. 2018.
Zurück zum Zitat Köchel, Ludwig Ritter von. 1862. Chronologisch-thematisches Verzeichnis sämtlicher Tonwerke Wolfgang Amade Mozarts. Nebst Angabe der verloren gegangenen, angefangenen, übertragenen, zweifelhaften und unterschobenen Compositionen desselben. s.l. : Breitkopf & Härtel., 1862. Köchel, Ludwig Ritter von. 1862. Chronologisch-thematisches Verzeichnis sämtlicher Tonwerke Wolfgang Amade Mozarts. Nebst Angabe der verloren gegangenen, angefangenen, übertragenen, zweifelhaften und unterschobenen Compositionen desselben. s.l. : Breitkopf & Härtel., 1862.
Zurück zum Zitat Ledig, C., et al. 2017. Photo-realistic single image super-resolution using a generative adversarial network. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 4681–4690). 2017. Ledig, C., et al. 2017. Photo-realistic single image super-resolution using a generative adversarial network. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 4681–4690). 2017.
Zurück zum Zitat Miroshnichenko, A. 2018. AI to Bypass Creativity. Will Robots Replace Journalists? (The Answer Is „Yes“). Information, 9(7), 183. 2018. Miroshnichenko, A. 2018. AI to Bypass Creativity. Will Robots Replace Journalists? (The Answer Is „Yes“). Information, 9(7), 183. 2018.
Zurück zum Zitat Peiser, Jacyln. 2019. The Rise of the Robot Reporter. The New York Times. 5. Feb. 2019. Peiser, Jacyln. 2019. The Rise of the Robot Reporter. The New York Times. 5. Feb. 2019.
Zurück zum Zitat Radford, A., Metz, L. und Chintala, S. 2016. Unsupervised representation learning with deep convolutional generative adversarial networks. ICLR 2016. 2016. Radford, A., Metz, L. und Chintala, S. 2016. Unsupervised representation learning with deep convolutional generative adversarial networks. ICLR 2016. 2016.
Zurück zum Zitat Shoeybi, M., Patwary, M., Puri, R., LeGresley, P., Casper, J., & Catanzaro, B. 2019. Megatron-lm: Training multi-billion parameter language models using gpu model parallelism. [Online] 2019. [Zitat vom: 27. 01. 2020.] arXiv preprint arXiv:1909.08053 Shoeybi, M., Patwary, M., Puri, R., LeGresley, P., Casper, J., & Catanzaro, B. 2019. Megatron-lm: Training multi-billion parameter language models using gpu model parallelism. [Online] 2019. [Zitat vom: 27. 01. 2020.] arXiv preprint arXiv:1909.08053
Zurück zum Zitat Shum, H. Y., He, X. D. und Li, D. 2018. From Eliza to XiaoIce: challenges and opportunities with social chatbots. Frontiers of Information Technology & Electronic Engineering, 19(1), 10–26. 2018. Shum, H. Y., He, X. D. und Li, D. 2018. From Eliza to XiaoIce: challenges and opportunities with social chatbots. Frontiers of Information Technology & Electronic Engineering, 19(1), 10–26. 2018.
Zurück zum Zitat Wang, C., Li, M. und Smola, A. J. 2019. Language Models with Transformers. [Online] 2019. [Zitat vom: 27. 05. 2019.] arXiv preprint arXiv:1904.09408 Wang, C., Li, M. und Smola, A. J. 2019. Language Models with Transformers. [Online] 2019. [Zitat vom: 27. 05. 2019.] arXiv preprint arXiv:1904.09408
Zurück zum Zitat Zhang, H., et al. 2017. Stackgan: Text to photo-realistic image synthesis with stacked generative adversarial networks. In Proceedings of the IEEE International Conference on Computer Vision (pp. 5907–5915) 2017. Zhang, H., et al. 2017. Stackgan: Text to photo-realistic image synthesis with stacked generative adversarial networks. In Proceedings of the IEEE International Conference on Computer Vision (pp. 5907–5915) 2017.
Zurück zum Zitat Zhou, L., et al. 2018. The design and implementation of XiaoIce, an empathetic social chatbot. [Online] 2018. arXiv preprint arXiv:1812.08989 Zhou, L., et al. 2018. The design and implementation of XiaoIce, an empathetic social chatbot. [Online] 2018. arXiv preprint arXiv:1812.08989
Zurück zum Zitat Zhu, H., et al. 2018. XiaoIce Band:A Melody and Arrangement Generation Framework for Pop Music. Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining (pp. 2837–2846). ACM. 2018. Zhu, H., et al. 2018. XiaoIce Band:A Melody and Arrangement Generation Framework for Pop Music. Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining (pp. 2837–2846). ACM. 2018.
Zurück zum Zitat Zhu, J. Y., et al. 2017. Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. In Proceedings of the IEEE International Conference on Computer Vision (pp. 2223–2232). 2017. Zhu, J. Y., et al. 2017. Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. In Proceedings of the IEEE International Conference on Computer Vision (pp. 2223–2232). 2017.
Metadaten
Titel
Kreative Künstliche Intelligenz und Emotionen
verfasst von
Gerhard Paaß
Dirk Hecker
Copyright-Jahr
2020
DOI
https://doi.org/10.1007/978-3-658-30211-5_9

Premium Partner