Skip to main content
Top

2025 | OriginalPaper | Chapter

8. Einsatz des Self-Enforcing Networks für das Clustering von Pflichtenhefttexten in der Softwareentwicklung mithilfe von TF-IDF und Doc2Vec

Activate our intelligent search to find suitable subject content or patents.

search-config
loading …

Zusammenfassung

Der Aufwand für die Softwareentwicklung ist ein entscheidender Faktor für die Durchführung eines Projekts. Dies führt zu einer großen Sammlung von Textdokumenten in einem Unternehmen, die besser genutzt oder wiederverwendet werden könnten. In diesem Beitrag wird ein Framework für die Identifikation ähnlicher Anforderungen bzw. Textformulierungen von Experten unter Verwendung von TF-IDF und Doc2Vec, als klassische Ansätze des Natural Language Processing (NLP), vorgestellt. Die verwendeten Texte stammen aus Pflichtenheften der LIT Beratung GmbH; das durchgeführte Projekt zeigt den Einsatz von Self-Enforcing Networks (SEN) zum Textclustering anhand eines Praxisbeispiels und soll als Basis für die Aufwandschätzung in Softwareprojekten dienen.

Dont have a licence yet? Then find out more about our products and how to get one now:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literature
go back to reference Bejani MM, Ghatee M (2021) A systematic review on overfitting control in shallow and deep neural networks. Artif Intell Rev 54:1–48 Bejani MM, Ghatee M (2021) A systematic review on overfitting control in shallow and deep neural networks. Artif Intell Rev 54:1–48
go back to reference Biemann C, Heyer G, Quasthoff U (2022) Sprachstatistik. Wissensrohstoff Text: Eine Einführung in das Text Mining. Springer Fachmedien Wiesbaden, Wiesbaden, S 177–256CrossRef Biemann C, Heyer G, Quasthoff U (2022) Sprachstatistik. Wissensrohstoff Text: Eine Einführung in das Text Mining. Springer Fachmedien Wiesbaden, Wiesbaden, S 177–256CrossRef
go back to reference Felderer M, Enoiu EP, Tahvili S (2023) Artificial Intelligence techniques in system testing. In Optimising the Software Development Process with Artificial Intelligence. Springer Nature Singapore, Singapore, S 221–240 Felderer M, Enoiu EP, Tahvili S (2023) Artificial Intelligence techniques in system testing. In Optimising the Software Development Process with Artificial Intelligence. Springer Nature Singapore, Singapore, S 221–240
go back to reference Jünger J, Gärtner C (2023) Textanalyse. Computational Methods für die Sozial-und Geisteswissenschaften. Springer Fachmedien Wiesbaden, Wiesbaden, S 355–388CrossRef Jünger J, Gärtner C (2023) Textanalyse. Computational Methods für die Sozial-und Geisteswissenschaften. Springer Fachmedien Wiesbaden, Wiesbaden, S 355–388CrossRef
go back to reference Klüver C, Klüver J (2024) Teil I: KI–Das Self-Enforcing Network (SEN). Neue Algorithmen für praktische Probleme. Variationen zu Künstlicher Intelligenz und Künstlichem Leben. Springer Vieweg, Wiesbaden Klüver C, Klüver J (2024) Teil I: KI–Das Self-Enforcing Network (SEN). Neue Algorithmen für praktische Probleme. Variationen zu Künstlicher Intelligenz und Künstlichem Leben. Springer Vieweg, Wiesbaden
go back to reference Klüver C, Klüver J, Schmidt J (2024) Modellierung komplexer Prozesse durch naturanaloge Verfahren: Künstliche Intelligenz und Künstliches Leben. Springer Vieweg, WiesbadenCrossRef Klüver C, Klüver J, Schmidt J (2024) Modellierung komplexer Prozesse durch naturanaloge Verfahren: Künstliche Intelligenz und Künstliches Leben. Springer Vieweg, WiesbadenCrossRef
go back to reference Krauss P (2023) Sprachbegabte KI: ChatGPT und Co. In Künstliche Intelligenz und Hirnforschung: Neuronale Netze, Deep Learning und die Zukunft der Kognition. Springer, Berlin, S 163–176 Krauss P (2023) Sprachbegabte KI: ChatGPT und Co. In Künstliche Intelligenz und Hirnforschung: Neuronale Netze, Deep Learning und die Zukunft der Kognition. Springer, Berlin, S 163–176
go back to reference Le Q, Mikolov T (2014) Distributed representations of sentences and documents. In International conference on machine learning. PMLR, S 1188–1196 Le Q, Mikolov T (2014) Distributed representations of sentences and documents. In International conference on machine learning. PMLR, S 1188–1196
go back to reference Li Y, Wen X, Liu X (2023) Research on keywords variations in linguistics based on TF-IDF and N-gram. CIT. J Comput Inf Technol 30(3):193–204 Li Y, Wen X, Liu X (2023) Research on keywords variations in linguistics based on TF-IDF and N-gram. CIT. J Comput Inf Technol 30(3):193–204
go back to reference Mikolov T, Chen K, Corrado G, Dean J (2013) Efficient estimation of word representations in vector space. arXiv preprint arXiv:1301.3781 Mikolov T, Chen K, Corrado G, Dean J (2013) Efficient estimation of word representations in vector space. arXiv preprint arXiv:​1301.​3781
go back to reference Nelli F (2023) Machine learning with scikit-learn. Python Data Analytics: With Pandas, NumPy, and Matplotlib. Apress, Berkeley, CA, S 259–287CrossRef Nelli F (2023) Machine learning with scikit-learn. Python Data Analytics: With Pandas, NumPy, and Matplotlib. Apress, Berkeley, CA, S 259–287CrossRef
go back to reference Pedregosa F, Varoquaux G, Gramfort A, Michel V, Thirion B, Grisel O, Blondel M, Prettenhofer P, Weiss R, Dubourg V, Vanderplas J, Passos A, Cournapeau D, Brucher M, Perrot M, Duchesnay É (2011) Scikit-learn: machine learning in Python. J Mach Learn Res 12: 2825–2830 Pedregosa F, Varoquaux G, Gramfort A, Michel V, Thirion B, Grisel O, Blondel M, Prettenhofer P, Weiss R, Dubourg V, Vanderplas J, Passos A, Cournapeau D, Brucher M, Perrot M, Duchesnay É (2011) Scikit-learn: machine learning in Python. J Mach Learn Res 12: 2825–2830
go back to reference Rajbhoj A, Nistala P, Kulkarni V, Soni S, Pathan A (2023, May) DocToModel: automated authoring of models from diverse requirements specification documents. In 2023 IEEE/ACM 45th International Conference on Software Engineering: Software Engineering in Practice (ICSE-SEIP). IEEE, S 199–210 Rajbhoj A, Nistala P, Kulkarni V, Soni S, Pathan A (2023, May) DocToModel: automated authoring of models from diverse requirements specification documents. In 2023 IEEE/ACM 45th International Conference on Software Engineering: Software Engineering in Practice (ICSE-SEIP). IEEE, S 199–210
go back to reference Reuter W, Korotkova A, Nguyen, L. (2023) Strukturierte und unstrukturierte Daten. In Künstliche Intelligenz und Data Science in Theorie und Praxis: Von Algorithmen und Methoden zur praktischen Umsetzung in Unternehmen. Springer, Berlin, S 51–68 Reuter W, Korotkova A, Nguyen, L. (2023) Strukturierte und unstrukturierte Daten. In Künstliche Intelligenz und Data Science in Theorie und Praxis: Von Algorithmen und Methoden zur praktischen Umsetzung in Unternehmen. Springer, Berlin, S 51–68
go back to reference Shbita B, Gentile AL, Li P, DeLuca C, Ren GJ (2023) Understanding customer requirements: an enterprise knowledge graph approach. In European Semantic Web Conference. Springer Nature Switzerland, Cham, S 625–643 Shbita B, Gentile AL, Li P, DeLuca C, Ren GJ (2023) Understanding customer requirements: an enterprise knowledge graph approach. In European Semantic Web Conference. Springer Nature Switzerland, Cham, S 625–643
go back to reference Sreekanth N, Rama Devi J, Shukla KA, Mohanty DK, Srinivas A, Rao GN, Alam A, Gupta A (2023) Evaluation of estimation in software development using deep learning-modified neural network. App Nanosci 13(3): 2405–2417 Sreekanth N, Rama Devi J, Shukla KA, Mohanty DK, Srinivas A, Rao GN, Alam A, Gupta A (2023) Evaluation of estimation in software development using deep learning-modified neural network. App Nanosci 13(3): 2405–2417
Metadata
Title
Einsatz des Self-Enforcing Networks für das Clustering von Pflichtenhefttexten in der Softwareentwicklung mithilfe von TF-IDF und Doc2Vec
Author
Lauritz Loy
Copyright Year
2025
DOI
https://doi.org/10.1007/978-3-658-43319-2_8

Premium Partner