Skip to main content

2018 | OriginalPaper | Buchkapitel

The Algorithm of Automatic Text Summarization Based on Network Representation Learning

verfasst von : Xinghao Song, Chunming Yang, Hui Zhang, Xujian Zhao

Erschienen in: Natural Language Processing and Chinese Computing

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

The graph models are an important method in automatic text summarization. However, there will be problems of vector sparseness and information redundancy in text map to graph. In this paper, we propose a graph clustering summarization algorithm based on network representation learning. The sentences graph was construed by TF-IDF, and controlled the number of edges by a threshold. The Node2Vec is used to embedding the graph, and the sentences were clustered by k-means. Finally, the Modularity is used to control the number of clusters, and generating a brief summary of the document. The experiments on the MultiLing 2013 show the proposed algorithm improves the F-Score in ROUGE-1 and ROUGE-2.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Luhn, H.P.: The automatic creation of literature abstracts. IBM Corp. (1958) Luhn, H.P.: The automatic creation of literature abstracts. IBM Corp. (1958)
2.
Zurück zum Zitat Li, P., Lam, W., Bing, L., et al.: Deep Recurrent Generative Decoder for Abstractive Text Summarization. arXiv preprint arXiv:1708.00625 (2017) Li, P., Lam, W., Bing, L., et al.: Deep Recurrent Generative Decoder for Abstractive Text Summarization. arXiv preprint arXiv:​1708.​00625 (2017)
3.
Zurück zum Zitat Mani, I., Bloedorn, E.: Multi-document summarization by graph search and matching. In: Proceedings of AAAI 1997, pp. 622–628 (1997) Mani, I., Bloedorn, E.: Multi-document summarization by graph search and matching. In: Proceedings of AAAI 1997, pp. 622–628 (1997)
4.
Zurück zum Zitat Erkan, G., Radev, D.R.: LexRank: graph-based lexical centrality as salience in text summarization. J. Qiqihar Jr. Teach. Coll. 2011, 22 (2004) Erkan, G., Radev, D.R.: LexRank: graph-based lexical centrality as salience in text summarization. J. Qiqihar Jr. Teach. Coll. 2011, 22 (2004)
5.
Zurück zum Zitat Ferreira, R., Freitas, F., Cabral, L.D.S., et al.: A four dimension graph model for automatic text summarization. In: IEEE/WIC/ACM International Joint Conferences on Web Intelligence, pp. 389–396. IEEE (2013) Ferreira, R., Freitas, F., Cabral, L.D.S., et al.: A four dimension graph model for automatic text summarization. In: IEEE/WIC/ACM International Joint Conferences on Web Intelligence, pp. 389–396. IEEE (2013)
6.
Zurück zum Zitat Ferreira, R., Lins, R.D., Freitas, F., et al.: A new sentence similarity method based on a three-layer sentence representation. In: ACM Symposium on Document Engineering, pp. 25–34. ACM (2014) Ferreira, R., Lins, R.D., Freitas, F., et al.: A new sentence similarity method based on a three-layer sentence representation. In: ACM Symposium on Document Engineering, pp. 25–34. ACM (2014)
7.
Zurück zum Zitat Giannakopoulos, G., Karkaletsis, V., Vouros, G.: Testing the use of N-gram graphs in summarization sub-tasks. In: Proceedings of Text Analysis Conference, TAC 2008, pp. 158–167 (2008) Giannakopoulos, G., Karkaletsis, V., Vouros, G.: Testing the use of N-gram graphs in summarization sub-tasks. In: Proceedings of Text Analysis Conference, TAC 2008, pp. 158–167 (2008)
8.
Zurück zum Zitat Salton, G., Fox, E.A., Wu, H.: Extended boolean information retrieval. Cornell University (1982) Salton, G., Fox, E.A., Wu, H.: Extended boolean information retrieval. Cornell University (1982)
9.
Zurück zum Zitat Mikolov, T., Chen, K., Corrado, G., et al.: Efficient estimation of word representations in vector space. arXiv preprint arXiv:1301.3781 (2013) Mikolov, T., Chen, K., Corrado, G., et al.: Efficient estimation of word representations in vector space. arXiv preprint arXiv:​1301.​3781 (2013)
10.
Zurück zum Zitat Perozzi, B., Alrfou, R., Skiena, S.: DeepWalk: online learning of social representations, pp. 701–710 (2014) Perozzi, B., Alrfou, R., Skiena, S.: DeepWalk: online learning of social representations, pp. 701–710 (2014)
11.
Zurück zum Zitat Grover, A., Leskovec, J.: node2vec: scalable feature learning for networks. In: KDD, p. 855 (2016) Grover, A., Leskovec, J.: node2vec: scalable feature learning for networks. In: KDD, p. 855 (2016)
12.
Zurück zum Zitat Tang, J., Qu, M., Wang, M., et al.: LINE: large-scale information network embedding, vol. 2, pp. 1067–1077 (2015) Tang, J., Qu, M., Wang, M., et al.: LINE: large-scale information network embedding, vol. 2, pp. 1067–1077 (2015)
13.
Zurück zum Zitat Newman, M.E.: Fast algorithm for detecting community structure in networks. Phys. Rev. E Stat. Nonlinear Soft Matter Phys. 69(6 Pt 2), 066133 (2003) Newman, M.E.: Fast algorithm for detecting community structure in networks. Phys. Rev. E Stat. Nonlinear Soft Matter Phys. 69(6 Pt 2), 066133 (2003)
14.
Zurück zum Zitat Lin, C.: ROUGE: a package for automatic evaluation of summaries. In: ACL, pp. 74–81 (2004) Lin, C.: ROUGE: a package for automatic evaluation of summaries. In: ACL, pp. 74–81 (2004)
15.
Zurück zum Zitat Mihalcea, R., Tarau, P.: TextRank: bringing order into texts. UNT Scholarly Works, pp. 404–411 (2004) Mihalcea, R., Tarau, P.: TextRank: bringing order into texts. UNT Scholarly Works, pp. 404–411 (2004)
16.
Zurück zum Zitat Steinberger, J., Jezek, K.: Using latent semantic analysis in text summarization and summary evaluation. In: International Conference ISIM, pp. 93–100 (2004) Steinberger, J., Jezek, K.: Using latent semantic analysis in text summarization and summary evaluation. In: International Conference ISIM, pp. 93–100 (2004)
Metadaten
Titel
The Algorithm of Automatic Text Summarization Based on Network Representation Learning
verfasst von
Xinghao Song
Chunming Yang
Hui Zhang
Xujian Zhao
Copyright-Jahr
2018
DOI
https://doi.org/10.1007/978-3-319-99501-4_32

Premium Partner