Skip to main content

2018 | OriginalPaper | Buchkapitel

Extraction of Top-k List by Using Web Mining Technique

verfasst von : Priyanka Deshmane, Pramod Patil, Abha Pathak

Erschienen in: Information and Communication Technology for Sustainable Development

Verlag: Springer Singapore

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

In present days, finding relevant and desired information in less time is very crucial, however, problem is that very small proportion data on internet is interpretable and meaningful and need lot of time to extract. The paper provides solution to problem by extracting information from top-k websites, which consist top-k instances of a subject. For Example “top 5 football teams in the world”. In comparison with other structured information like web tables top-k lists contains high quality information. It can be used to enhance open-domain knowledge base (which can support search or fact answering applications). Proposed system in paper extract the top-k list by using title classifier, parser, candidate picker, ranker, content processor.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Zhixian Zhang, Kenny Q. Zhu, Haixun Wang Hong song Li, “Automatic top k list extraction from web” IEEE, ICDE Conference, 2013, 978-1-4673-4910-9. Zhixian Zhang, Kenny Q. Zhu, Haixun Wang Hong song Li, “Automatic top k list extraction from web” IEEE, ICDE Conference, 2013, 978-1-4673-4910-9.
2.
Zurück zum Zitat J. Wang, H. Wang, Z. Wang, and K. Q. Zhu, “Understanding tables on the web,” in ER, 2012, pp. 141–155. J. Wang, H. Wang, Z. Wang, and K. Q. Zhu, “Understanding tables on the web,” in ER, 2012, pp. 141–155.
3.
Zurück zum Zitat M. J. Cafarella, E. Wu, A. Halevy, Y. Zhang, and D. Z. Wang, “Web tables: Exploring the power of tables on the web,” in VLDB, 2008. M. J. Cafarella, E. Wu, A. Halevy, Y. Zhang, and D. Z. Wang, “Web tables: Exploring the power of tables on the web,” in VLDB, 2008.
4.
Zurück zum Zitat Z. Zhang, K. Q. Zhu, and H. Wang, “A System for extracting top k list from web” in KDD, 2012. Z. Zhang, K. Q. Zhu, and H. Wang, “A System for extracting top k list from web” in KDD, 2012.
5.
Zurück zum Zitat F. Fumarola, T. Weninger, R. Barber, D. Malerba, and J. Han, “Extracting general lists from web document: A hybrid approach,” in IEA/AIE (1), 2011, pp. 285–294. F. Fumarola, T. Weninger, R. Barber, D. Malerba, and J. Han, “Extracting general lists from web document: A hybrid approach,” in IEA/AIE (1), 2011, pp. 285–294.
6.
Zurück zum Zitat Y. Song, H. Wang, Z. Wang, H. Li, and W. Chen, “Short text conceptualization using a probabilistic knowledgebase,” in IJCAI, 2011. Y. Song, H. Wang, Z. Wang, H. Li, and W. Chen, “Short text conceptualization using a probabilistic knowledgebase,” in IJCAI, 2011.
7.
Zurück zum Zitat G. Miao, J. Tatemura, W.-P. Hsiung, A. Sawires, and L. E. Moser, “Extracting data records from the web using tag path clustering,” in WWW, 2009, pp. 981–990. G. Miao, J. Tatemura, W.-P. Hsiung, A. Sawires, and L. E. Moser, “Extracting data records from the web using tag path clustering,” in WWW, 2009, pp. 981–990.
8.
Zurück zum Zitat W. Gatterbauer, P. Bohunsky, M. Herzog, B. Krupl, and B. Pollak, “Towards domain-independent information extraction from web tables,” in WWW. ACM Press, 2007, pp. 71–80. W. Gatterbauer, P. Bohunsky, M. Herzog, B. Krupl, and B. Pollak, “Towards domain-independent information extraction from web tables,” in WWW. ACM Press, 2007, pp. 71–80.
Metadaten
Titel
Extraction of Top-k List by Using Web Mining Technique
verfasst von
Priyanka Deshmane
Pramod Patil
Abha Pathak
Copyright-Jahr
2018
Verlag
Springer Singapore
DOI
https://doi.org/10.1007/978-981-10-3920-1_29

Premium Partner