Skip to main content
Erschienen in: Pattern Analysis and Applications 4/2017

08.02.2017 | Industrial and Commercial Application

Arabic document layout analysis

verfasst von: Amany M. Hesham, Mohsen A. A. Rashwan, Hassanin M. Al-Barhamtoshy, Sherif M. Abdou, Amr A. Badr, Ibrahim Farag

Erschienen in: Pattern Analysis and Applications | Ausgabe 4/2017

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Document layout analysis is a key step in the process of converting document images into text. Arabic language script is cursive and written in different styles which cause some challenges in the analysis of Arabic text documents. In this paper, we introduce an approach for Arabic documents layout analysis. In that approach, the document is segmented into set of zones using morphological operations. The segmented zones are classified as text or non-text ones using a support vector machine classifier. Features used in zone classification are combination between texture-based features and connected component-based features. The textural-based feature vector size is reduced using genetic algorithm. Classified text zones are clustered, using adaptive sample set clustering algorithm, into lines. Each segmented line is segmented into words by clustering inter- and intra-spaces. The proposed system was evaluated against two other systems that represent the best available tools for the Arabic documents analysis, and evaluation results show that the proposed system works well on multi-font and multi-size documents with a variety of layouts even on some historical documents.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Bukhari SS, Shafait F, Breuel TM (2012) In guide to OCR Arabic scripts. In: Märgner V, El Abed H (eds) Springer, London, pp 35–53 Bukhari SS, Shafait F, Breuel TM (2012) In guide to OCR Arabic scripts. In: Märgner V, El Abed H (eds) Springer, London, pp 35–53
2.
Zurück zum Zitat Wernicke A, Lienhart R (2000) IEEE international conference on multimedia and expo ICME2000, vol 3, p 1 Wernicke A, Lienhart R (2000) IEEE international conference on multimedia and expo ICME2000, vol 3, p 1
3.
Zurück zum Zitat Bloomberg DSDS (1991) In international conference on document analysis and recognition (IEEE), pp 1–12 Bloomberg DSDS (1991) In international conference on document analysis and recognition (IEEE), pp 1–12
4.
Zurück zum Zitat Agrawal M, Doermann D (2009) In international conference on document analysis and recognition (IEEE), pp 1011–1015 Agrawal M, Doermann D (2009) In international conference on document analysis and recognition (IEEE), pp 1011–1015
5.
Zurück zum Zitat Moll MA, Baird HS, An C (2008) In: International workshop on document analysis system (IEEE), pp 379–385 Moll MA, Baird HS, An C (2008) In: International workshop on document analysis system (IEEE), pp 379–385
6.
Zurück zum Zitat Moll MA, Baird HS (2008) In document recognition and retrieval XV. In: Yanikoglu BA, Berkner K (eds) Proceedings of SPIE, pp 68150L–68150L-8 Moll MA, Baird HS (2008) In document recognition and retrieval XV. In: Yanikoglu BA, Berkner K (eds) Proceedings of SPIE, pp 68150L–68150L-8
7.
Zurück zum Zitat Bukhari SS, Ibrahim M, Shafait F, Breuel TM (2010) In: International workshop on document analysis system (ACM), pp 183–190 Bukhari SS, Ibrahim M, Shafait F, Breuel TM (2010) In: International workshop on document analysis system (ACM), pp 183–190
8.
Zurück zum Zitat Bukhari SS, Breuel TM, Asi A, El-Sana J (2012) In: International conference on frontiers in handwriting recognition, vol 639 Bukhari SS, Breuel TM, Asi A, El-Sana J (2012) In: International conference on frontiers in handwriting recognition, vol 639
9.
Zurück zum Zitat Shirali-shahreza M, Shirali-shahreza S (2005) In: Proceedings of 5th WSEAS international conference on signal processing and computing Geom Artif Vis, vol 163 Shirali-shahreza M, Shirali-shahreza S (2005) In: Proceedings of 5th WSEAS international conference on signal processing and computing Geom Artif Vis, vol 163
10.
Zurück zum Zitat Pietikäinen M, Okun O (2001) In: Proceedings of scandinavian conference on image analysis Pietikäinen M, Okun O (2001) In: Proceedings of scandinavian conference on image analysis
11.
Zurück zum Zitat Pietikäinen M, Okun O (2001) In: International workshop on document analysis system (IEEE), pp 286–291 Pietikäinen M, Okun O (2001) In: International workshop on document analysis system (IEEE), pp 286–291
12.
Zurück zum Zitat Okun O, Pietikäinen M (1999) Texture anal mach vis. World Scientific, Singapore, pp 165–177 Okun O, Pietikäinen M (1999) Texture anal mach vis. World Scientific, Singapore, pp 165–177
13.
Zurück zum Zitat Gautam A (2013) Segmentation of text from image document. Int J Comput Sci Inf Technol 4:538–540 Gautam A (2013) Segmentation of text from image document. Int J Comput Sci Inf Technol 4:538–540
14.
Zurück zum Zitat Lins RD (2009) A taxonomy for noise in images of paper documents—the physical noises. Image Anal Recognit 844–854 Lins RD (2009) A taxonomy for noise in images of paper documents—the physical noises. Image Anal Recognit 844–854
15.
Zurück zum Zitat Shafait F, Keysers D, Breuel TM (2008) Document recognition and retrieval XV. Proc SPIE 6815:681510CrossRef Shafait F, Keysers D, Breuel TM (2008) Document recognition and retrieval XV. Proc SPIE 6815:681510CrossRef
16.
Zurück zum Zitat Sauvola J, Pietikäinen M (2000) Adaptive document image binarization. Pattern Recognit 33:225–236 Sauvola J, Pietikäinen M (2000) Adaptive document image binarization. Pattern Recognit 33:225–236
17.
Zurück zum Zitat Dong J, Ponson D, Krzyżak A, Suen CY (2005) In: 8th international conference on document analysis and recognition (IEEE), pp 478–483 Dong J, Ponson D, Krzyżak A, Suen CY (2005) In: 8th international conference on document analysis and recognition (IEEE), pp 478–483
18.
Zurück zum Zitat Strouthopoulos C, Papamarkos N (1998) Text identification for document image analysis using a neural network. Image Vis Comput 16:879–896 Strouthopoulos C, Papamarkos N (1998) Text identification for document image analysis using a neural network. Image Vis Comput 16:879–896
19.
Zurück zum Zitat Raymer M, Punch W (2000) Dimensionality reduction using genetic algorithms. IEEE Trans Evol Comput 4:164–171 Raymer M, Punch W (2000) Dimensionality reduction using genetic algorithms. IEEE Trans Evol Comput 4:164–171
20.
Zurück zum Zitat Chang C, Lin C (2011) LIBSVM: a library for support vector machines. ACM Trans Intell Syst Technol 2:27–66 Chang C, Lin C (2011) LIBSVM: a library for support vector machines. ACM Trans Intell Syst Technol 2:27–66
21.
Zurück zum Zitat Dos Santos RP, Clemente GS, Ren TI, Cavalcanti (2009) In: 10th international conference on document analysis and recognition (IEEE), pp 651–655 Dos Santos RP, Clemente GS, Ren TI, Cavalcanti (2009) In: 10th international conference on document analysis and recognition (IEEE), pp 651–655
22.
Zurück zum Zitat Likforman-Sulem L (1995) In: 3rd international conference on document analysis and recognition (IEEE), pp 774–777 Likforman-Sulem L (1995) In: 3rd international conference on document analysis and recognition (IEEE), pp 774–777
23.
Zurück zum Zitat Bukhari SS, Shafait F, Breuel TM (2011) In: Proceedings of international conference on document analysis and recognition, ICDAR, vol 579 Bukhari SS, Shafait F, Breuel TM (2011) In: Proceedings of international conference on document analysis and recognition, ICDAR, vol 579
24.
Zurück zum Zitat Shi Z, Setlur S, Govindaraju V (2009) In: 10th international conference on document analysis and recognition, vol 176 Shi Z, Setlur S, Govindaraju V (2009) In: 10th international conference on document analysis and recognition, vol 176
25.
Zurück zum Zitat Jin J, Wang H, Ding X, Peng L (2005) Proc-Spie Int Soc Opt Eng 5676: 48 Jin J, Wang H, Ding X, Peng L (2005) Proc-Spie Int Soc Opt Eng 5676: 48
26.
Metadaten
Titel
Arabic document layout analysis
verfasst von
Amany M. Hesham
Mohsen A. A. Rashwan
Hassanin M. Al-Barhamtoshy
Sherif M. Abdou
Amr A. Badr
Ibrahim Farag
Publikationsdatum
08.02.2017
Verlag
Springer London
Erschienen in
Pattern Analysis and Applications / Ausgabe 4/2017
Print ISSN: 1433-7541
Elektronische ISSN: 1433-755X
DOI
https://doi.org/10.1007/s10044-017-0595-x

Weitere Artikel der Ausgabe 4/2017

Pattern Analysis and Applications 4/2017 Zur Ausgabe

Premium Partner