Zum Inhalt

A novel normal to tangent line (NTL) algorithm for scale invariant feature extraction for Urdu OCR

  • 30.11.2021
  • Original Paper
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Der Artikel stellt einen neuartigen Algorithmus zur skalierinvarianten Featurextraktion im Urdu-OCR vor, der sich auf den Schreibstil der Nastalique konzentriert. Urdu, die Nationalsprache Pakistans, stellt aufgrund seiner komplexen Schrift und unterschiedlichen Schriftgrößen einzigartige Herausforderungen dar. Der NTL-Algorithmus ist zusammen mit einer Variation der Winkellinie (ATL) dazu konzipiert, Dicken- und Richtungsmerkmale aus Urdu-Ligaturen zu extrahieren. Diese lokalen Merkmale, kombiniert mit globalen Merkmalen wie Höhe, Breite und Proportion, werden verwendet, um verschiedene Modelle zu trainieren, einschließlich korrelationsbasierter, C4.5- und ANN-Modelle. Die Leistung dieser Modelle wird mit SIFT-Deskriptoren verglichen, was eine verbesserte Genauigkeit der Urdu-OCR über verschiedene Schriftgrößen hinweg zeigt. Der Artikel diskutiert auch die Herausforderungen und Grenzen bestehender OCR-Systeme und schlägt Lösungen für die skaleninvariante Erkennung vor. Der veröffentlichte Datensatz der skaleninvarianten Merkmalsvektoren (SIFVs) ist ein bedeutender Beitrag, der weitere Forschung und Entwicklung im Urdu-OCR ermöglicht.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Titel
A novel normal to tangent line (NTL) algorithm for scale invariant feature extraction for Urdu OCR
Verfasst von
Asma Naseer
Sarmad Hussain
Kashif Zafar
Ayesha Khan
Publikationsdatum
30.11.2021
Verlag
Springer Berlin Heidelberg
Erschienen in
International Journal on Document Analysis and Recognition (IJDAR) / Ausgabe 1/2022
Print ISSN: 1433-2833
Elektronische ISSN: 1433-2825
DOI
https://doi.org/10.1007/s10032-021-00389-x
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, NTT Data/© NTT Data, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Kumavision/© Kumavision, Noriis Network AG/© Noriis Network AG, WSW Software GmbH/© WSW Software GmbH, tts GmbH/© tts GmbH, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Ferrari electronic AG/© Ferrari electronic AG