Skip to main content

2020 | OriginalPaper | Buchkapitel

The Notary in the Haystack – Countering Class Imbalance in Document Processing with CNNs

verfasst von : Martin Leipert, Georg Vogeler, Mathias Seuret, Andreas Maier, Vincent Christlein

Erschienen in: Document Analysis Systems

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Notarial instruments are a category of documents. A notarial instrument can be distinguished from other documents by its notary sign, a prominent symbol in the certificate, which also allows to identify the document’s issuer. Naturally, notarial instruments are underrepresented in regard to other documents. This makes a classification difficult because class imbalance in training data worsens the performance of Convolutional Neural Networks. In this work, we evaluate different countermeasures for this problem. They are applied to a binary classification and a segmentation task on a collection of medieval documents. In classification, notarial instruments are distinguished from other documents, while the notary sign is separated from the certificate in the segmentation task. We evaluate different techniques, such as data augmentation, under- and oversampling, as well as regularizing with focal loss. The combination of random minority oversampling and data augmentation leads to the best performance. In segmentation, we evaluate three loss-functions and their combinations, where only class-weighted dice loss was able to segment the notary sign sufficiently.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
3.
Zurück zum Zitat Harley, A.W., Ufkes, A., Derpanis, K.G.: Evaluation of deep convolutional nets for document image classification and retrieval. In: 13th International Conference on Document Analysis and Recognition (ICDAR), pp. 991–995 (2015) Harley, A.W., Ufkes, A., Derpanis, K.G.: Evaluation of deep convolutional nets for document image classification and retrieval. In: 13th International Conference on Document Analysis and Recognition (ICDAR), pp. 991–995 (2015)
6.
Zurück zum Zitat Heinz, K.: Monasterium.net: Auf dem Weg zu einem mitteleuropäischen Urkundenportal. Digitale Diplomatik. Neue Technologien in der historischen Arbeit mit Urkunden, pp. 70–77 (2009) Heinz, K.: Monasterium.net: Auf dem Weg zu einem mitteleuropäischen Urkundenportal. Digitale Diplomatik. Neue Technologien in der historischen Arbeit mit Urkunden, pp. 70–77 (2009)
8.
Zurück zum Zitat Ioffe, S., Szegedy, C.: Batch normalization: accelerating deep network training by reducing internal covariate shift. In: International Conference on International Conference on Machine Learning (ICML), pp. 448–456 (2015) Ioffe, S., Szegedy, C.: Batch normalization: accelerating deep network training by reducing internal covariate shift. In: International Conference on International Conference on Machine Learning (ICML), pp. 448–456 (2015)
10.
Zurück zum Zitat Kingma, D.P., Ba, J.: Adam: a method for stochastic optimization. In: International Conference on Learning Representations (ICLR) (2015) Kingma, D.P., Ba, J.: Adam: a method for stochastic optimization. In: International Conference on Learning Representations (ICLR) (2015)
16.
Zurück zum Zitat Weileder, M.: Das virtuelle deutsche Urkundennetzwerk : Ein Kooperationsprojekt zur Online-Bereitstellung von Urkunden im Kontext der Erschließung. Digitale Urkundenpräsentationen 6, 83–94 (2011) Weileder, M.: Das virtuelle deutsche Urkundennetzwerk : Ein Kooperationsprojekt zur Online-Bereitstellung von Urkunden im Kontext der Erschließung. Digitale Urkundenpräsentationen 6, 83–94 (2011)
17.
Zurück zum Zitat Weileder, M.: Spätmittelalterliche Notarsurkunden aus virtuellen Archiven. In: Sonderveröffentlichung der Staatlichen Archive Bayerns, vol. 10, pp. 50–57. Bayerische Staatsbibliothek (2014) Weileder, M.: Spätmittelalterliche Notarsurkunden aus virtuellen Archiven. In: Sonderveröffentlichung der Staatlichen Archive Bayerns, vol. 10, pp. 50–57. Bayerische Staatsbibliothek (2014)
18.
Zurück zum Zitat Weileder, M.: Spätmittelalterliche Notarsurkunden: Prokuratorien, beglaubigte Abschriften und Delegatenurkunden aus bayerischen und österreichischen Beständen, Archiv für Diplomatik. Beiheft, vol. 18. Böhlau (2019) Weileder, M.: Spätmittelalterliche Notarsurkunden: Prokuratorien, beglaubigte Abschriften und Delegatenurkunden aus bayerischen und österreichischen Beständen, Archiv für Diplomatik. Beiheft, vol. 18. Böhlau (2019)
19.
Metadaten
Titel
The Notary in the Haystack – Countering Class Imbalance in Document Processing with CNNs
verfasst von
Martin Leipert
Georg Vogeler
Mathias Seuret
Andreas Maier
Vincent Christlein
Copyright-Jahr
2020
DOI
https://doi.org/10.1007/978-3-030-57058-3_18