Zum Inhalt

Bottom-Up Scene Text Detection with Markov Clustering Networks

  • 10.02.2020
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Ein neuartiges Erkennungsrahmen namens Markov Clustering Network (MCN) wird für die schnelle und robuste Texterkennung von Szenen vorgeschlagen. Im Gegensatz zu den traditionellen Texterkennungsansätzen von Szenen, die von der klassischen Objekterkennung übernommen werden, erkennt MCN Textobjekte von Szenen auf Bottom-up-Weise. MCN prognostiziert Bounding Boxes auf Instanz-Ebene, indem es zunächst ein Bild in einen stochastischen Flussgraphen umwandelt, in dem Markov Clustering auf Grundlage der vorhergesagten stochastischen Flüsse durchgeführt wird. Die stochastischen Flüsse kodieren die lokale Korrelation und semantische Information von Textobjekten auf Szene. Ein Objekt wird als stark miteinander verbundene Knoten durch Flüsse modelliert, was flexible und Bottom-up-Erkennung für skalenvariierende und rotierte Textobjekte ohne vorherige Kenntnis der Objektgröße ermöglicht. Die Flussvorhersage wird durch die fortschrittlichen Architekturen von Convolutional Neural Networks und positionensitive Spatial Care Mechanism unterstützt, die verbesserte räumliche Aufmerksamkeit bieten, indem sie räumliche Darstellungen adaptiv verschmelzen.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 130.000 Bücher
  • über 540 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Oberflächen + Materialtechnik
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 100.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 75.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe
  • Oberflächen + Materialtechnik




 

Jetzt Wissensvorsprung sichern!

Titel
Bottom-Up Scene Text Detection with Markov Clustering Networks
Verfasst von
Zichuan Liu
Guosheng Lin
Wang Ling Goh
Publikationsdatum
10.02.2020
Verlag
Springer US
Erschienen in
International Journal of Computer Vision / Ausgabe 6/2020
Print ISSN: 0920-5691
Elektronische ISSN: 1573-1405
DOI
https://doi.org/10.1007/s11263-020-01298-y
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, ams.solutions GmbH/© ams.solutions GmbH, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Kumavision/© Kumavision, Noriis Network AG/© Noriis Network AG, WSW Software GmbH/© WSW Software GmbH, tts GmbH/© tts GmbH, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Ferrari electronic AG/© Ferrari electronic AG, Doxee AT GmbH/© Doxee AT GmbH , Haufe Group SE/© Haufe Group SE, NTT Data/© NTT Data