Zum Inhalt

VisionAid: A Real-Time System for Object Detection, Text Reading, and Voice Alerts for Visually Impaired Individuals

  • 2026
  • OriginalPaper
  • Buchkapitel
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

VisionAid ist ein intelligentes Assistenzsystem, das die Unabhängigkeit und Lebensqualität sehbehinderter Menschen verbessern soll. Das System begegnet den doppelten Herausforderungen des Umweltbewusstseins und des Textzugriffs, indem es mehrere fortschrittliche Technologien zu einer einzigen, zusammenhängenden Plattform vereint. Im Kern setzt VisionAid YOLOv8n zur Echtzeit-Objekterkennung ein, wodurch eine hohe Genauigkeit und geringe Fehlerquoten erreicht werden. Für die Texterkennung integriert das System die optische Zeichenerkennung (OCR) von Tesseract, die auch unter schlechten Bedingungen eine zuverlässige Textextraktion gewährleistet. Das System bietet sofortiges auditives Feedback durch Pyttsx3, eine Text-zu-Sprache-Engine auf Python-Basis. Der innovative Ansatz von VisionAid schließt die von früheren Systemen hinterlassenen Lücken und bietet eine leichte, skalierbare und benutzerfreundliche Lösung. Der Aufsatz skizziert das Design, die Entwicklung und die Leistung des Systems und leistet damit einen bedeutsamen Beitrag zur laufenden Forschung im Bereich der computergestützten visuellen Assistenz für Menschen mit Sehbehinderungen. Die Echtzeitleistung des Systems und die hohe Genauigkeit bei der Objekterkennung und Textextraktion machen es zu einer bemerkenswerten Weiterentwicklung in diesem Bereich, die es sehbehinderten Benutzern ermöglicht, komplexe Szenarien mit größerer Unabhängigkeit und Inklusivität zu navigieren.

Sie sind noch kein Kunde? Dann Informieren Sie sich jetzt über unsere Lizenzmodelle:

Einzelzugang

Starten Sie jetzt Ihren persönlichen Einzelzugang. Erhalten Sie sofortigen Zugriff auf mehr als 170.000 Bücher und 540 Zeitschriften - pdf-Downloads und Neu-Erscheinungen inklusive.

Jetzt ab 54,00 € pro Monat!                                        

Mehr erfahren

Zugang für Unternehmen

Nutzen Sie Springer Professional in Ihrem Unternehmen und geben Sie Ihren Mitarbeitern fundiertes Fachwissen an die Hand. Fordern Sie jetzt Informationen für Firmenzugänge an.

Erleben Sie, wie Springer Professional Sie in Ihrer Arbeit unterstützt!

Beraten lassen
Titel
VisionAid: A Real-Time System for Object Detection, Text Reading, and Voice Alerts for Visually Impaired Individuals
Verfasst von
Saanvi Sanjay
N. Shivani
Soham M Karia
Vaishnavi Mendon
B. V. Poornima
Copyright-Jahr
2026
DOI
https://doi.org/10.1007/978-3-032-06253-6_6
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, NTT Data/© NTT Data, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Deutsche Telekom MMS GmbH/© Vendosoft, Noriis Network AG/© Noriis Network AG, ams.solutions GmbH/© ams.solutions GmbH, Ferrari electronic AG/© Ferrari electronic AG, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Haufe Group SE/© Haufe Group SE, Doxee AT GmbH/© Doxee AT GmbH , Bild 1 Doxa Consulting (Sage-Advertorial 4/2026)/© Sage, Videocast 1: Standbild/© Springer Fachmedien Wiesbaden, KI-Wissen für mittelständische Unternehmen/© Dell_Getty 1999938268, IT-Director und IT-Mittelstand: Ihre Webinar-Matineen /© da-kuk / Getty Images / iStock