Die Transformation des öffentlichen Personennahverkehrs (ÖPNV) hin zu emissionsneutralen Antrieben ist für die Erreichung der Nachhaltigkeitsziele der UN als auch nationaler Strategien unabdingbar. In der EU wird dies insbesondere durch den European Green Deal forciert, der vorschreibt, dass alle ÖPNV-Betriebe ihr Fahrzeugflotten bis 2050 auf nachhaltige Antriebstechnologien umstellen müssen. Dies erfolgt in Abwägung zwischen Kosten und Emissionen aktuell in erster Linie mit der Beschaffung und Inbetriebnahme elektrisch betriebener Busse (E-Busse). Betrieb und Einsatz weichen dabei von klassischen Dieselbussen ab, da die Reichweiten begrenzt und zudem von zahlreichen Faktoren abhängen. Erste adaptive, auf Machine Learning (ML) basierende Ansätze für die Vorhersage des Energieverbrauchs wurden bereits in der Wissenschaft untersucht, bleiben aber meist theoretischer Natur und eine praxisnahe Betrachtung unter Einbezug betrieblicher Daten fehlt. Der vorliegende Beitrag schließt diese Lücke und stellt die Ergebnisse, die in Kooperation mit der Hamburger Hochbahn AG erarbeitet wurden, vor. Mit einem anwendungszentrierten und gestaltungsorientierten Ansatz sind betriebliche Daten analysiert, fünfzehn Experteninterviews durchgeführt und mehrere ML-Modelle trainiert worden, um Energieverbräuche von E‑Bussen mit einer durchschnittlichen Abweichung von unter 0,4 % zuverlässig vorherzusagen. Dies als auch identifizierte Herausforderungen und acht fundierte Gestaltungsempfehlungen, die die Entwicklung von Vorhersagensystemen für E‑Busse unterstützen, werden im Folgenden beschrieben, um die Transformation hin zur nachhaltigen und effizienten Mobilität zu fördern.
Der Verlag bleibt in Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutsadressen neutral.
1 Einleitung
Der Zugang zu zuverlässigen Mobilitätsdiensten ist für Bürgerinnen und Bürger entscheidend, um sich fortzubewegen und beruflichen als auch sozialen Aktivitäten nachzugehen. In urbanen Ballungsräumen und Städten sind leistungsfähige und emissionsneutrale Mobilitätsangebote zudem besonders wichtig, um den Bedarf an Parkraum, Straßen und Lärm zu reduzieren (Gabsalikhova et al. 2018) und Platz für z. B. Erholungsflächen und Parks zu schaffen (Vaithilingam et al. 2021). Diese Entwicklung findet sich auch in der Gesetzgebung und dem European Green Deal wieder, der vorschreibt, das alle öffentlichen Nahverkehrsunternehmen (ÖPNV) in Europa die CO2-Emissionen um 55 % bis 2030 reduzieren und Neutralität bis 2050 (European Commission 2021) erreichen müssen. Hierfür sind elektronisch betriebene Busse (E-Busse) entscheidend (Ruggieri et al. 2021). Gleichwohl ist die Transformation mit vielen ungeklärten Herausforderungen verbunden, wie von Ketter et al. (2023) beschreiben, da die Reichweiten von E‑Bussen im Vergleich zu Dieselbussen deutlich geringer sind und stark von den zu fahrenden Strecken, Routen, Wetterbedingungen und weiteren Faktoren abhängen (Carrilero et al. 2018; Perumal et al. 2022).
Derzeit arbeiten viele ÖPNV-Unternehmen bei der Berechnung der Reichweite bzw. des Energieverbrauchs mit pauschalen Kilometerverbräuchen und Erfahrungswerten, um E‑Busse zu disponieren und sicherzustellen, dass die zugewiesenen Strecken vollständig abfahren und nicht außerplanmäßig ausgetauscht werden müssen. Dies erschwert Planung und Einsatz und kann Ausfälle, die Anzahl an Ladezyklen und Verschleiß begünstigen. In der Literatur werden aktuell vor allem analytische Ansätze und mathematische Ansätze beschrieben, die aber nur begrenzt übertragbar und wenn überhaupt, häufig auf E‑Bus Daten von Teststrecken basieren (Perumal et al. 2022). Erkenntnisse über die Vorhersage des Energieverbrauchs, der als State-of-Charge (SoC) bezeichnet wird (Wong et al. 2021), sind unzureichend, auch wenn erste auf künstlicher Intelligenz (KI) bzw. auf dem Machine Learning (ML) basierende Ansätze existierenden. Um öffentliche E‑Bus-Betreiber dabei zu unterstützen, einen effektiven, effizienten und planbaren E‑Busbetrieb zu betreiben (Perumal et al. 2022), werden folgende Forschungsfragen (FF) mit Echtdaten untersucht.
Advertisement
FF1:
Wie sollen ML-basierte IT-Artefakte gestaltet werden, um öffentliche Verkehrsanbieter im Betrieb elektrisch betriebener Busse zu unterstützen?
FF2:
Wie kann der Energieverbrauch von E‑Bussen mithilfe von ML-Modellen zuverlässig vorhergesagt werden?
Die Beantwortung der Forschungsfragen folgt dem Design-Science-Research Paradigma und erfolgt in Kooperation mit der Hamburger Hochbahn AG (HOCHBAHN), die den Zugang zu innerbetrieblichen Daten als auch unterschiedlichen Fachexpert:innen ermöglicht. Für die Beantwortung von FF1 wird aufbauend auf der Literatur und Workshops, ein Entscheidungsunterstützungssystem für den E‑Bus Einsatz prototypisch implementiert und mit unterschiedlichen ÖPNV-Unternehmen evaluiert. Für die Beantwortung der FF2 werden mehrere ML-Modelle auf 24 Monaten Betriebsdaten der HOCHBAHN trainiert und evaluiert, um eine zuverlässige SoC-Vorhersage zu erreichen.
2 Grundlagen
Im Folgenden werden die Grundlagen des E‑Busbetriebs im ÖPNV beschrieben, bekannte Herausforderungen benannt und der existierenden Forschungsstand im Bereich der Energie- bzw. SoC-Vorhersage wiedergegeben.
Advertisement
2.1 ÖPNV-Busbetrieb
E- als auch Dieselbusse werden in Busdepot geladen, getankt und geparkt, wobei das Laden insb. über Nacht zutrifft, da der Großteil der Fahrzeuge tagsüber genutzt wird. Beim Einsatz bzw. der Disposition von Bussen werden die Fahrzeuge den zu fahrenden Strecken, die sich aus dem Linienfahrplan ergeben, zugeordnet. Dies inkludiert auch Umleitungen, die sich aus Baustellen, Straßensperrungen und weiteren Hindernissen ergeben.
Busse werden fast immer auf Fahrtumläufen eingesetzt, die meist vier und zwölf Linienfahrten umfassen. Jeder Umlauf beginnt mit der Abfahrt vom Busdepot zur ersten Linienfahrt, auf der Personen befördert werden. Diese Fahrt wird als Pull-Out bezeichnet, während die Fahrt von der letzten Linie zurück zum Busdepot als Pull-In bezeichnet wird (vgl. Abb. 1). Dazwischen werden mehrere Linienfahrten durchgeführt und Personen befördert, bis die Linie bzw. der Bus die letzte Station erreicht hat. Dabei ist es möglich, dass dieselbe Linie in die andere Richtung zurückgefahren wird, sodass der Bus nur seine Fahrtrichtung ändert. Gleichwohl ist es aber auch möglich, dass der Bus zu einer anderen ggf. weiter entfernten Linie fahren muss, um den Personenverkehr wieder aufzunehmen. Diese Fahrten werden als Zwischenfahrten bzw. Deadhead bezeichnet.
Abb. 1
Schematische Darstellung von Fahrtumläufen im ÖPNV-Busbetrieb
Die schwankenden Reichweiten von E‑Bussen erschweren dessen Einsatz und Betrieb. Dies trifft insb. zu, wenn einem E‑Bus einen Umlauf zugewiesen wird, bei dem nur schwer abgeschätzt und nicht garantiert werden kann, dass dieser vollständig abgefahren wird (Zhang et al. 2021). Bei unzureichender Batterieladung führt dies dazu, dass der E‑Bus im laufenden Betrieb ersetzt werden muss. Für den Austausch muss ein weiterer (E-)Bus sowie ein/e Fahrer/in zur Verfügung stehen, und alle Passagiere müssen an einer Station die Fahrzeuge wechseln, sofern dies nicht am Linienstart oder -ende erfolgen kann, was zu Verzögerungen führt und die Kundenzufriedenheit reduziert (Dirks 2021). Zusätzlich wird der Betrieb von E‑Bussen durch längere Ladezyklen im Vergleich zu Dieselmotoren beeinträchtigt. Das vollständige Betanken von Dieselbussen dauert meist zehn bis fünfzehn Minuten, während dies bei E‑Bussen stark von der Ladeinfrastruktur, der Batteriekapazität und dem Energiezugang abhängt. Ladestationen mit geringer Leistung laden mit nur 50 kWh, während Schnellladestationen 120 kWh und Pantografen-Ladestationen 300 kWh pro Stunde erreichen können. Letztere sind bis heute allerdings sehr kostenintensiv und aufgrund eines hohen Materialverschleißes nur für das gelegentliche Laden geeignet (Perumal et al. 2022). In Hinblick auf die Batteriekapazitäten von 190 bis 400 kWh bei E‑Bussen erfordert ein vollständiger Ladezyklus an Ladestationen mit geringer Leistung 3,8 bis 8 h und an Schnellladestationen 1,6 bis 3,3 h (Badia und Jenelius 2021).
2.3 Vorhersage des Ladezustands von E-Bussen
Es existieren verschiedene Ansätze zur Vorhersage des Ladezustands, der fast immer als State-of-Charge (SoC) angegeben wird und die Ladung der Batterie in Prozent von 0 bis 100 % abbildet (Wong et al. 2021). Da die E‑Bus-Batterien je nach Modell und ob Solo- oder Gelenkbus unterschiedliche Kapazitäten haben, sind bei Vergleichen die Modelltypen zu beachten und in der analytischen Literatur wird der SoC-Verbrauch pro Kilometer mit z. B. 0,8 bis 2,0 kWh pro Kilometer angegeben (Basma et al. 2019; Zhang et al. 2021). Mithilfe von ML-Modellen können Energieverbräuche für ganze Umläufe und auch Linienfahrten vorhergesagt werden (vgl. Abb. 1). Bei Linienfahrten kann Mithilfe von Echtzeitdaten so auch der SoC über Zeit bzw. die Linienfahrten mit zunehmender Genauigkeit bestimmt werden, was bei Umläufen nicht möglich ist (Borchers et al. 2025).
Szilassy und Földes (2022) entwickelten ein mathematisches Modell auf realen E‑Bus-Daten, das zentrale Merkmale von Busrouten wie Strecke, Geschwindigkeit, Batteriekapazität, Passagieranzahl und Temperatur berücksichtigt. Das Modell erreicht eine durchschnittliche Abweichung von 6 % des SoC bei Linienfahrten, weshalb diese eine Batteriereserve von bis zu 20 % empfehlen. Blades et al. (2024) erforschten verschiedene ML-Modelle unter Verwendung von Echtzeitdaten und heben den Einfluss der Außentemperatur hervor, da diese sich bei besonders kalten als auch besonders hohen Temperaturen auf die Nutzung der Klimaanlage und Heizung und somit den Energieverbrauch auswirkt. Elmi und Tan (2021) untersuchten das SoC-Verhalten einer Fahrzeugflotte eines Unternehmens in Michigan und konzentrierten sich auf vier verschiedene Arten von Fahrzeugen, die mit Benzin, Strom oder beidem (hybrid) betrieben wurden, und trainierten verschiedene ML-Modelle und erreichten eine Abweichung von 3 %, wobei hier auch E‑Autos enthalten sind. Li et al. (2021) konzentrierten sich wiederum auf E‑Busse in China und erreichten mit 163.800 Liniendaten eine durchschnittliche Abweichung von 1,79 %, was die Nutzung pauschaler Kilometerverbräuche infrage stellt.
3 Methodisches Vorgehen
Für die Beantwortung der Forschungsfragen wird auf das Design Science Research (DSR) Paradigma zurückgegriffen, da dies die Entwicklung von theoretischen als auch praktischen Wissen unterstützt. Ergebnisse können so als Gestaltungs- und Handlungsempfehlungen formuliert und über die Entwicklung und Evaluation von IT-Artefakten erreicht werden. In der Praxis existierenden unterschiedliche DSR Vorgehensweisen und diese Arbeit folgt dem DSR-Modell von Peffers et al. (2007) und wird wie in Abb. 2 dargestellt, durchgeführt.
Die HOCHBAHN ist mit über 1100 Bussen und mehr als 6600 Mitarbeitenden das zweitgrößte deutsche ÖPNV-Unternehmen. Die HOCHBAHN setzt die Transformation hin zu E‑Bussen seit 2017 um und inzwischen werden über 20 % der Busse mit Elektromotoren betrieben. Für die Durchführung dieser Studie hat die HOCHBAHN Sensordaten der E‑Busse bereitgestellt und den Zugang zu Expertinnen und Experten aus unterschiedlichen Fachbereichen ermöglicht.
3.1 Austausch und Diskussion mit E-Bus Expertinnen und Experten
Für die Beantwortung der FF1 haben wir uns in Phase 2 mit der HOCHBAHN im Rahmen von zwei Workshops ausgetauscht und die Grundlage für die Experteninterviews erarbeitet. Nach der Entwicklung wurden mit weiteren Expertinnen und Experten der HOCHBAHN als auch aus anderen ÖPNV-Unternehmen Herausforderungen, Bedarfe und die entwickelten Lösungen diskutiert (Iivari et al. 2021). Das Interesse an der Thematik war überwältigend, da alle ÖPNV-Unternehmen in diesen Bereich vor vergleichbaren Herausforderungen stehen, sodass insgesamt neun verschiedene ÖPNV-Unternehmen und ein Anbieter von Busmanagementsystemen befragt werden konnten. Alle Experteninterviews wurden aufgezeichnet, transkribiert und nach der qualitativen induktiv-deduktiven Inhaltsanalyse nach Mayring (2014) ausgewertet.
3.2 Beschreibung und Analyse betrieblicher E-Bus Daten
Als Grundlage für die Analyse und das Training von ML-Modellen hat die HOCHBAHN E‑Bus Daten für einen Zeitraum von 24 Monaten (29.03.2021 bis 12.04.2023) mit insgesamt 98 unterschiedlichen E‑Bussen und 353.271 Linienfahrten, die in der Stadt Hamburg und dessen Peripherie durchgeführt wurden, bereitgestellt. Die Daten stammen aus zwei unterschiedlichen Datenbanken und wurden mithilfe eines Skriptes zusammengeführt.
Das erste System ist das Fahrgastinformations- und Managementsystem, das Daten über Funk mit geringer Reichweite an den Bushaltestellen sammeln, indem E‑Bus und Station sich miteinander verbinden. Hierdurch werden Angaben zu Ankunft und Abfahrt an Haltestellen, Busnummer, Liniennummer, Richtung, Art der Fahrt und Umlauf (vgl. Abb. 1) festgehalten. Das zweite System ist das Telemetriedatensystem. Dieses umfasst Telemetriedaten, die von allen E‑Bussen im Sekundentakt übermittelt und zu Minutenreports aggregiert werden und Angaben wie Zeitstempel, Busnummer, Kilometerstand, Außentemperatur und State of Charge umfassen. Zudem wird die Bus-ID mitgesendet, sodass das Busmodell, der Batterietyp und die Kapazität bekannt sind. Beide Datensätze wurden zu einem Datensatz zusammengeführt und einzelne Werte wie Fahrtdauer und Distanzen berechnet. Dieser Datensatz beinhaltet 27 Attribute, die genutzt werden, um den SOCDiff, also den SoC Verbrauch auf einer Linie vorherzusagen, welcher als 28. Attribut im Datensatz enthalten ist (vgl. Anhang). Ergänzend dazu wurden über die SensorThings API des Landesbetrieb für Geoinformationen und Vermessung (LGV) in Hamburg Daten von 816 Infrarot-IoT-Sensoren, die vorbeifahrende Fahrzeuge zählen, genutzt, um Informationen über die Verkehrsdichte zu erhalten. Die Sensoren, die meist an Ampelanlagen vielbefahrender Straßen installiert sind, erfassen kontinuierlich Daten und zählen die Anzahl der auf den Hamburger Straßen fahrenden Fahrzeuge.
4 Ergebnisse und Handlungsempfehlungen
Die Identifikation von Herausforderungen und Diskussion von Lösungen mit den unterschiedlichen Expertinnen und Experten verdeutlichte, dass viele ÖPNV-Anbieter vor ähnlichen Herausforderungen stehen und Systeme für die zuverlässige SoC-Vorhersage benötigen. Gleichwohl wurde ersichtlich, dass solche Systeme nicht nur in der Fahrtüberwachung, sondern auch Disposition eingesetzt werden können.
4.1 Herausforderungen und Gestaltungsprinzipien
Aktuell arbeiten alle ÖPNV-Unternehmen mit Batteriereserven von 10 % bis 20 %, um sicherzustellen, dass E‑Busse zu fahrende Umläufe vollständig abfahren können. Dies begrenzt allerdings den Einsatz von E‑Bussen, da diese hierdurch nicht immer auf allen Strecken eingesetzt und Dieselbusse teils bevorzugt werden, was zudem auch durch längere Ladezeiten verstärkt wird.
Herausforderung 1: Begrenzter E‑Bus Einsatz aufgrund geringerer Reichweiten und hohen Batteriereserven, die diesen Effekt verstärken.
Herausforderung 2: Reduzierte E‑Bus Verfügbarkeiten aufgrund langer Ladezeiten und hohen Batteriereserven.
Herausforderung 3: Höheres Ausfallrisiko und Risiko einer betrieblichen Störung durch den Austausch von E‑Bussen, wenn diese abzufahrenden Umläufe nicht beenden können.
Herausforderung 4: Notwendigkeit höherer Batteriereserven und/oder weiterer (E-)Busse, Fahrerinnen und Fahrer, um kurzfristig E‑Busse austauschen zu können.
In den Diskussionen (vgl. Tab. 1) wurde zudem deutlich, dass neben den Bereichen, die für die Überwachung der fahrenden E‑Busse auch die Disponenten und Busdepot SoC-Vorhersagen nutzen wollen. Während die Busüberwachung dafür zuständig ist, Busse bei Bedarf auszutauschen, weisen die Disponenten (E-)Busse den Umläufen zu und können bei zuverlässigen SoC-Vorhersagen die Einsatzzeiten von E‑Bussen erhöhen, da bei zuverlässigen Vorhersagen geringer Batteriereserven ausreichen. Zudem können die Busdepots das Laden von E‑Bussen besser planen, wenn diesen bekannt ist, mit welchem SoC ein E‑Bus das Depot erreicht und auf welchem Umlauf dieser als nächstes fahren soll. Hierdurch wird unterstützt, dass E‑Busse auch nur teilweise und nicht vollständig für die nächste Fahrt aufgeladen werden, da die benötigte Ladekapazität für den nächsten Umlauf Stunden im Voraus bekannt ist. Dies ist insbesondere bei Busdepots von geringer Größe und mit wenigen E‑Ladesäulen hilfreich.
Design-Prinzip 1: SoC-Vorhersagen-Systeme sollen so gestaltet werden, dass die Busdisponenten den SoC für vollständige Umläufe vorab und für infrage kommende Umläufe angezeigt bekommen, um E‑Busse effektiv zuzuweisen und deren Betriebszeiten zu erhöhen.
Design-Prinzip 2: SoC-Vorhersagen-Systeme sollen so gestaltet werden, dass diese auf Linien- und Umlaufebene die Busüberwachung unterstützen und aktiv auf geringe SoC hinweisen, um den planbaren Austausch von E‑Busen unterstützen.
Design-Prinzip 3: SoC-Vorhersagen-Systeme sollen den zu erwartenden SoC beim Pull-In (automatisch) an die Busdepots kommunizieren, damit diese die Platzierung und das Aufladen von E‑Bussen optimieren können.
Design-Prinzip 4: SoC-Vorhersagen sollen intuitiv lesbar und nachvollziehbar sein und möglichst in bereits vorhandene Systeme integriert werden.
Während Design-Prinzip 1 die Einsatzplanung der E‑Busse betrifft, adressiert Design-Prinzip 2 die Busüberwachung, auf der in dieser Arbeit der Fokus liegt und das auch mit dem Webprototyp umgesetzt wurde. Die Darstellung der SoC-Vorhersagen nach Design-Prinzip 2 ist wie in Abb. 3 gezeigt möglich und wurden den Expertinnen und Experten vorgestellt und diskutiert (vgl. Tab. 1). In der Abb. 3 wird die Vorhersage am Beispiel der Linie 28 gezeigt und da diese den Umlauf mit einen SoC von weniger als 10 % (exemplarischer Grenzwert) beendet, wird diese rot hervorgehoben. Die orange hervorgehobene Zeile hebt die Linie hervor, die der Bus aktuell abfährt, weshalb es für diese und die Linien darunter noch keine SoC-Aktuell und Differenz Werte gibt, sondern nur die SoC-Vorhersage.
Abb. 3
Darstellung der SoC-Vorhersage für fahrende E‑Busse (Webprototyp)
Design-Prinzip 3 konzentriert sich auf das Laden und die Positionierung von Bussen in den Busdepots, wo Busse häufig in Reihe abgestellt werden. In den Experteninterviews wurde deutlich das insb. kleine Busdepot hier Handlungsbedarf haben, um Fahrzeuge gezielter zu platzieren, zu laden und zu disponieren. Design-Prinzip 4 leitet sich aus dieser Diskussion ab und während einige Expertinnen und Experten ein intuitiveres Design forderten, hoben andere den Aspekt der Transparenz, der auch mit dem (teils begrenzten) Vertrauen in ML-Modelle und fehlenden Erfahrungen korreliert (Lukyanenko et al. 2022), hervor. Entsprechend zielt Design-Prinzip 4 auf die intuitive Darstellung einer Lösung ab und hebt hervor, dass die Funktionen möglichst in vorhandene Systeme, die insb. bei größeren ÖPNV-Unternehmen vorhanden sind, zu integrieren, um die Anzahl an IT-Systemen, Wartungsaufwände als auch Redundanzen nicht zu erhöhen.
4.2 ML-basierte Erkenntnisse und Empfehlungen
Für den Prototyp in Abb. 3 wurden mithilfe der in Abschn. 3.2 beschriebenen Daten mehrere ML-Modelle mit eine cross-validation von 5 mit 80 % der Daten trainiert und mit 20 % der Daten getestet, um den SoC für zu fahrende Linien vorhersagen. Die Ergebnisse wurden miteinander verglichen und zudem analysiert, um Einflüsse uns Zusammenhänge zu identifizieren. Die zuverlässigsten ML-Modelle sind LightGBM, XGBoost und LSTM. LightGBM ist für die Entwicklung von Regressionsmodelle mit großen Daten in hoher Geschwindigkeit geeignet. XGBoost ist für seine hohe Vorhersagenzuverlässigkeit bekannt und LSTM ist ein Long-Short-Term-Memory Ansatz, der darauf ausgerichtet ist, in Datenketten rekurrente Abhängigkeiten über zeitliche Verläufe zu erkennen (Wong et al. 2021).
Tab. 2 präsentiert die Ergebnisse der drei ML-Modelle. Der Mean Absolute Percentage Error (MAPE) bewertet den Vorhersagenfehler in Prozent vom tatsächlich bei der Fahrt gemessenen Wert. In allen drei Modellen liegt dieser nahe einem Prozent, was bereits sehr präzise ist und auf nur geringe Ausreißer hinweist. Der Root Mean Square Error (RMSE) gibt den durchschnittlichen Fehler des SoC an (Chicco et al. 2021). Da der SoC in Prozent angeben wird, ist RMSE hier auch in Prozent zu interpretieren. Der beste RMSE wurde beim LightGBM erreicht. In Hinblick auf in der Praxis genutzte und auch von der Literatur empfohlene Reserven von 10 bis 20 % SoC sind mit diesem Modell deutlich geringer Batteriereserven möglich. Gleichwohl ist zu beachten, dass das Modell Linien und nicht Umläufe vorhersagt und Umlaufe bei der HOCHBAHN bis zu zwölf Linienfahrten umfassen, womit der durchschnittliche Fehler bis zu 4,626 % bzw. SoC betragen kann. Bei einer Überprüfung dieses Werts mit den Testaten wurde dabei allerdings deutlich, dass sich der Fehler für Umlaufe bei ca. 3 % einpendelt, da sich die zu hohen und zu geringen Vorhersagen etwas ausgleichen.
Tab. 1
Übersicht befragter Expertinnen und Experten
Nr.
Unternehmen
Rolle
Erfahrung (Jahre)
Dauer (min)
E1
ÖPNV 1
Einsatzleitung E‑Bus
Unbek.
40
E2
Leitender Technischer Referent
Unbek.
E3
ÖPNV 2
Leitung E‑Bus Projekt
9
50
E4
Leitung E‑Bus Beschaffung
9
E5
ÖPNV 3
Teamleitung E‑Bus
2
54
E6
Leitung E‑Bus Projekt
1
E7
ÖPNV 4
Leitung E‑Bus Projekt
25
45
E8
ÖPNV 5
Leitung Bus- und Lademanagement
7
86
E9
ÖPNV 6
Leitung E‑Bus Projekt
2
80
E10
ÖPNV 7
Leitung E‑Bus Projekt
8
52
E11
Hersteller
Abteilungsleiter Bus
22
87
E12
Leitung Depotmanagement
2
E13
Leitung Busmanagement
1
E14
ÖPNV 8
Leitung Technologie und Infrastruktur
11
42
E15
ÖPNV 9
Leitung E‑Bus Projekt
12
35
Durchschnitt/Summe
8,5
571
Tab. 2
Vergleich trainierter ML-Modelle
Metrik
LightGBM (%)
XGBoost (%)
LSTM (%)
MAPE
0,0933
0,1134
0,1255
RMSE
0,3855 (SoC)
0,4893 (SoC)
0,5337 (SoC)
SHAP-Werte werden genutzt, um den Einfluss von Attributen auf die Vorhersage von ML-Modellen zu untersuchen (Z. Li 2022). Abb. 4 visualisiert dies für den Einfluss der durchschnittlichen Temperatur (TempAvg, vgl. Anhang) und verdeutlicht den starken Einfluss auf den Energieverbrauch, besonders bei Temperaturen um 8 °C. Bei dieser Temperatur aktivieren viele E‑Busse ihre Heizung, die bei vielen Busmodellen mit einen kleinen Verbrennungsmotor betrieben wird, wodurch der Energieverbrauch ab 8 °C sinkt. Bei E‑Bussen mit geringer Batteriekapazität ist der Effekt allerdings deutlich stärker als bei E‑Bussen mit großer Kapazität. Im Temperaturbereich zwischen 13 und 25 °C gleicht sich der Einfluss der Temperatur für alle Batteriekapazitäten an und bei höheren Temperaturen ab 25 °C und mehr steigt der Energieverbrauch, da die Kühlung mehr Energie benötigt, was Blades et al. (2024) Ergebnisse bestätigt.
Design-Prinzip 5: Bei der Entwicklung und dem Training von ML-Modellen für die Vorhersage des SoC von E‑Bussen sind Temperatureinflüsse unbedingt zu berücksichtigen.
Abb. 4
SHAP-Werte für die Durchschnittstemperatur (TempAvg) mit Bezug auf die Batteriekapazität (BatCap) für das LightGBM Model
In Abb. 5 (links) wird der durchschnittliche Einfluss der Attribute auf das ML-Model dargestellt. Deutlich wird das TripLenght (km) und TripTime (Fahrzeit) mit Abstand den größten Einfluss auf das ML-Modell haben. Unerwartet war, dass die Busnummer (BusNr) ebenfalls einen Einfluss hat, was aber ggf. darauf zurückzuführen ist, dass die Busnummer implizit Informationen über den Verbrauch beinhaltet, gerade wenn E‑Busse immer auf denselben Umläufen eingesetzt werden.
Design-Prinzip 6: Attribute haben einen unterschiedlich starken Einfluss auf die Zuverlässigkeit von SoC-Vorhersagen-Modellen und es sind insbesondere TripLenght, TripTime, BatRange, BatCap, TempMin, TempMax, StartEndStop, SoCStart, Linie und Hour zu beachten.
Abb. 5
Dateneinfluss (links) und SHAP-Werte (rechts) auf das ML-Model
In Abb. 5 wird rechts der Einfluss der Daten auf die SoC-Vorhersage angezeigt, um zu verdeutlichen, wann die Attribute die SoC-Vorhersage erhöhen oder reduzieren. Wenn die Werte in der horizontalen bei „0“ liegen, verändern sie die Vorhersagen nicht. Wenn sie höher sind wie z. B. bei der Triplänge, haben sie einen stärkeren Einfluss und erhöhen den SoC-Verbrauch. Wie zu erwarten ist auch hier die Triplänge (TripLength) am einflussreichsten und die Abbildung zeigt, das längere Routen einen den SoC-Verbrauch erhöhen. Ebenfalls ersichtlich wird, dass ein geringer SoCStart, sprich der Ladezustand beim Verlassen des Busdepots, einen eher geringeren Einfluss auch auf die Vorhersage hat, der erhöhende und reduzierende Einfluss sich im Vergleich zu TripLenght aber gegensätzlich verhält. Dies deutet darauf hin, dass vollständig geladene Batterien weitere Reichweiten unterstützen, da sich die Batterien nicht linear entladen. Zudem wird ersichtlich, dass die durchschnittliche Geschwindigkeit (SpeedAvg) einen nur geringen Einfluss hat und eine geringere durchschnittliche Geschwindigkeit die Reichweite eher erhöht. Dabei ist unklar, ob SpeedAvg auch mit einer insgesamt eher langsameren Fahrtweise korreliert, da Informationen über die Intensität von Beschleunigungen und Bremsvorgängen fehlen.
Design-Prinzip 7: In Hinblick auf die Verfügbarkeit von Daten und dem (wirtschaftlichen) Aufwand, diese zu erheben, können Attribute mit geringem Einfluss ignoriert werden, sofern die SoC-Vorhersagen weiterhin ausreichend präzise sind, um den E‑Busbetrieb zu unterstützen.
Design-Prinzip 8: Mehr Attribute führen nicht immer zu einer besseren Vorhersage! Die Datenqualität und -aufbereitung (insb. bei Verkehrsdaten) sind zu beachten und im Kontext der Zielsetzung und Wirtschaftlichkeit zu bestimmen.
Wie in Abschn. 3.2 beschrieben wurden auch weitere Vorhersagemodelle mit Attributen, die Aufschluss über die Verkehrsdichte geben, trainiert. Unerwartet war, dass die vorliegenden Verkehrsdaten aus Hamburg die SoC-Vorhersagen verschlechterten. Dies lässt darauf schließen, dass die Art der Verkehrsdaten in der aktuellen Verfügbarkeit und Aufbereitung als auch Umfang nicht hilfreich sind, damit das Modell davon sinnvoll abstrahieren kann. Um die Verkehrsdichte zu berücksichtigen, ist es ggf. notwendig, Verkehrsdaten für alle einzelnen Linien zu erheben, was derzeit nicht erfolgt und mit erheblichem Aufwand verbunden ist und zu Design-Prinzip 8 führt (Guastella et al. 2023).
5 Fazit
In diesem Beitrag wurde anhand der Forschungsfragen „Wie sollen ML-basierte IT-Artefakte gestaltet werden, um öffentliche Verkehrsanbieter im Betrieb elektrisch betriebener Busse zu unterstützen?“ (FF1) und „Wie kann der Energieverbrauch von E‑Bussen mithilfe von ML-Modellen vorhergesagt werden?“ (FF2) untersucht, wie ML-Modelle im E‑Bus Bereich trainiert und Lösungen gestaltet werden sollen. Durch den Austausch mit Expertinnen und Experten aus verschiedenen Unternehmen wurden vier übergeordnete Herausforderungen identifiziert, die dessen Ursache in der Abwesenheit zuverlässiger Vorhersagemodelle für den SoC von E‑Bussen liegt (Szilassy und Földes 2022). Diese führen in unterschiedlichem Maße zum reduzierten und begrenzten Einsatz von E‑Bussen, da Disposition als auch Betrieb erschwert sind und mit Reserven in den Batterien kompensiert werden. Als Reaktion darauf wurde eine praktikable Lösung konzipiert und entwickelt. Dieses System (vgl. Abb. 3) unterstützt die Busüberwachung, die E‑Bus-Disponenten und die Busdepots darin, fundierte Entscheidungen zu treffen, um die Effizienz des E‑Busbetriebs in den Bereichen Fahrzeugflotte und Infrastruktur zu erhöhen (Ketter et al. 2023).
Bezüglich FF1 zeigt die Entwicklung eines Entscheidungsunterstützungssystems auf, wie IT-Artefakte unter Berücksichtigung der hergeleiteten Design-Prinzipien 1 bis 4 gestaltet werden sollen. Diese dienen als Grundlage und geben die Gestaltungsrichtung vor. Gleichwohl sind bei der Umsetzung und Entwicklung von Lösungen lokale Bedingungen und die vorherrschenden IT-Infrastrukturen zu berücksichtigen, um bedarfsgerechte Lösungen zu erreichen. Der Prototyp in Abb. 3 kann dabei als Grundlage genutzt werden.
Für die Untersuchung und Beantwortung von FF2 wurden mehrere ML-Modelle trainiert, evaluiert und optimiert, wobei das LightGBM-Modell die besten Ergebnisse lieferte (Sun et al. 2011). Die Verlässlichkeit der SoC-Vorhersage ermöglicht eine Reduzierung von Batteriereserven, was die Einsatzzeiten erhöht und betriebliche Abläufe unterstützt. Unsere Ergebnisse zeigen, dass mit den genannten und im Anhang aufgelisteten Attributen eine sehr zuverlässige Vorhersage des SoC mit einer durchschnittlichen Abweichung von unter 0,4 % vom SoC möglich ist. Die Analyse der Attribute nach der SHAP-Methode visualisiert zudem den unterschiedlichen Einfluss der Attribute auf die Vorhersage, was zu den Design-Prinzipien 5 bis 7 führte. Gleichwohl sind Daten und Attribute nicht statisch, sondern im Betrieb kontinuierlich zu beachten und ML-Modelle weiterzuentwickeln (Alarrouqi et al. 2024). Dabei sind die Design-Prinzipen 7 und 8 zu beachten, damit Lösungen immer im wirtschaftlichen Gleichgewicht zum Nutzen stehen. Zudem führen mehr Attribute und Daten nicht immer zu besseren Vorhersagen und lokale Faktoren sind unbedingt zu berücksichtigen (Zhang et al. 2021). So sind in bergigen Regionen und Städten geografische Faktoren z. B. deutlich stärker zu beachten als in Hamburg, wo es nur geringe Unterschiede bei den Höhenmetern gibt. Diese können Energieverbrauche erhöhen, auch wenn beim Bremsen (bergabwärts) durch Rückkopplung Energie zurückgewonnen wird. Entsprechend sind die ML-bezogenen Erkenntnisse nicht universell übertragbar. Zudem kann nicht ausgeschlossen werden, das alte Batterien, die über eine hohe Anzahl an Ladezyklen verfügen, unter Verschleiß leiden (Tepe et al. 2023). Dieser Faktor wurde in dieser Studie nicht berücksichtigt, da der Großteil der E‑Busse der HOCHBAHN nur wenige Jahre alt ist und keine Daten hierzu vorliegen. In Hinblick auf die von Herstellern ausgegeben sieben bis acht Jahre Batterielebenszeit kann dieser Faktor in den kommenden zwei bis drei Jahren aber an Bedeutung gewinnen. Im Kontext dieser Entwicklung ist zudem zu untersuchen, ob mithilfe von Differenzen zwischen SoC-Vorhersage und Messung auch auf Materialermüdung und Verschleiß bei E‑Bussen geschlossen werden kann, um die proaktive Wartung zu unterstützen und den Fokus von FF1 erweitert (Rücker et al. 2024).
Insgesamt fassen die identifizierten Herausforderungen aktuelle Problem zusammen und tragen mit den hergeleiteten Handlungsempfehlungen in Form von Design-Prinzipien und den entwickelten SoC-Vorhersagemodellen zur nachhaltigen Mobilität im Rahmen des European Green Deal bei und bieten eine wertvolle Grundlage für die praktische Umsetzung im ÖPNV.
Danksagung
Diese Arbeit ist im Rahmen einer bestehenden und andauernden Kooperation mit der Hamburger Hochbahn AG (HOCHBAHN) entstanden. Ein besonderer Dank gilt Frau Johanna Ahrens (Fachbereichsleitung Managementsysteme Bus), Herrn Felix Schmidt (Fachbereich Managementsysteme Bus) und Herrn Jan Krause (Corporate Innovation Manager im Bereich Hamburg-Takt), die diese Arbeit ermöglichten und mit betrieblichen Daten, Prozess- und Fachwissen bereicherten.
Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Lizenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden. Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen. Weitere Details zur Lizenz entnehmen Sie bitte der Lizenzinformation auf http://creativecommons.org/licenses/by/4.0/deed.de.
Hinweis des Verlags
Der Verlag bleibt in Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutsadressen neutral.
Our product recommendations
HMD Praxis der Wirtschaftsinformatik
HMD liefert IT-Fach- und Führungskräften Lösungsideen für ihre Probleme, zeigt ihnen Umsetzungsmöglichkeiten auf und informiert sie über Neues in der Wirtschaftsinformatik (WI).
Für die Erstellung des Datensatzes für das Training der ML-Modelle wurden die Sensordaten der HOCHBAHN und berechnete Werte genutzt. Der abschließende Datensatz beinhaltet folgende 28 Attribute, um den SOCDiff (Wert 28) vorherzusagen.
1.
CircID: Eindeutige ID des Fahrtumlaufs
2.
CircNr: Nummer, die Umläufe identifiziert, die aus denselben Fahrten bestehen
3.
TripID: Eindeutige Kennung für eine Fahrt, die aus n ≥ 1 Haltestellen besteht
4.
TripNr: Nummer, die Fahrten identifiziert, die aus denselben Haltestellen bestehen
5.
BusNr: Nummer, die einen Bus (Fahrzeug) eindeutig identifiziert
6.
BusType: Bus-Typ (Gelenkbus oder Solo-Bus)
7.
BusModel: Bus Model (z. B. EvoBus, eCitaro, Solaris etc.)
8.
BatType: Typ der im Bus verwendeten Batterie
9.
BatCap: Maximale Batteriekapazität in kWh (bewertet vom Hersteller)
10.
BatRange: Maximale Batteriereichweite in km (bewertet vom Hersteller)
11.
Line: Busliniennummer, die die Route angibt, die der Bus fährt
12.
FahrtCode: Code, der die Art der Fahrt identifiziert (Linienfahrt, Pull-Out, Pull-In, Deadhead)
13.
StartEndStop: Identifiziert die Start- und Endhaltestelle einer Fahrt
14.
Year: Jahr, in dem die Fahrtdaten erfasst wurden
15.
Month: Monat, in dem die Fahrtdaten erfasst wurden
16.
Weekday: Wochentag, an dem die Fahrt stattfand
17.
Hour: Stunde des Tages, zu der die Fahrt begonnen hat
18.
TempMin: Minimale Temperatur während der Fahrt
19.
TempAvg: Durchschnittstemperatur während der Fahrt
20.
TempMax: Maximale Temperatur während der Fahrt
21.
MinuteStampStart: Zeitstempel, der den Beginn der Fahrt markiert
22.
MinuteStampEnd: Zeitstempel, der das Ende der Fahrt markiert
23.
TripLength: Gesamtdistanz der Fahrt in Kilometern
24.
TripTime: Gesamtdauer der Fahrt in Minuten
25.
SpeedAvg: Durchschnittliche Geschwindigkeit des Busses während der Fahrt in Kilometern pro Stunde
26.
SOCStart: State of Charge (Ladezustand) der Batterie zu Beginn der Fahrt
27.
SOCEnd: State of Charge der Batterie am Ende der Fahrt
28.
SOCDiff: Differenz des State of Charge der zu Beginn und am Ende der Fahrt gemessen wurde und den Verbrauch wiedergibt.
Basma H, Mansour C, Haddad M, Nemer M, Stabat P (2019) Comprehensive energy assessment of battery electric buses and diesel buses. 32nd International Conference on Efficiency, Cost, Optimization, Simulation and Environmental Impact of Energy Systems. (https://hal.science/hal-02169856)
Blades LAW, Matthews T, McGrath TE, Early J, Cunningham G, Harris A (2024) Predicting energy consumption of zero emission buses using route feature selection methods. Transp Res Part D Transp Environ 130:104158. https://doi.org/10.1016/j.trd.2024.104158CrossRef
Borchers M, Milutzki E, Bittner E (2025) Designing ML-based prediction systems for the energy consumption of electric buses to support public transport providers. Proceedings of the 58th Hawaii International Conference on System Sciences. Hawaii International Conference on System Sciences, USA. https://doi.org/https://hdl.handle.net/10125/109050
Carrilero I, González M, Anseán D, Viera JC, Chacón J, Pereirinha PG (2018) Redesigning European public transport: impact of new battery technologies in the design of electric bus fleets. Transp Res Procedia 33:195–202. https://doi.org/10.1016/j.trpro.2018.10.092CrossRef
Chicco D, Warrens MJ, Jurman G (2021) The coefficient of determination R‑squared is more informative than SMAPE, MAE, MAPE, MSE and RMSE in regression analysis evaluation. PeerJ Comput Sci 7:e623. https://doi.org/10.7717/peerj-cs.623CrossRef
Elmi S, Tan K‑L (2021) DeepFEC: energy consumption prediction under real-world driving conditions for smart cities. In: Proceedings of the Web Conference 2021, S 1880–1890 https://doi.org/10.1145/3442381.3449983CrossRef
Guastella DA, Cornelis B, Bontempi G (2023) Traffic simulation with incomplete data: the case of Brussels. In: Proceedings of the 1st ACM SIGSPATIAL international workshop on methods for enriched mobility data: emerging issues and ethical perspectives 2023, S 15–24 https://doi.org/10.1145/3615885.3628004CrossRef
Ketter W, Schroer K, Valogianni K (2023) Information systems research for smart sustainable mobility: a framework and Call for action. Inf Syst Res 34(3):1045–1065. https://doi.org/10.1287/isre.2022.1167CrossRef
Li P, Zhang Y, Zhang Y, Zhang Y, Zhang K (2021) Prediction of electric bus energy consumption with stochastic speed profile generation modelling and data driven method based on real-world big data. Appl Energy 298:117204. https://doi.org/10.1016/j.apenergy.2021.117204CrossRef
Lukyanenko R, Maass W, Storey VC (2022) Trust in artificial intelligence: from a foundational trust framework to emerging research opportunities. Electron Markets 32(4):1993–2020. https://doi.org/10.1007/s12525-022-00605-4CrossRef
Rücker F, Figgener J, Schoeneberger I, Sauer DU (2024) Battery electric vehicles in commercial fleets: use profiles, battery aging, and open-access data. J Energy Storage 86:111030. https://doi.org/10.1016/j.est.2024.111030CrossRef
Vaithilingam S, Teh P‑L, Ahmed P, Ho S‑J, Nair M, Tan CP (2021) Sustainable smart transportation system: through the lens of a smart city in an emerging country. ICEB 2021 Proceedings, Nanjing (https://aisel.aisnet.org/iceb2021/25)
Wong KL, Bosello M, Tse R, Falcomer C, Rossi C, Pau G (2021) Li-Ion batteries state-of-charge estimation using deep LSTM at various battery specifications and discharge cycles. Proceedings of the Conference on Information Technology for Social Good, S 85–90 https://doi.org/10.1145/3462203.3475878CrossRef