© AdobeStock / Halfpoint

Datenanalyse mit „DB Streckenagent“

Wissen, was der Fahrgast wirklich will

06/2018 – Knapp eine Million Mal wurde die App „DB Streckenagent“ bereits heruntergeladen. Nun entwickelt die DB Systel aus dem Big-Data-Schatz, der sich hinter der App verbirgt, hilfreiche Mittel zur Fahrgastanalyse.

Seit 2017 gibt es nun den „DB Streckenagenten“ von DB Regio bundesweit. Mit seiner Hilfe können sich Bahnkunden im Störfall über die aktuelle Situation auf den von ihnen benutzten Bahnstrecken informieren und sich bei Störungen mögliche Reisealternativen vorschlagen lassen. Die App ist für den Nahverkehr optimiert und somit besonders für Pendler geeignet. Aber auch die Fernverkehrsstrecken lassen sich damit überwachen.

Programmiert wurde die DB Streckenagent-App von der Siemens-Tochter HaCon in Hannover. Die Daten, mit denen HaCon arbeitet, werden dem Unternehmen aus dem Europäischen Fahrplanzentrum von DB Vertrieb (EFZ) und aus der RIS-Infoplattform zur Verfügung gestellt. Die Anwendung vergleicht die Fahrpläne mit den eingehenden Echtzeitmeldungen sowie zusätzlichen Informationen zu Ausfällen und Alternativen und generiert die vom Endkunden abonnierten Streckeninformationen als Push-Nachrichten. Das sind Meldungen, die auf dem Smartphone erscheinen, ohne dass man die dazugehörige App öffnen muss. Für den Nutzer entfällt das lästige Abrufen von Informationen.

Doch der DB Streckenagent bietet nicht nur den Kunden der Deutschen Bahn viele Vorteile. Zero.One.Data (ZOD), das interne Big-Data-Start-up der DB Systel, hat den Datenpool der DB Streckenagent-App nun im Auftrag der DB-Regio als ein hervorragendes Mittel zur Fahrgastanalyse erschlossen. Die dazu notwendigen Daten holte sich ZOD von einem externen Dienstleister und speicherte sie in einer Datenbank ab. Die Aufbereitung und Visualisierung erfolgt mit Open-Source-Werkzeugen, die auf der Programmiersprache Python aufbauen, ergänzt durch Informationen von OpenStreetMap.

Antworten aus dem Data Lake

Abgespeichert werden die vom DB Streckenagenten erzeugten Nachrichten zu Störungen und Verspätungen in der DB Enterprise Cloud. Bereits 13 Millionen Datensätze wurden dort abgelegt. Dabei handelt es sich um mit dem Datenaustauschformat JSON strukturierte Textdateien. Sie enthalten Informationen zu Nachrichten, Zügen und Abonnements. Jeden Werktag wächst das Volumen um 200.000 weitere Datensätze und eine Million Push-Nachrichten. Sorgen hinsichtlich des Datenschutzes muss sich bei dieser Streckenanalyse kein Bahnkunde machen. Denn es werden keinerlei personenbezogene Daten verwendet.

„Dieser Data Lake (Daten-See) eignet sich bestens zum Aufbau einer Datenbank zur Fehleranalyse“, erläutert Dr. Enno Middelberg, Datenanalyst bei ZOD. Ein sehr drängendes Problem sind bei Reisenden zu spät eintreffende Push-Nachrichten. Zero.One.Data hilft dabei, das Problem mittels Datenanalyse genauer einzukreisen, und stellt die gewonnenen Daten den beteiligten Dienstleistern zur weiteren Fehleranalyse bereit: Wann wurden die zu spät kommenden Nachrichten im Reisenden-Informationssystem (RIS) erzeugt, wann von dort zur Abholung bereitgestellt, wann von HaCon auf den Servern abgerufen und an die Reisenden letztendlich versendet? Erst die Untersuchung von sehr vielen Daten hilft, die Problemquelle zu definieren – und das wiederum ist nur mit Big-Data-Analyse zu bewerkstelligen.

Das Histogramm der vom DB Streckenagenten ausgesendeten Nachrichten zeigt: Viele Meldungen erreichen die Reisenden nicht rechtzeitig vor der Abfahrt. Auch zur Ankunft oder zum Anschluss kommen die Nachrichten teilweise zu spät.

© DB Systel GmbH

Doch das von DB Regio in Auftrag gegebene Analyseprojekt ergab: Der vom DB Streckenagenten gespeiste Data Lake hält noch mehr Informationen bereit. „Nach einem Jahr Erfahrung mit der App kam die Frage auf, wer sie eigentlich nutzt. Und darauf hatten wir keine Antwort“, erinnert sich Daniel Preußer, Produktmanager für digitale Produktinnovationen bei der DB Regio AG und Product Owner für die DB Streckenagent-App. Es war zwar klar, dass vor allem Pendler die App nutzen. „Aber wir wussten nicht, wo in Deutschland sie genutzt wird und welche Meldungen der Pendler erhält“, sagt Daniel Preußer.

© DB Systel GmbH

Wir haben die Pendlerdaten hinsichtlich ihres Abfahrt- und Ankunftsortes untersucht und die Ergebnisse dann auf die Postleitzahlen umgelegt.

Dr. Enno Middelberg, Datenanalyst Zero.One.Data, DB Systel GmbH
Die Big-Data-Analyse kann sehr genau ermitteln, wo die Bahn-Pendler ihre Reise beginnen. Hier zu sehen sind Postleitzahlenbereiche, die nach der Häufigkeit der darin stattfindenden Abreisen eingefärbt wurden.
© DB Systel GmbH

ZOD hat mittels statistischer Auswertung von Abfahrtsorten- und –zeiten diese Wissenslücke geschlossen. Zwar werden erst seit Anfang des Jahres die Daten des DB Streckenagenten gespeichert. Doch bereits jetzt bilden sie einen echten Schatz an Informationen. Die von Zero.One.Data durchgeführte Analyse der Daten ließ eindeutige Muster erkennen. „Wir haben die Pendlerdaten hinsichtlich ihres Abfahrts- und Ankunftsorts untersucht und die Ergebnisse dann auf die Postleitzahlen umgelegt“, erklärt Enno Middelberg das Verfahren.

Die Muster hat Enno Middelberg in Form von Deutschland-Karten visualisiert. Deren Detailreichtum ist beeindruckend: „Wir sehen jetzt, wie oft in der Woche ein Pendler eine Verspätungsmeldung bekommt und wie oft eine Störungsmeldung. Und darüber hinaus erkennen wir, wo auf dem Streckennetz die Hotspots der Meldungen liegen“, erklärt Middelberg das Resultat.

Mit Big Data zum Mobilitätsassistenten?

ZOD konnte für DB Regio außerdem ein genaues Bewegungs- und Nutzungsbild ihrer Kunden eruieren. Die Daten ergaben, dass sich die Meldungen morgens großflächig verteilen, wenn die Pendler sich auf ihren Weg in die Zentren begeben. Am Abend konzentriert sich das Empfangen der Push-Nachrichten hingegen auf die Bahnhöfe in den großen Städten. Der Grund: „Der DB Streckenagent gibt uns Auskunft über die von den Kunden genutzten Bahnhöfe und seine Koordinaten“, weiß Middelberg. „Der DB Regio hilft dies, ihre Kunden besser zu verstehen und zu charakterisieren und die Services und Reisendeninformationen noch stärker zu personalisieren und zu individualisieren. Und natürlich können wir uns zielgerichteter an die Beseitigung der häufigsten Störungsursachen machen.“

© DB Regio AG

Unsere Vision geht in Richtung `Ihr Mobilitätsbegleiter´

Daniel Preußer, Produktmanager für digitale Produktinnovationen, DB Regio AG

Trotz der derzeitigen Probleme bei der Zustellung der Push-Nachrichten ist Daniel Preußer überzeugt, dass sich die App weiter positiv entwickeln wird. Weitere Features und Produkterweiterungen sind für 2018 in Vorbereitung. „Unsere Vision geht in Richtung `Ihr Mobilitätsbegleiter´, sagt Preußer. Denn warum nicht den gesamten Nahverkehr im Blick haben, also auch alle Busse, alle U-Bahnen? Und: „Der Kunde soll uns Fragen stellen und Feedback geben können.“ Ziel sei ein persönlicher Mobilitätsassistent, damit die Kommunikation ihre Eingleisigkeit verliert – zum Vorteil der Bahn und ihrer Kunden.