© iStock

Digitalisierung von Bestandsplänen

Reine Kopfsache

03/2017 - Manchmal scheitern Pläne am eigenen Kopf. Doch nicht bei den Bestandsplänen von DB Netz: In einem Wettbewerb haben schlaue Köpfe die ideale Lösung für die Digitalisierung gefunden.

Die Aufgabe an DB mindbox im Mai 2016 war klar und doch alles andere als einfach: Richtet eine Challenge aus, um mögliche Lösungen für die Digitalisierung von Bestandsplänen der DB Netz zu finden. Ziel war es, neue Lösungswege kennenzulernen und externe Experten zu gewinnen, die ein Programm entwickeln, das Informationen aus verschiedenen Plandokumenten auslesen und strukturiert für den Import in das SAP-System der Deutschen Bahn vorbereiten kann.

Seit Anfang Februar ist die Lösung mit einer Vielzahl an Funktionen als Prototypen fertiggestellt. Die komplette Verarbeitungskette von der Bilddatei bis zum Import in das planführende System wird abgebildet. Automatiken sorgen beispielsweise für Umwandlung des Bildformats, Erkennung der Schriftfelder oder, bei Bedarf, einer Rotation des Dokuments. Die Bedienoberfläche bietet zur Nachbearbeitung diverse Filter- und Strukturierungsfunktionen.

Der Prototyp bildet die komplette Verarbeitungskette von der Bilddatei bis zum Import in das planführende System ab.

© Deutsche Bahn AG

Das Projekt Digitalisierung Planköpfe

Bei DB Netz liegt ein echter Schatz: Auf mehreren Hunderttausend Plänen ist verzeichnet, wo und in welcher Form im Streckennetz der Deutschen Bahn Telekommunikationsanlagen – kurz TK-Anlagen – verbaut sind. Diese wurden bereits digitalisiert, um sie einer zentralen Datenbank zu überführen. So könnten dann in naher Zukunft Mitarbeiter direkt am Arbeitsplatz oder mobil per Tablet auf Bestandspläne zugreifen – und müssten sich diese nicht umständlich heraussuchen lassen. Doch dafür müssen die auf dem Plan befindlichen Metadaten mit den Angaben, was überhaupt auf dem Plan zu sehen ist, aus dem Schriftfeld ausgelesen werden, um sie überhaupt finden zu können.

Schriftfelder – genannt Planköpfe – fungieren wie eine Art Legende. In einzelnen Feldern sind alle relevanten Informationen zum jeweiligen Plan abgebildet. Dort steht zum Beispiel, um welchen Streckenabschnitt es sich handelt oder wer den Plan gezeichnet hat – und das Ganze häufig in Abkürzungen. Einige der Pläne sind fast 100 Jahre alt, viele sind übersät mit handschriftlichen Notizen – eine durchgängige, standardisierte Gestaltung der Schriftfelder gibt es nicht.

„Es gibt Muss-Felder, und es gibt Kann-Felder“, sagt Javier Glaubitz von DB Netz, der das Digitalisierungsprojekt leitet. „Es ist eine große Herausforderung für ein System, automatisch zu erkennen, wo sich welche Felder befinden – und was deren Inhalte bedeuten.“

Wettbewerb für die beste Lösung

Generell haben die Challenges der DB mindbox die Aufgabe, für Herausforderungen der DB schnelle, innovative oder unkonventionelle Lösungsansätze zu finden. Die zehn teilnehmenden Teams, darunter auch DB Systel, hatten die Aufgabe, anhand von extra für die Challenge aufbereiteten Musterlösungen einen Algorithmus zu entwickeln, mit dem sich die Schriftfelder der TK-Pläne auslesen und automatisch mit den korrekten Schlagworten versehen lassen. Dank der umfangreichen Vorbereitung mussten sich die Teilnehmer nicht mit Details zur Test-Methodik beschäftigen, sondern konnten sich auf das Kernproblem konzentrieren: dem Erkennen von Inhalten.

Gewonnen hat ein Team vom Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI), das auf eine Open-Source-Lösung setzte und mit seiner Lösung die besten Resultate beim Auslesen der Planköpfe erreichen konnte. DB Systel landete mit ihrer Lösung auf dem dritten Platz. „Wir können äußerst zufrieden sein“, sagt Dr. Feldner. Der Abstand zum Siegerteam, das aufgrund kleiner Kniffe in der Vorverarbeitung gewonnen hat, war sehr gering. Bei den Erkennungsraten der Daten gab es dagegen kaum Unterschiede. „Wir konnten beweisen, dass wir auf diesem Sektor mit der Konkurrenz mithalten können.“ Diese sah eine Massenverarbeitung der Planköpfe mit einer anwenderfreundlichen Benutzeroberfläche vor, wodurch sich erkannte Texte schnell sichten und bearbeiten lassen. Hier zahlte sich aus, im Konzern seit mehr als zehn Jahren eine Inputplattform im Einsatz zu haben. Deren Funktionen werden für die Verarbeitungsschritte der Digitalisierung modular eingesetzt und kombiniert: Die Plattform erfasst Dokumente aus unterschiedlichen Quellen, erkennt sie automatisch, bewertet sie und gibt sie dann nach Bedarf in unterschiedlichen Formaten aus. Qualitätskontrollen zwischen den Einzelschritten sorgen für einen hohen Grad an Zuverlässigkeit. Mit dem Proof of Concept bei der Digital Header Challenge konnte das Team von DB Systel erproben, wie die Erkennungsraten bei Planköpfen sind.

Erfolgreicher Einsatz einer Standardlösung und Entwicklung eines Prototypen

„Uns waren die Anforderungen jenseits der Challenge bewusst“, sagt Dr. Feldner. Sein Team nutzte mit Kofax von Lexmark eine kommerzielle Software, die bereits bei der DB Inputplattform verwendet wird. Diese Lösung erlaubte das Einlesen und Auswerten von formbasierten Dokumenten, wie es die Planköpfe sind. Zusätzlich hat das Team von DB Systel auch maschinelles Lernen eingesetzt. Vor allem aber hatte DB Systel eine Antwort auf Punkte, die außerhalb der Challenge lagen. Die Lösung verfügte über eine Endanwender-taugliche Benutzerführung.  Auch Dr. Wolter ist zufrieden: „Unsere Hoffnung hat sich erfüllt: Mit der Challenge haben wir für die DB Netz einen funktionierenden innovativen Ansatz und tolle Gewinner gefunden. Es wurde beschlossen, dass das Gewinnerteam vom DFKI gemeinsam mit DB Systel das Projekt umsetzt.“

Mit Kofax las das DB Systel-Team während der Challenge die Planköpfe ein, um sie dann für die Auswertung bereit zustellen.

© Deutsche Bahn AG

Während also DFKI vor allem bei der Vorverarbeitung beraten hat, entwickelte ein konzernübergreifendes, interdisziplinäres Team einen Prototypen, um Schriftfelder zu digitalisieren. Gerade die Kombination der beiden unterschiedlichen Methoden sorgte für eine erfolgreiche Zusammenarbeit. Als Nächstes überprüfen Endanwender in einem bahninternen Feldtest, inwiefern der Prototyp alltagstauglich ist.

Digitale Bestandspläne 4.0

Die nächsten konkreten Schritte für das System stehen auch schon fest: Das Projekt wird in das Programm „Digitale Bestandspläne 4.0“ übernommen und dort für alle Anlagentypen bei DB Netz weiterentwickelt. Schwerpunkt ist dann die automatische Qualitätssicherung bereits erfasster Planköpfe. Pläne, die wieder ganz anders aufbereitet sind – da braucht man eine flexible Lösung. Und auch andere Unternehmensteile haben schon an die Tür geklopft, um Dokumente automatisch zu digitalisieren. „Sollte sich das konkretisieren, wären das dann etwa zehn Millionen Seiten – pro Jahr“, sagt Dr. Feldner. Ganz klar, der Mann hat einen Plan.