Mit Big Data als neuer Rohstoff in der Prozessindustrie stellt sich für die Anlagenbetreiber eine entscheidende Frage: Wie lässt sich bei steigender Prozesskomplexität und Datensilos die Flut an gewonnenen Daten managen, analysieren und nutzen? Unternehmen setzen verstärkt auf Graphdatenbanken, um nicht nur einzelne Prozesse miteinander zu verknüpfen, sondern eine 360-Grad-Ansicht auf die Produktion zu gewinnen.
In der Prozessindustrie wächst der Druck, die Digitalisierung mitsamt ihren Schlagwörtern wie Smart Data und Künstliche Intelligenz auch tatsächlich auf den Weg zu bringen und effektiv umzusetzen. Das spüren auch die Hersteller. Gelingt es, Daten entlang der gesamten Wertschöpfungskette nutzbar zu machen, können sie sich einen gewaltigen Wettbewerbsvorteil sichern. So erstaunt es kaum, dass der Verband der Chemischen Industrie in den nächsten Jahren von Investitionen von mehr als einer Milliarde Euro für Digitalisierungskonzepte und neue nachhaltige Geschäftsmodelle ausgeht.
Das Potential von Big Data Analytics für die Produktion ist dabei vielfältig und beschränkt sich nicht allein auf Predictive Maintenance, Remote-Zugriff oder die Anlagenoptimierung. Die Vernetzung von Produktionsplanungsdaten entlang der Produktlinien und über sämtliche Produktionsstätten hinweg ermöglicht es, Prozesse an den Kundenbedarf in Echtzeit anzupassen und die Produktion optimal an bestehenden Ressourcen auszurichten.
Wie setzt sich die Kette vom Upstream Processing von Rohstoffen bis zum Downstream Processing von Fermentations- und Syntheseprodukten zusammen? Welche Rohstoffe mit welchen Volumina sind für die Produktion eines Produkts nötig? Welche Kosten sind damit verbunden? Und wie setze ich bestehende Rohstoffe am effizientesten ein, um letztendlich ein profitables Geschäft abschließen zu können?
Neue (Graph)Datenbanken braucht das Land
Relationale Datenbanken liefern hier nur bedingt Antworten. Sie sind schlichtweg nicht dazu konzipiert das komplexe Beziehungsnetzwerk aus Produktions- und Planungsdaten zu managen. Um Zusammenhänge auf den Grund zu gehen und Datenbeziehungen abzufragen, müssen mehrere sehr große Tabellenstrukturen miteinander verknüpft werden. Das ist nicht nur äußerst ressourcenintensiv, sondern lässt auch die Antwortzeiten massiv in die Höhe schießen. Von Echtzeit-Ergebnisse sind relationale Datenbanken bei komplexen heterogenen Daten weit entfernt. Im Zusammenhang mit Smart Factory und IIoT rücken daher neue Datenbanktypen, wie Graphdatenbanken, verstärkt in den Fokus. Graphtechnologie und Knowledge Graph eignen sich so ideal, um Big Data im Kontext ihrer Datenbeziehungen zu speichern und abzufragen.
Ein Graph bezeichnet ein Modell aus Objekten (Knoten) und zwischen diesen Objekten bestehenden Verbindungen (Kanten). Beiden können Eigenschaften, sogenannte Properties, zugewiesen werden. Was abstrakt klingt, ist tatsächlich einfach zu verstehen, wenn man sich beispielsweise den U‑Bahn-Plan einer Stadt vorstellt. Auch dort sind verschiedene Haltestellen als Knoten dargestellt (z. B. „Berlin Alexanderplatz“), die über unterschiedliche Kanten oder Linien (z. B. „U8“) miteinander verbunden sind. Das einfache Modelle aus Knoten-Kante-Knoten lässt sich auf die unterschiedlichsten Szenarien übertragen – von Freundschaften in sozialen Netzwerken über das Kauf- und Klickverhalten von Kunden im Online-Shops bis hin zu Logistiklieferketten in der Industrie. Über das Knoten/Kanten-Prinzip lassen sich auch neue Datensätze einfach hinzufügen, d. h. der Graph kann mit der Datenmenge mitwachsen und so automatisch einen semantischen Kontext für die Datenanalytik generieren.
Komplexität über vielschichtige Prozessketten
Zurück in der Prozessindustrie lassen sich im Graphen Produktlinien in ihrer ganzen Komplexität realitätsnah abbilden – einschließlich aller Prozessketten und Abhängigkeiten. Rohstoffe, Rezepturen (BOMs), Volumenströme, Material- und Transportkosten, aber auch Lagerkapazitäten für Zwischenprodukte, nachgelagerte Produktionsstufen sowie die Produktionsstätten innerhalb eines Konzerns werden als Knoten im Graphen modelliert und mit den jeweiligen Kunden, Aufträgen und Buchungsvolumen über Kanten verknüpft. Die Komplexität ist enorm. Vor allem da alle diese Daten in der Regel aus unterschiedlichen Datenerhaltungssystemen, wie SAP, stammen und häufig nur isoliert voneinander betrachtet werden. Im Graphen werden diese heterogenen Daten zusammengefasst und miteinander verknüpft. So lässt sich eine komplexe betriebswirtschaftliche Kosten-Nutzen-Rechnung anschaulich in ein Modell übertragen, das die Produktionskette vom Eingang der Rohstoffe bis hin zum Absatzmarkt erstmals transparent nachvollziehbar abbildet.
Ausgehend von einer Produktlinie, dem Auftragsvolumen eines Kunden oder auch eines Nebenprodukts lässt sich der Graph in alle Richtungen traversieren, um beispielsweise die Kosten eines jeden Produkts verteilt auf die einzelnen Prozessschritte zu berechnen. Anwender können schnell und einfach Zusammenhänge offenlegen. Relevante Ausschnitte des Produktionsprozesses lassen sich direkt am Beispiel einsehen, so dass Betreiber schneller reagieren und die Prozessplanung in Echtzeit an Marktschwankungen, neue Aufträge oder Engpässe in der Lieferkette anpassen können.
Smarte Entscheidungen sind datengestützt
Letztendlich liefert Graphtechnologie eine einfache Visualisierung von hoch-komplexen Zusammenhängen. Für die Entscheidungsfindung ist diese 360-Grad-Ansicht auf Daten ein enormer Vorteil: Anlagenbetreiber können nicht nur schneller und bessere Entscheidungen treffen, sie behalten auch die Gesamtprofitabilität des Unternehmens im Blick, statt auf das Ergebnis einzelner Geschäftseinheiten zu zielen. Ein neuer Blick auf die Daten bringt auch neue Erkenntnisse mit sich. So kann es sein, dass ein Geschäft, das ehemals als profitabel eingestuft wurde, im Vergleich zu anderen Geschäftsopportunitäten neu bewertet und niedriger eingestuft werden muss. Zudem kann ein an sich profitables Geschäft schnell an Attraktivität verlieren, wenn bei der Produktion Emissionsgrenzwerte überschritten und hohe CO2-Zertifikate fällig werden bzw. Subventionen und Steuervergünstigungen entfallen.
Als Entscheidungsgrundlage dienen dabei stets aktuelle Daten, da die Abfrage im Graphen nur wenige Millisekunden benötigt. Anders als in relationalen Datenbanken hängt die Performance nämlich nicht von der Gesamtmenge der Daten und den Verknüpfungsoperationen ab. Stattdessen werden in Graphdatenbanken nur die für die Abfrage relevanten Beziehungen traversiert. Das liefert Ergebnisse in Echtzeit. Selbst wenn neue Geschäftsopportunitäten hinzugefügt werden, fließen neue Werte umgehend in die Berechnung mit ein. So lassen sich prinzipiell verschiedene Szenarien durchspielen, um schließlich in Absprache mit anderen Organisationseinheiten die beste Opportunität mit der höchsten Gewinnspanne zu wählen.
Graph-Anwendungen dienen dabei in chemischen Anlagen jedoch bislang nur als Entscheidungshilfe in der Produktionssteuerung und ‑planung. Die letzte Entscheidung liegt bei den Experten und Anlagenbetreibern. So lassen sich Entscheidungen von Fall zu Fall neu treffen, um neben Profitabilität auch andere Faktoren zu berücksichtigen (z. B. Länge der Kundenbeziehung, Größe des Auftrags, strategische Zielsetzung).
Grundsätzlich steht jedoch einen breiteren Einsatz von Graphtechnologie in Verbindung mit Graph Algorithmen, KI und Machine Learning nichts im Weg. Ein nächster Schritt stellen hier beispielsweise automatisierte Empfehlungen des Systems auf Basis von historischen Daten, Sensoren und anderen Datenquellen dar. Auch intelligentes Forecasting in der Beschaffung, in der Supply Chain und der Logistik baut auf vernetzte Daten. Die Datenbank dazu steht bereit.
Autor: Dirk Möller, Area Director of Sales CEMEA, Neo4j