Case-Study

Datenqualitätsmessung im SAP-Materialstamm: Standards

In einem Fabrikgebäude setzen Roboter ein Autogehäuse zusammen

Unser studentischer Mitarbeiter Erik Schlüter hat seine Bachelorarbeit zum Thema: “Konzeption eines Standards zur Messung der Datenqualität am Beispiel des Materialstamms von SAP ERP” veröffentlicht. Die innoscale AG war Praxispartner der Bachelorarbeit von Herrn Schlüter. Gemeinsam konnte eine Brücke von der wissenschaftlichen Arbeit in die Unternehmenspraxis geschlagen werden.

In seiner Bachelorarbeit beschreibt er, wie aufwendig es für Unternehmen ist, Qualitätskriterien für ihre Daten zu ermitteln, da unterschiedliche unternehmensspezifische Datenstrukturen existieren und effiziente Messkonzepte mit Hilfe einer Software wie DATAROCKET Core entwickelt werden müssen. Erik Schlüter betont die Wichtigkeit der Entwicklung eines Standards für den SAP ERP Materialstamm - zum einen aufgrund der hohen Verbreitung des ERP-Systems am Markt und zum anderen, weil Standards für andere Datentypen wie Debitoren- und Kreditorendaten im Gegensatz zum Materialstamm mit seinen Artikel- und Stücklistenhierarchien bereits existieren. Darüber hinaus ist der Aufbau von Qualitätskriterien auf der grünen Wiese ein aufwändiges und kostenintensives Unterfangen in jedem MDM- und Datenqualitätsprojekt.

Template zur Messung der Datenqualität für den SAP Materialstamm

Herr Schlüter hat in seiner praxisorientierten Bachelorarbeit an der Hochschule Brandenburg ein standardisiertes Set von Qualitätskriterien entwickelt. Dieses Template kann als Blaupause zur Messung der Datenqualität für den SAP Materialstamm verwendet werden. Es wurde in der Praxis bei einem großen Automobilzulieferer (Woco Industrietechnik GmbH) evaluiert.

Die Vorgehensweise bestand darin, zunächst einen Entwurf für standardisierte Datenqualitätskriterien auf Basis eines Praxisprojektes zu erstellen und diesen durch einen Kunden der innoscale AG evaluieren und validieren zu lassen. Dazu wurde ein Interview mit Woco geführt, um deren Anforderungen zu ermitteln. Außerdem nutzte Herr Schlüter vergangene Projektarbeiten der innoscale AG (in anonymisierter Form) hinsichtlich der verwendeten Attribute, um diese mit der Software DATAROCKET Core zu analysieren. Mit Hilfe verschiedener Funktionen von DATAROCKET Core konnte er deren Datenqualität messen.

Anforderungen an die Datenqualität im SAP Materialstamm

Die Testdateien und die abgeschlossenen Projekte wurden hinsichtlich ihrer Anforderungen an die Datenqualität untersucht. Dazu wurden entsprechende Regeln formuliert, die z.B. die Vollständigkeit, Aktualität, Übersichtlichkeit, Fehlerfreiheit und Glaubwürdigkeit der Daten betreffen. Es ist auch möglich, mehrere Dimensionen innerhalb einer Regel abzubilden.

"Das Standard-Regelwerk umfasst Datenqualitätsregeln für 321 Attribute aus dem SAP-Materialstamm."

Die einzelnen Regeln wurden in Form von Datenqualitätskriterien in DATAROCKET Core abgebildet. Einige Beispiele sollen hier vorgestellt werden:

Beispiel 1: Regel für die DQ-Dimension Vollständigkeit:

Das Feld Kurztexte darf nicht leer sein, wenn die Sprache Englisch ist und die Materialarten ‘DRUK’, ‘FERT’, ‘HALB’, ‘HAWA’, ‘ROH’, ‘TEIL’, ‘VERP’ sind.

  • Regelumschreibung: Materialien müssen mindestens Kurztexte mit Sprachschlüssel EN und den Materialarten ‘DRUK’, ‘FERT’, ‘HALB’, ‘HAWA’, ‘ROH’, ‘TEIL’, ‘VERP’ haben.

  • Umfang: MARA-MTART = ‘DRUK’, ‘FERT’, ‘HALB’, ‘HAWA’, ‘ROH’, ‘TEIL’, ‘VERP’.

  • Technische Spezifikation: MAKT-Datensatz mit SPRAS = EN vorhanden

Beispiel 2: Regel für DQ-Dimension Fehlerfreiheit

  • Regelumschreibung: Für verkäufliche Ids (VTL-Status „leer“ oder „01“ oder „02“ oder „03“) muss das Feld „StatistikGrMaterial“ mit dem Wert 1 gefüllt sein.

  • Umfang: MVKE-VMSTA = leer, ’01’, ’02’, ’03’.

  • Technische Ausprägung: MVKE-VERSG = '1

Nicht nur im Rahmen dieser Bachelorarbeit, sondern auch in Kundenprojekten muss das Regelwerk durch das Unternehmen und dessen Fachabteilungen angepasst werden. Aus diesem Grund wurden die Anforderungen des Praxispartners ergänzt. Dieser legte besonderen Wert auf drei Arten von Regeln:

  1. Schreibweisen (scharfes S, Umlaute, keine Abkürzungen, keine Sonderzeichen)

  2. Attribute als Pflichtfelder (z.B. Materialstatus, Brutto- und Nettogewicht, Kurztexte)

  3. Abhängigkeiten zwischen Attributen

Bluefield-Ansatz zur Messung der Datenqualität in SAP

Im Ergebnis konnten für 321 Attribute des SAP ERP Materialstamms Prüfregeln definiert werden. Die gewonnenen Erkenntnisse wurden zusammengeführt und zu einem Standardset für Datenqualitätskriterien im SAP Materialstamm verdichtet. Die folgende Abbildung zeigt einen Auszug aus dem Standardset zur Messung der Datenqualität im SAP Materialstamm.

Übersicht einer Tabelle mit typischen Datenqualitätsregeln für den SAP Materialstamm

Die Spalten “Tabelle”, “Feldname” und “Kurzbeschreibung” stammen aus der SAP-Tabelle MARA - Allgemeine Materialdaten - Stammdaten.

Die nächste Spalte enthält den Namen der Pipeline, die in DATAROCKET Core für die Qualitätsprüfung für dieses Attribut zur Verfügung steht.

Die “Textuelle Regelbeschreibung” wurde von Herrn Schlüter unter Auswertung der Praxisprojekte und den Anforderungen des Praxispartners erstellt.

In der Spalte “Regelbeschreibung Attribute” wird die Anforderung in Form der verwendeten Attribute beschrieben.

In der Spalte “Art der Messung” erfolgt die Einteilung der Regeln in die Kategorien Syntax, technische Messung und Vollständigkeit.

Die Spalte “Implementierung in DataRocket” beschreibt Filtertypen und Arten von Qualitätskriterien, die DataRocket prüft. Beispielsweise kann mit Range Checker geprüft werden, ob die Werte eines Attributs innerhalb oder außerhalb eines individuell definierten Intervalls liegen. Attribute Compare ermöglicht den Vergleich zweier Attribute miteinander - mit einem individuell definierten Grad an Unschärfe.

Diese Standardkriterien stehen nun in einem Template bereit und können für zukünftige Projekte der innoscale AG genutzt werden. Getreu dem Bluefield-Ansatz, etwas Vorhandenes als Grundlage zu nutzen und darauf aufzubauen, ist es uns nun möglich, schneller und effizienter ein individuelles Set zur Datenqualitätsmessung für unsere Kunden aufzubauen.

Wir gratulieren Erik zum absolvierten Bachelorstudium!

DATAROCKET Core ist unser Tool für ein nachhaltiges Stammdatenmanagement. Datenqualität und Datenanalyse finden an einem Ort statt und neue Datensätze werden direkt qualitätsgeprüft angelegt. So arbeiten Ihre Mitarbeiter:innen mit der besten Datenqualität und Sie können wichtige Unternehmensentscheidungen besser treffen.

Core ist die Stammdatenmanagement-Software für verbesserte Datenqualität.

Weitere Blog-Beiträge