XML-Qualitätsprüfung mit Schematron

04.02.2015

Die Überprüfung von XML-Daten rein durch Parsing reicht oft nicht zur Qualitätssicherung aus. Mit Schematron existiert ein Tool, mit dem man hier deutlich mehr erreichen kann.

Die Prüfung der XML-Daten erfolgt in drei Schritten:

Eine XML wird immer zunächst nach Wohlgeformtheit (auch Syntaxprüfung genannt) geprüft. Danach erfolgt die Prüfung gegen die DTD oder Schema. Diese zwei Prüfungen gehören zur Standardfunktionalität eines XML-Editors oder (einigen) XML-Satzystemen. Als dritte Prüfung setzen wir in XML-Projekten immer mehr auf Schematron. Schematron ist eine Schemasprache zur Validierung von Inhalt und Struktur von XML-Dokumenten. Die Implementierung der Schematron Prüfungen erfolgt durch XSL-Transformationen. Die Vorteile einer Schematron Prüfung sind:

  • Schematron-Tests können zentralisiert werden, sodass jeder dieselben Prüfungen verwenden kann
  • Schematron-Tests sind leicht zu pflegen
  • mit Schematron lassen sich auch viele „Plausibilitätstest“ erstellen, Beispiel: Prüfung ob die Postleitzahl aus fünf Ziffern besteht, Prüfung der ISBN uvm.
  • eigene Fehlermeldungen und Warnungen können implementiert werden

Schematron wird von einigen XML-Editoren (Bsp: Arbortext Editor, oXygen, XMLSpy) unterstützt. Wir verwenden bei C.H.Beck.Media.Solutions den Arbortext Editor der Firma PTC. Die Prüfung im Arbortext Editor sieht z.B. so aus:

schematron_1.jpg

Mit einem Doppelklick auf die Warnungen gelangt man an die fehlerhafte Stelle. Die dazugehörigen Schematron-Tests aus diesem Beispiel sind wie folgt:

schematron_2.jpg

Mit Schematron können Sie Prüfregeln komfortabel und zentral formulieren und stellen so sicher, dass alle Prüfungen, sowohl inhaltlich als auch strukturell, durchlaufen werden.

Somit sparen Sie sich unnötige Fehler und Zeit. Sie haben mit Schematron die Qualität Ihrer XML-Daten im Griff!

 

 

Weitere Meldungen

Valide ist nicht richtig!

XML ist inzwischen das Schweizer Taschenmesser für den Datenaustausch. In vielen Anwendungsfällen reicht es, wenn die syntaktischen Regeln eingehalten werden. Besser ist es, wenn die Daten auch noch einer festgelegten Grammatik (DTD oder Schema) folgen. Doch manchmal spart es Geld, wenn man mehr Aufwand in die Daten steckt.

Valide ist nicht richtig!