Strukturierung freier Texte und komplexer Inhalte

11.09.2014

XML ist das Format der Wahl zur inhaltlichen Neuerfassung von Texten für die medienneutrale automatisierte Verarbeitung.

Mit der durchdachten Wahl oder Neuerstellung einer anwendungsspezifischen DTD können etwa Katalogdaten oder Formularinhalte automatisiert nahezu eindeutig auf Korrektheit und Vollständigkeit überprüft werden. Schnell stößt man aber auf Schwierigkeiten, soll die Struktur von freien Texten wie in Büchern, Zeitschriften oder Loseblattwerken strukturiert werden.

Komplexität der Strukturierung

Die Zuordnung der einzelnen Strukturelemente eines Textes muss valide gemäß der Definitionen einer DTD erfolgen. Aber darüber hinaus muss die semantische Bedeutung, welche hinter den Tags und Elementen des Dokuments steht, immer den Inhalt korrekt repräsentieren. Hier ist eine Zuordnung nicht immer eindeutig oder trivial. Erfahrung und Kompetenz der Bearbeiter spielen eine entscheidende Rolle, um qualitativ hochwertige Daten zu garantieren. Auch ist nicht unerheblicher Aufwand zu betreiben, um in nötiger inhaltlicher Tiefe Metainformation wie etwa zur Verschlagwortung, Verlinkung zu anderen Dokumenten oder Normierungen zur automatisierten Weiterverarbeitung zu erfassen.

Typographische Besonderheiten für Print müssen vor einer Realisierung im Hinblick auf eine Onlineumsetzung überdacht werden: Geht dadurch Online etwa semantisch relevante Information verloren? Wie sieht eine adäquate Darstellung aus, die in den verschiedenen Medien realisierbar ist? Wie hoch ist der Nutzen der Besonderheit gegenüber dem zusätzlich zu betreibenden Aufwand zu beurteilen?

Alle Korrekturen müssen auf demselben Datenbestand erfolgen, ggf. von mehreren Bearbeitern gleichzeitig. Grafiken, Formeln und Tabellen müssen sowohl in Print wie auch in Online qualitativ einwandfrei umgesetzt werden können.

 

xml1.png

 

 


xml3.png

Fokus auf optimale Workflows

Ohne angepasste Abläufe, geeignet konfigurierte Editoren und weitere Toolunterstützung werden vermeidbare Fehler auftreten. Das verursacht Kosten und Frustration bei Kunden und Dienstleister. Unabdingbar sind erprobte und immer wieder hinterfragte Abläufe und Schnittstellen in allen Stufen eines Workflows, etwa durch ein zu Grunde liegendes Redaktionssystem.

flowbooks_Workflowtool.jpg

Alternative: Nachstrukturieren von Printdaten?

Alternativ zum Arbeiten auf XMLstrukturierten Daten gibt es auch die Möglichkeit „Print First“ zu arbeiten. D.h. dann folglich, dass auf druckfertigen Daten eine Nachstrukturierung realisiert wird, welche die semantische Struktur wie oben beschrieben nachbilden muss. Hinsichtlich Zeitaufwand und Qualität der Daten sollten hier Kosten und Nutzen genau abgewogen werden. Ausgereifte Tools mögen entscheidende Vorteile bringen, die eigentliche Garantie für dauerhaftes Funktionieren eines Ablaufs ist jedoch wieder die qualifizierte und an Qualität orientierte Arbeit der einzelnen Beteiligten.

Eine auf den ersten Blick vorteilhafte Entlastung der Autoren und Lektoren von „technischen“ Details der Strukturierung kann bei genauerer Betrachtung ins Gegenteil umschlagen. Oft ist eine doppelte Menge an Detailwissen zu Print und Onlinedaten einzubringen, meist fokussiert auf einzelne Personen. Mit dieser Abhängigkeit ist eine ganze Produktionsschiene nicht mehr unbedingt zukunftsweisend aufzubauen. Auch die Antwort auf die Frage nach dem führenden Datenbestand, in der Regel dann die Printdaten, ist langfristig in dieser Einseitigkeit als nachteilig zu bewerten.

Mögliche Ersparnisse durch Vergabe der Aufgabe des Nachstrukturierens an verschiedenste Dienstleister, ziehen vorhersehbar qualitative Einbußen nach sich. Oder eine Ersparnis wird durch erhöhten Aufwand zur Qualitätskontrolle und Nacharbeit wieder relativiert.

Weitere Meldungen

flowdocX – Was steckt unter der Haube?

Microsoft Office Word ist die verbreitetste Software für literarische Werke. flowdocX ist eine Standardsoftware für Autoren zur Erstellung cross-medialer Publikationen innerhalb der gewohnten Word-Umgebung. In diesem Artikel erfahren Sie, auf welche Technologien bei der Entwicklung von flowdocX gesetzt wurde, was diese bedeuten und welche speziellen Aufgaben sie übernehmen können.

flowdocX – Was steckt unter de...
XML aus Kundensicht und -beratung

Unsere Vertriebsmitarbeiter Frau Senz und Herr Klaß stehen in täglichem Kontakt mit unseren Kunden. Die Gespräche und Beratungen drehen sich häufig um Fragen rund um den Einsatz von XML für Publikationen. Lesen Sie hier die Erfahrungen unserer Mitarbeiter und Ihre Sicht der Dinge.

XML aus Kundensicht und -berat...
Was gibt es Neues in flowbooks?

Unser Content Management System flowbooks hat sich in jahrelangem Einsatz bewährt. Dabei sind wir immer bemüht, es an die Anforderungen unserer Kunden anzupassen. Durch die regelmäßigen Erweiterungen hat sich der Funktionsumfang des Systems im letzten Jahr deutlich vergrößert.

Was gibt es Neues in flowbooks...