![]() |
|
Alle Support-Themen im Überblick
|
|
XML in der Produktion von Digital- und Printmedien XML (die eXtensible Markup Language) ist eine Auszeichnungs- und Beschreibungssprache, um Informationen strukturiert abzulegen. Sie erlaubt den Informationsaustausch zwischen unterschiedlichen Programmen und Computerplattformen. Im Medienbereich ist der Einsatz von XML-Daten beispielsweise für die automatisierte und datenbankgestützte Produktion von Print- und Onlineproduktionen denkbar. Die folgende Einführung richtet sich in erster Linie an Anwender aus dem Medienbereich und beschäftigt sich mit folgenden Themen: Was ist XML
|
| DTD (Document Type Definition) | |
|
<!ELEMENT Zeitungsartikel (Autor, Ort, Datum,
Ueberschrift, Vorspann, Lauftext)> <?xml version="1.0" encoding="ISO-8859-1"?> Lassen Sie uns die DTD analysieren: In der oben abgebildeten DTD-Datei ist das Element Zeitungsartikel das "Wurzel"- oder "Stammelement". Von diesem Stammelement gehen so genannte "Tochterelemente" ab. In diesem Fall Autor, Ort etc. Diese Tochterelemente haben in unserem Fall keine weiteren Tochterelemente und können in der XML-Datei direkt mit Inhalt gefüllt werden. Diese Elemente sind als #PCDATA definiert. PCDATA steht für "Parseable Character Data", was bedeutet, dass der Inhalt dieses Elements vom Parser (vom verarbeitenden Programm) berücksichtigt wird. Und nun ein Blick auf die ersten zwei Zeilen der dazugehörigen XML-Datei: <?xml version="1.0" encoding="ISO-8859-1"?> In der ersten Zeile steht die Angabe, dass in dieser Datei XML, Version 1.0 verwendet wird. Außerdem erfahren wir, dass der Zeichensatz ISO-8859-1 (der westeuropäische Zeichensatz mit Umlauten) verwendet wird. Quark XPress 6 verlangt beim Import von XML-Daten allerdings die Unicode-Zeichensätze UTF-8 oder UTF-16. UTF-8 verwendet ein Byte zur Kodierung der Zeichen und ist voll ASCII-kompatibel, d.h. die ersten 127 Zeichen sind identisch. UTF-16 nutzt zwei Byte und kann mehr Zeichen in einem Zeichensatz unterbringen, z.B. die deutschen Umlaute. UTF-16 kann mit älteren Texteditoren unter Umständen nicht weiterbearbeitet werden. <!DOCTYPE Zeitungsartikel SYSTEM "zeitung.dtd"> In der zweiten Zeile wird auf die Dokumentenklasse und die DTD "zeitung.dtd" verwiesen. Der Name der Dokumentenklasse (Zeitungsartikel) muss mit dem Namen des Stammelements in der DTD übereinstimmen. Die Angabe "SYSTEM" bedeutet, dass die DTD lokal für den Computer verfügbar und nicht öffentlich ist. "PUBLIC" wäre an dieser Stelle eine öffentliche DTD, die z.B. über das Internet aufgerufen werden kann. Nach diesen zwei einleitenden Codezeilen folgen in der XML-Datei die eigentlichen Inhalte. Umgeben ist der Inhalt vom Stammelement <Zeitungsartikel>. XML-Dokumente müssen "wohlgeformt", aber können "gültig"
sein. Um die Wohlgeformtheit eines XML Dokuments zu prüfen, können Sie es einfach in einem aktuellen Browser öffnen.
XML-Schema eine Alternative zu DTD Eine Weiterentwicklung der DTD ist das sogenannte "XML Schema".
Quark XPress 6 kann nur gültige XML-Dateien verarbeiten, erfordert also immer eine DTD. Links Informationen zu DTDs auf selfhtml: http://de.selfhtml.org/xml/dtd/index.htm
|
|
Abbildung: Der XML-Arbeitsbereich in InDesign Die Arbeitsweise ähnelt im Prinzip der in XPress, allerdings haben Sie in InDesign 2 keine dynamische Verbindung zwischen dem Print-Layout und den XML-Daten. D.h. nach dem XML-Import wird bei einer Änderung der originalen XML-Datei das Print-Layout nicht automatisch mit aktualisiert. Für das Arbeiten in einem XML-basierten Workflow empfiehlt Adobe ihr Produkt Framemaker.
Abbildung: Arbeiten mit strukturierten Dokumenten in Framemaker Das Arbeiten mit XML ist auch in Adobe Framemaker nicht ohne einigen
Aufwand zu realisieren. Auch hier lassen sich Bilder nur manuell integrieren.
Framemaker ist im Gegensatz zu den oben vorgestellten Programmen XPress
und InDesign in der Lage, direkt aus einem bestehendem Layout CSS-Dateien
zu generieren.
|
| XML Dokumente mit XSL in andere Formate umwandeln | |
|
Mithilfe der eXtensible Stylesheet Language XSL lassen sich XML-Dokumente in andere Formate wie PDF, RTF, HTML oder in andere XML-Dateien umwandeln. XSL besteht aus zwei Teilen, der Transformationssprache XSLT (XSL Transformations) und der Formatierungssprache XSL-FO (XSL Formating Objects). Während sich CSS für die Darstellung im Webbrowser eignet, ist XSL-FO seitenorientiert. Zunächst wird das Seitenformat und die Ränder festgelegt, dann definieren Sie den eigentlichen Inhaltsbereich (fo:region-body). Das Seitenformat wird durch ein sogenanntes master-set definiert. Innerhalb des Dokuments können wir mit mehreren Musterseiten, sogenannten page-mastern arbeiten.
Abbildung: Seitenbereiche in XSL-FO Im folgenden Listing sehen Sie ein Beispiel für eine FO-Datei, die mit einem Parser wie FOP direkt in das PDF-Format überführt werden kann. FOP (Formating Objects Prozessor) ist ein Java-Programm, das Sie z.B. unter Windows über die Kommandozeile starten können. <?xml version="1.0" encoding="utf-8"?>
<!-- Die FO-Datei ist selbst in der XML-Syntax geschrieben --> <fo:root xmlns:fo="http://www.w3.org/1999/XSL/Format"> <fo:layout-master-set> <!-- Seitenformat und Ränder (Stege)definieren --> <fo:simple-page-master master-name="Politikseite" page-height="29.7cm" page-width="21cm" margin-top="3cm" margin-bottom="6cm" margin-left="3cm" margin-right="3cm"> <fo:region-body margin-top="3cm" margin-bottom="1.5cm"/> <fo:region-before extent="3cm"/> <fo:region-after extent="1.5cm"/> </fo:simple-page-master> </fo:layout-master-set> <!-- Anfang der page-sequence hier kommt der Inhalt (in ein flow Objekt eingebettet) --> <fo:page-sequence master-reference="Politikseite"> <fo:flow flow-name="xsl-region-body"> <!-- Überschrift (Der Absatz wird umschlossen vom Block-Element) --> <fo:block font-size="18pt" font-family="sans-serif" color="white" line-height="24pt" space-after.optimum="15pt" background-color="#CC0033" text-align="center" padding-top="3pt"> Ifo Index lässt hoffen </fo:block> <!-- Vorspann, links und rechts um 8 mm eingerückt--> <fo:block font-size="12pt" font-family="sans-serif" font-style="italic" line-height="15pt" margin-left="8mm" margin-right="8mm" space-after.optimum="3pt" text-align="justify"> Der einflussreiche Ifo-Geschäftsklimaindex hat im August erneut zugelegt und den Hoffnungen auf eine Konjunkturbelebung Auftrieb gegeben. Volkswirte warnen jedoch vor zu großer Euphorie. </fo:block> <!-- Fließtext --> <fo:block font-size="10pt" font-family="sans-serif" line-height="15pt" space-after.optimum="3pt" text-align="justify"> Der Konjunkturindikator hat die Erwartungen von Analysten übertroffen. Er legte von 89,3 Punkten im Juli auf 90,8 Punkte im August zu, wie das Ifo-Institut am Dienstag in München mitteilte. Volkswirte hatten mit einem Anstieg auf 90,0 Zähler gerechnet. Die befragten Unternehmen beurteilten sowohl die aktuelle Geschäftslage als auch die Aussichten für die kommenden sechs Monate günstiger als noch im Juli. Der Index für die Geschäftslage stieg auf 79,9 Punkte, der Index für die Erwartungen auf 102,1 Punkte. </fo:block> </fo:flow> <!-- Ende des flow elements--> </fo:page-sequence> <!-- Ende der page-sequence --> </fo:root>
Links FOP: http://xml.apache.org/fop/
|
| PDF mit FOP per XSL-Stylesheet erzeugen | |
Zum Erstellen einer PDF-Datei aus einem XML-Dokument geben Sie FOP das XML-Dokument und das Stylesheet, sowie den Namen der zu erzeugenden PDF-Datei an. FOP informiert Sie dann über den Fortgang der PDF-Erzeugung. C:\Dokumente und Einstellungen\user>C:\Programme\fop\fop-0.20.5\fop -xml Ifo.xml -xsl Zeitung.xsl -pdf Ifo.pdf
[INFO] Using org.apache.xerces.parsers.SAXParser as SAX2 Parser [INFO] FOP 0.20.5 [INFO] Using org.apache.xerces.parsers.SAXParser as SAX2 Parser [INFO] building formatting object tree [INFO] setting up fonts [INFO] [1] [INFO] Parsing of document complete, stopping renderer
<?xml version="1.0" encoding="ISO-8859-1"?>
<xsl:stylesheet version="1.0" xmlns:fo="http://www.w3.org/1999/XSL/Format" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> <!-- ... hier folgen die XSLT-Regeln --> /xsl:stylesheet> Diese PDF-Datei wurde mit FOP durch das folgende Stylesheet erzeugt. <?xml version="1.0" encoding="ISO-8859-1"?> Wenn Ihnen das manuelle Erstellen des Stylesheets zu mühsam ist, sollten Sie einen Blick auf das Programm StyleVision von Altova riskieren. Mit dieser Software bekommen Sie eine grafische Benutzeroberfläche zum Erstellen von XSL-Stylesheets, FO-Dateien, HTML-Seiten oder PDF-Dokumenten.
Tipp Wenn Sie für die FO-Datei als Zeichensatz das Unicode-Format wählen, kann es zu Fehlern bei der Verarbeitung mit FOP führen. Links XSL Stylesheet Editor StyleVision: http://www.altova.com/download_stylevision.html
|
| XML in der Praxis | |
|
XML wird oft als der Nachfolger von HTML beschrieben. XML löst aber
nicht wirklich ein grundlegendes Problem der Webdesigner, nämlich
die unterschiedliche Darstellung von Webseiten auf verschiedenen Browsern
und Plattformen. Auch XHTML bietet in dieser Richtung nichts Neues. Ein
XHTML-Dokument ist eine Textdatei, die die XML-Syntaxregeln einhält,
als Tags aber die konventionellen HTML-4.0-Tags verwendet. Wollen Sie
Ihre Webseiten mit einem XML-Parser weiterverarbeiten, ist die Verwendung
von XHTML eine Möglichkeit. Wenn Sie eine möglichst große
Zielgruppe ansprechen wollen, halte ich auf absehbare Zeit jedoch HTML in
der Version 4.0 in Verbindung mit Cascading Stylesheets für das Standardformat,
in dem Webseiten an den Browser geschickt werden. Das Verwenden von XML,
Flash, PDF oder anderen Formaten als kompletter Ersatz für HTML ist
nur für begrenzte Empfängerkreise sinnvoll. Im Printbereich könnte ein Anwendungsgebiet für XML die datenbankgestützte
Katalogproduktion sein. Ein automatisierter Arbeitsablauf lässt sich
wie oben beschrieben mithilfe der Transformationssprache XSLT (eXtensible
Stylesheet Language Transitions) und XSL-FO (XSL-Formating Objects) realisieren.
Literaturhinweise Einführung in XML: http://de.selfhtml.org/xml/ |
|
Letzte Aktualisierung dieser Datei am: 01.1.1970 |