Eingabeformat "Xml"
Dieses Eingabeformat ermöglicht die Auftrennung einer XML-Datei, die einen Dokumentenstapel repräsentiert, in die Einzeldokumente. Außerdem ermöglicht dieses Eingabeformat das Extrahieren oder Hinzufügen von zugehörigen Dateianlagen zur XML-Datei.
Eigenschaft | Beschreibung |
|---|---|
InputFormat[].DocNode | optionale Definition des Knotens in einer XML-Datei, anhand dessen die Datei in separate dokumentspezifische Teile zertrennt wird Standardmäßig wird davon ausgegangen, dass eine XML-Datei nur ein Dokument enthält. Bei der Aufteilung wird das Ursprungsdokument verworfen und stattdessen für jedes neue Teildokument eine Kopie des Ursprungsdokuments generiert. Der Kopie wird der dokumentspezifische Teil der ursprünglichen XML-Datei als weitere Anlage hinzugefügt. Das Dokument und die Anlage erhalten den Namenszusatz Als Syntax für die Angabe der Eigenschaft ist XPath zu verwenden. Dies ist die gleiche Syntax, die auch für die Extraktion von Indexdaten verwendet wird (siehe XML-Indexdatenleser). Wenn die XML-Datei beispielsweise mehrere <Root> <Document>…</Document> <Document>…</Document> </Root> |
InputFormat[].AttachFileMode | Modus, wie zusätzliche Dateianlagen aus der XML-Datei extrahiert oder zu dieser hinzugefügt werden:
Die Modi |
InputFormat[].AttachFileNode(*) | Diese Eigenschaft ist für die Modi Teilparameter in XPath-Syntax für die Definition der XML-Knoten, die Daten zu den Dateianlagen enthalten:
Die Parameter 2 und 3 sind nur für den Modus Weitere Teilparameter frei wählbaren Namens sind zulässig. Diese Parameter werden den Dateianlagen als Metadaten hinzugefügt. |
InputFormat[].AttachFileRefMacro(*) | Feldmakroausdruck, der im Modus Dieser Ausdruck kann optional auch im Modus In dem Makroausdruck sind Dateivariablen wie |
InputFormat[].RemoveXmlNs | Wahrheitswert, ob vor dem Parsen der XML-Dateien enthaltene Namensraumangaben aus diesen entfernt werden, um damit verbundene Probleme beim Parsen zu umgehen XPath-Ausdrücke zum Referenzieren von Knoten sind dann ggf. auch ohne Namensraumpräfix anzugeben. Standardwert: AchtungBei Beibehaltung der Namensräume sind XML-Dokumente nicht lesbar, wenn diese einen Standardnamensraum (ohne Präfix) verwenden, z. B. bei dem Wurzelknoten. |