Indexdatenleser "MsWord"
Der Indexdatenleser "MsWord" dient der Extraktion von Inhalten aus einer Dateianlage des Typ "Microsoft-Word-Dokument". Für die Eigenschaft .InputName gilt eine spezielle Syntax in Form eines Wertes, der aus mehreren Parametern zusammengesetzt ist. Dieser Wert definiert das auszulesende Element.
Der erste Parameter trägt immer den Namen ElemType und benennt die Art des Elements. Abhängig von der Elementart sind teils weitere Parameter verfügbar, um das Element zu spezifizieren.
Element | Parameter |
|---|---|
Gesamter Dokumentinhalt |
|
Anzahl Seiten |
|
Seite |
|
Absatz |
|
Textmarke |
|
Formularfeld |
|
Steuerelement |
|
Textbox |
|
Eingebettete, benutzerdefinierte XML-Datei oder ein Knoten darin |
|
Tabelle |
|
Dokumenteigenschaft |
|
Ein vollständiger Wert der Eigenschaft .InputName zum Auslesen einer Tabellenspalte kann z. B. wie folgt aussehen:
ElemType: Table, Number: 1, ColNumber: 2
In verkürzter Form, ohne Parameternamen, sieht der Wert wie folgt aus:
Table, 1, 2
Die Parameter Number und Name sind alternativ zu verwenden, da die betreffenden Elemente entweder über ihre Nummer (beginnend bei 1) oder ihren Namen identifiziert werden können. Beim Auslesen einer Tabellenspalte können mehrere Werte zurückgeliefert werden. Wenn das Ziel ein Kopfdatenfeld ist und die Eigenschaft ProcessReadIndex[].ReadMultiValues aktiviert ist, wird diesem ein Array der Einzelwerte pro Zelle zugewiesen. Leere Zellenwerte werden dabei automatisch herausgefiltert. Bei einem Tabellenfeld als Ziel hingegen wird für jede ausgelesene Tabellenzeile eine entsprechende Zeile in der Zieltabelle generiert.