Eingabesystem "Xtract"
Das Eingabesystem "Xtract" dient dem Einlesen von Stapeln, die von der Anwendung IRISXtract in das Dateisystem exportiert wurden. Abweichend von anderen dateibasierten Eingabesystemen generiert xSuite Interface für Xtract-Stapel keine separate Statusdatei. Stattdessen nutzt xSuite Interface die Statusdatei, die bereits von Xtract erstellt wurde, und ändert die Dateiendung.
Die Dateiendung spiegelt den internen Verarbeitungsstatus von xSuite Interface wider:
.xSI.working.xSI.finished.xSI.error.xSI.suspended.xSI.canceled
Standardmäßig werden nur die seitenbezogenen Bilddateien als Anlagen zu den Dokumenten eines Stapels eingelesen. Die verschiedenen Arten von begleitenden Indexdateien werden standardmäßig nicht eingelesen. Wenn bestimmte dieser Dateien ebenfalls mit übernommen werden sollen, muss dies in der untenstehenden Eigenschaft .IncludeIndexFile[] explizit angegeben werden. Folgende Dateien werden grundsätzlich unterstützt:
prop.txt(stapel-, vorgangs-, dokument- und seitenbezogen)para.dat(stapel-, vorgangs-, dokument- und seitenbezogen)result.xml(dokumentbezogen)
Stapelbezogene und vorgangsbezogene Dateien werden redundant an jedes Dokument des Stapels angefügt.
Von den seitenbezogenen Dateien (P{Seite}.txt und P{Seite}.dat) können mehrere existieren, die alle dem betreffenden Dokument zugeordnet werden. Um für die spätere Weiterverarbeitung die auf verschiedenen Ebenen namensgleichen Dateien prop.txt und para.dat unterscheidbar zu machen, werden diese Dateien implizit mit einem Namenspräfix versehen. Der Namenspräfix kennzeichnet die Ebene: batch_, unit_, doc_ und page_.
Das inhaltliche Auslesen der Indexdateien muss nachgelagert mit einem passenden Indexdatenleser erfolgen:
Datei
prop.txt: allgemeiner CSV-IndexdatenleserDatei
para.dat: XtractDat-IndexdatenleserDatei
result.xml: allgemeiner XML-Indexdatenleser
Indexdaten auf Seitenebene beziehen sich jeweils auf eine Dateianlage. Das Datenmodell von xSuite Interface sieht jedoch nur Indexdaten auf Dokumentebene vor. Über die Eigenschaft .ReadPageIndex[] können diese Indexdaten aber in Form von freien Metadaten an die Dateianlagen angefügt werden.
Eigenschaft | Beschreibung |
|---|---|
InputSystem.SignalFolder* | Pfad des Verzeichnisses, das auf Signaldateien überwacht wird Die Signaldateien kennzeichnen die neu einzulesende Stapel. |
InputSystem.DataFolder* | Pfad des Wurzelverzeichnisses, in dem die mit den Signaldateien korrespondierenden Stapelordner mit den einzulesenden Daten liegen |
InputSystem.SignalFileExt | Dateiendung der Signaldatei, die einen Stapel kennzeichnet, der fertig aus Xtract exportiert und somit durch xSuite Interface einzulesen ist Standardwert: |
InputSystem.IncludeIndexFile[] | optionale Kennzeichner für die Arten von Indexdateien, die als Dateianlagen übernommen werden sollen:
|
InputSystem.ReadPageIndex[] | optionale Namen von Feldern aus den seitenbezogenen Indexdateien Eine Sonderbehandlung erfolgt für das Feld "Attachment": Wenn dieses Feld eingelesen wird und den Wert |