|
| 1 | +--- |
| 2 | +title: Package Export |
| 3 | +identifier: intranda_step_exportPackage |
| 4 | +published: true |
| 5 | +description: Dieses Step Plugin ermöglicht einen flexiblen Export von Metadaten und Inhalten eines Goobi Vorgangs an einen konfigurierbaren Pfad |
| 6 | +--- |
| 7 | +## Einführung |
| 8 | +Dieses Plugin erlaubt einen flexiblen Export von Daten eines Vorgangs in ein definiertes Zielverzeichnis. Dabei kann dieses Plugin sehr granular konfiguriert werden, um ausgewählte Daten im Export zu berücksichtigen. Darüber hinaus ist hier ebenfalls eine Transformation der internen und der Export-METS-Datei via XSLT möglich und erlaubt so verschiedenste Einsatzszenarien. |
| 9 | + |
| 10 | + |
| 11 | +## Installation |
| 12 | +Zur Installation des Plugins muss die folgende Datei installiert werden: |
| 13 | + |
| 14 | +```bash |
| 15 | +/opt/digiverso/goobi/plugins/step/plugin_intranda_step_exportPackage-base.jar |
| 16 | +``` |
| 17 | + |
| 18 | +Um zu konfigurieren, wie sich das Plugin verhalten soll, können verschiedene Werte in der Konfigurationsdatei angepasst werden. Die Konfigurationsdatei befindet sich üblicherweise hier: |
| 19 | + |
| 20 | +```bash |
| 21 | +/opt/digiverso/goobi/config/plugin_intranda_step_exportPackage.xml |
| 22 | +``` |
| 23 | + |
| 24 | + |
| 25 | +## Überblick und Funktionsweise |
| 26 | +Zur Inbetriebnahme des Plugins muss dieses für einen oder mehrere gewünschte Aufgaben im Workflow aktiviert werden. Dies erfolgt wie im folgenden Screenshot aufgezeigt durch Auswahl des Plugins `intranda_step_exportPackage` aus der Liste der installierten Plugins. |
| 27 | + |
| 28 | + |
| 29 | + |
| 30 | +Da dieses Plugin üblicherweise automatisch ausgeführt werden soll, sollte der Arbeitsschritt im Workflow als automatisch konfiguriert werden. |
| 31 | + |
| 32 | +Nachdem das Plugin vollständig installiert und eingerichtet wurde, wird es üblicherweise automatisch innerhalb des Workflows ausgeführt, so dass keine manuelle Interaktion mit dem Nutzer erfolgt. Stattdessen erfolgt der Aufruf des Plugins durch den Workflow im Hintergrund und führt den konfigurierten Export in das Zielverzeichnis durch. Dabei werden die angegebenen Inhalte alle in ein Unterverzeichnes des definierten Export-Pfades kopiert. |
| 33 | + |
| 34 | +Je nach Konfiguration kann dabei zusätzlich zu dem Export der Daten auch eine XSLT-Transformation der internen oder auch der Export-METS-Datei erfolgen, um diese in ein gewünschtes Format zu bringen. Abhängig von dieser Transformation sowie der Benennung der Transformationsdatei wird diese abschließend ebenfalls mit in dem Ordner des exportierten Vorganges gespeichert. |
| 35 | + |
| 36 | + |
| 37 | +## Konfiguration |
| 38 | +Die Konfiguration des Plugins ist folgendermaßen aufgebaut: |
| 39 | + |
| 40 | +```xml |
| 41 | +<config_plugin> |
| 42 | + <!-- |
| 43 | + order of configuration is: |
| 44 | + 1.) project name and step name matches |
| 45 | + 2.) step name matches and project is * |
| 46 | + 3.) project name matches and step name is * |
| 47 | + 4.) project name and step name are * |
| 48 | + --> |
| 49 | + |
| 50 | + <config> |
| 51 | + <!-- which projects to use for (can be more then one, otherwise use *) --> |
| 52 | + <project>*</project> |
| 53 | + <step>*</step> |
| 54 | + |
| 55 | + <!-- export path --> |
| 56 | + <target>/opt/digiverso/export/</target> |
| 57 | + <!-- use subfolder for each process --> |
| 58 | + <useSubFolderPerProcess>true</useSubFolderPerProcess> |
| 59 | + <!-- a zip file with the subfolder-name will be created --> |
| 60 | + <createZipPerProcess>true</createZipPerProcess> |
| 61 | + <!-- which image folders to use (master|media|jpeg|source|...) --> |
| 62 | + <imagefolder>master</imagefolder> |
| 63 | + <!-- use the attribute filegroup, if you want to add checksums to the files within the filegroup. The checksums are taken from the configured folder --> |
| 64 | + <imagefolder filegroup="PRESENTATION">media</imagefolder> |
| 65 | + |
| 66 | + <!-- which additional folders to use --> |
| 67 | + <ocr>false</ocr> |
| 68 | + <source>false</source> |
| 69 | + <import>false</import> |
| 70 | + <export>false</export> |
| 71 | + <itm>false</itm> |
| 72 | + <validation>false</validation> |
| 73 | + |
| 74 | + <!-- generate UUIDs for each mets:fileGrp and mets:file --> |
| 75 | + <uuid>false</uuid> |
| 76 | + <!-- add checksums to mets:files --> |
| 77 | + <checksum>false</checksum> |
| 78 | + <!-- command to use to validate the exported images --> |
| 79 | + <checksumValidationCommand>/usr/bin/sha1sum</checksumValidationCommand> |
| 80 | + |
| 81 | + <!-- if the internal METS file shall get transformed into another file define the path of the xsl file here --> |
| 82 | + <copyInternalMetaFile>true</copyInternalMetaFile> |
| 83 | + <transformMetaFile>true</transformMetaFile> |
| 84 | + <transformMetaFileXsl>/opt/digiverso/goobi/xslt/export_meta.xsl</transformMetaFileXsl> |
| 85 | + <transformMetaFileResultFileName>xslt_result_meta.xml</transformMetaFileResultFileName> |
| 86 | + |
| 87 | + <!-- if the METS file shall get transformed into another file define the path of the xsl file here --> |
| 88 | + <transformMetsFile>true</transformMetsFile> |
| 89 | + <transformMetsFileXsl>/opt/digiverso/goobi/xslt/export_mets.xsl</transformMetsFileXsl> |
| 90 | + <transformMetsFileResultFileName>xslt_result_mets.xml</transformMetsFileResultFileName> |
| 91 | + </config> |
| 92 | + |
| 93 | +</config_plugin> |
| 94 | +``` |
| 95 | + |
| 96 | +Der Block `<config>` kann für verschiedene Projekte oder Arbeitsschritte wiederholt vorkommen, um innerhalb verschiedener Workflows unterschiedliche Aktionen durchführen zu können. Die weiteren Parameter innerhalb dieser Konfigurationsdatei haben folgende Bedeutungen: |
| 97 | + |
| 98 | +| Wert | Beschreibung | |
| 99 | +| :--- | :--- | |
| 100 | +| `project` | Dieser Parameter legt fest, für welches Projekt der aktuelle Block `<config>` gelten soll. Verwendet wird hierbei der Name des Projektes. Dieser Parameter kann mehrfach pro `<config>` Block vorkommen. | |
| 101 | +| `step` | Dieser Parameter steuert, für welche Arbeitsschritte der Block `<config>` gelten soll. Verwendet wird hier der Name des Arbeitsschritts. Dieser Parameter kann mehrfach pro `<config>` Block vorkommen. | |
| 102 | +| `target` | Mit diesem Parameter wird der Hauptpfad definiert, wohin der Export des Vorgangs als Unterordner mit dem Vorgangsnamen exportiert werden soll. | |
| 103 | +| `useSubFolderPerProcess` | Mit diesem Parameter wird festgelegt ob für jeden Prozess ein Unterordner angelegt werden soll. | |
| 104 | +| `createZipPerProcess` | Mit diesem Parameter kann festgelegt werden, ob eine zip-Datei je Prozess erstellt werden soll. | |
| 105 | +| `imagefolder` | Es können mehrere Verzeichnisse für die Bilder bzw. Digitalisate angegeben werden. Dies kann unter anderem z.B. die Master-Bilder sowie die Derivate umfassen. Wenn die METS Datei Checksummen für die einzelnen Images enthalten soll, kann hier über das Attribut `filegroup` festgelegt werden, für welche `<mets:fileGrp>` die Checksummen der Dateien aus diesem Ordner genutzt werden sollen. | |
| 106 | +| `ocr` | Mit diesem Parameter wird angegeben, ob die OCR-Ergebnisse mit exportiert werden sollen. | |
| 107 | +| `source` | Wenn die Inhalte des `source` Ordners mit berücksichtigt werden sollen, kann dies hier angegeben werden. | |
| 108 | +| `import` | Wenn die Inhalte des `import` Ordners mit berücksichtigt werden sollen, kann dies hier definiert werden. | |
| 109 | +| `export` | Wenn die Inhalte des `export` Ordners mit berücksichtigt werden sollen, kann dies hier ebenfalls angegeben werden. | |
| 110 | +| `itm` | Sollen die Inhalte des TaskManager-Verzeichnisses `itm` mit exportiert werden, wird dies hier definiert. | |
| 111 | +| `validation` | Mit diesem Parameter kann festgelegt werden, dass die Inhalte des Verzeichnisses `validation` ebenfalls exportiert werden sollen. | |
| 112 | +| `uuid` | Wenn für die Verlinkung zwischen `<mets:structMap>`, `<mets:fptr>` und `<mets:fileGrp>`, `<mets:file>` UUIDs (v4) genutzt werden sollen, kann dies hier angegeben werden. | |
| 113 | +| `checksum` | Wenn diese Option aktiviert wurde, werden die exportierten Daten mit zuvor generierten Checksummen verglichen, um den erfolgreichen Export zu verifizieren. Wurden bei der Konfiguration der `imagefolder` auch Dateigruppen konfiguriert, werden die Checksummen auch in die entsprechenden Dateigruppen eingetragen. | |
| 114 | +| `checksumValidationCommand` | Enthält das Kommandozeilentool, mit dem die Verifizierung durchgeführt wird. | |
| 115 | +| `transformMetaFile` | Mit diesem Parameter wird festgelegt, ob die interne METS-Datei von Goobi workflow in das Zielverzeichnis kopiert werden soll. | |
| 116 | +| `transformMetaFileXsl` | Mit diesem Parameter kann festgelegt werden, ob die interne METS-Datei mittels der hier definierten XSLT-Transformationsdatei verarbeitet werden soll. | |
| 117 | +| `transformMetaFileResultFileName` | Wenn eine Transformation der internen METS-Datei mittels XSLT erfolgen soll, kann hier festgelegt werden, wie der Name der zu generierenden Datei lauten soll. | |
| 118 | +| `transformMetsFile` | Mit diesem Parameter wird festgelegt, ob die Export-METS-Datei von Goobi workflow in das Zielverzeichnis kopiert werden soll. | |
| 119 | +| `transformMetsFileXsl` | Mit diesem Parameter kann festgelegt werden, ob die Export-METS-Datei mittels der hier definierten XSLT-Transformationsdatei verarbeitet werden soll. | |
| 120 | +| `transformMetsFileResultFileName` | Wenn eine Transformation der Export-METS-Datei mittels XSLT erfolgen soll, kann hier festgelegt werden, wie der Name der zu generierenden Datei lauten soll. | |
0 commit comments