Seiteninhalt:
Auf dieser Seite werden Anforderungen an den XDS Document Service und MHD Service definiert, welche die Volltextsuche unterstützen.
Das heißt, dass alle über den XDS Document Service abrufbaren Dokumente auch über den MHD Service abgerufen werden können, unabhängig davon, ob sie für eine Volltextindizierung relevant sind oder nicht. Aktuell werden nur PDF/A-Dokumente für die Volltextsuche indiziert; andere Dokumententypen wie Zahnbonusheft oder andere Medizinische Informationsobjekte (MIOs) werden dennoch über den MHD Service bereitgestellt.
Unter Indizierung oder Indizieren wird im folgenden die Extraktion von Text aus Dokumenten verstanden, um sie für eine spätere Nutzung aufzubereiten. Im Kontext des MHD Service werden die extrahierten Daten für die Bereitstellung der Volltextsuche genutzt.
Eine Indizierung kann erfolglos sein, also den MHD-Dokumentenindex unverändert lassen. Mögliche Gründe sind ein fehlender Text im Dokument oder ein nicht zu verarbeitender Zeichensatz. Näheres ist in den folgenden Anforderungen beschrieben. Es werden keine Vorgaben gemacht, wie der gemeinsame Dokumentenindex aufzubauen oder zu speichern ist.
Je nach Implementierung der Suche kann es sinnvoll sein, auf den Ausschluss der der Stoppwörter sofort bei der Indizierung zu verzichten oder dies erst “nachträglich” vorzunehmen.
Die PDF/A-Formate PDF/A-1a, PDF/A-2a und PDF/A-2u enthalten immer ein Unicode-Mapping, während PDF/A-1b und PDF/A-2b dieses nur optional bereitstellen. Falls keine Unicode-Mappings vorhanden sind, können andere Mittel verwendet werden (heuristische Verfahren, bekanntes Unicode-Mappings von Standardfonts, etc.). Die Verwendung solcher Mittel wird auch grundsätzlich (also auch bei anderen Formaten als PDF/A-1b und -2b) nicht ausgeschlossen, ist aber bei vorhandenem Mapping nicht zwangsläufig sinnvoll.
Es kann unter Umständen technisch schwierig sein, ein gedrehtes Dokument in die richtige Position für eine OCR-Untersuchung zu bringen. Das gilt besonders dann, wenn nicht um 90 (270) oder 180 Grade gedreht wurde. Deshalb soll hier nach “best effort” gehandelt werden. Die Anforderung steht aber nicht der Verarbeitung von Seiten entgegen, die in einem ungewöhnlichen Rotationswinkel abgespeichert wurden. Regulärer PDF-Text (d.h. Text außerhalb von Bildern) kann unabhängig von der Seitenorientierung ausgelesen werden.
OCR spielt natürlich nur bei Formaten eine Rolle, die Bilder enthalten können. Entsprechende Anforderungen finden dann natürlich keine Anwendung.
Der XDS Document Service kann die VAU für einen Aktenkontozugriff nicht selbständig öffnen. Die initiale Indizierung nach Aktivierung der Volltextsuche im Aktensystem kann deshalb nur starten bzw. fortgesetzt werden, wenn das Aktenkonto durch einen Zugriffsberechtigten (z. B. Leistungserbringer) geöffnet wird. Die Indizierung muss nicht synchron durchgeführt werden (d.h. das einstellende System kann ein Einstellbestätigung erhalten, ohne dass das Dokument fertig indiziert wurde).