|
|
Beschreibung: Die vor der Abschaltung eines SAP R/2 Servers im CSV und PDF-Format gesicherte Daten sollen für die Buchhaltung des Kunden weiterhin zum Nachschlagen in digitaler Form zur Verfügung stehen. Aufgabe: Ca. 10 GByte CSV-Daten und mehrere GByte PDF-Dokumente sollen über ein neu zu erstellendes Tool recherchiert werden können. Während diese Aufgabe für die Textdateien relativ einfach zu lösen ist, ist dies für die PDF-Dokumente weitaus komplexer. Aufgrund der großen Datenvolumina ist zunächst eine automatische Indexierung der einzelnen PDF-Dateien erforderlich, die mit einem speziellen Skript realisiert wird. Im zweiten Schritt werden die Seitenzahlen für zuvor festgelegte Schlagworte ermittelt, die für die spätere Anzeige im Recherchetool benötigt werden. Die aufbereiteten Daten werden in eine SQL-Server 2000 Datenbank geladen und dieses über ein Access Anwendung verfügbar und unter Berücksichtigung standortspezifischer Rechte recherchierbar gemacht. Rolle: Konzeption und Entwicklung |