Zum Hauptinhalt springen

Studierendenprojekte

Automatisierte PDF-Annotation

Entwicklung einer Java-Applikation

Im Rahmen des Bachelor Studiengangs Wirtschaftsinformatik & Digitale Transformation und im Zuge dieser Arbeit wird eine Applikation zur automatisierten PDF-Annotation entwickelt. Die Zielvorgabe richtet sich dabei nach den konkreten Anforderungen der Bilfinger Industrietechnik Salzburg GmbH, welche eine entsprechende Lösung anstrebt. Der Bedarf nach solch einer Applikation entsteht aus der voranschreitenden Digitalisierung von Geschäftsprozessen, sodass digitale Dokumente auch im Geschäftsalltag nicht mehr wegzudenken sind. Den Inhalt dieser Dokumente gilt es, wie bei den physischen Vorgängern, aufzubereiten, zu überprüfen und durch zuständiges Personal freizugeben. Die Optimierung dieses digitalen Geschäftsprozesses in Form einer Automatisierung ergibt sich als nächster logischer Schritt. In dieser Arbeit wird eine Methode betrachtet, um die Komponente des Aufbereitens des beschriebenen Prozesses durch die Entwicklung einer Java-Applikation zur automatisierten Dokument-Annotation zu unterstützen Die entwickelte Lösung bedient sich dabei den Dokument-Formaten PDF und CSV, welches als Wörterbuch zur Verwaltung der gängig gesuchten Begriffe dient. Herausforderungen stellten unter anderem das begrenzte Angebot von Open-Source PDF-Bibliotheken, aber auch die Realisation der Annotation innerhalb eines PDF-Dokumentes selbst, welche die Berechnung von Koordinaten verlangt. Das finalisierte, eigenständig betriebsfähige Tool erlaubt es innerhalb eines User Interfaces eine PDF und eine Wörterbuchdatei im CSV Format zu laden, sowie einen Pfad zur Speicherung des annotierten Dokumentes auszuwählen. Die annotierten Begriffe sind durch eine farbliche Hervorhebung, einer Kategorie und einem Kommentar gekennzeichnet, welche innerhalb der Wörterbuchdatei zuvor definiert wurden. Eine Übersichtstabelle am Ende des annotierten Dokuments hält zusätzlich gesammelt alle getätigten Annotationen fest. Methoden der Computerlinguistik, wie Maschinelle Übersetzung, Normalformreduktion, Wortnetze und Eigennamenerkennung werden theoretisch als zusätzliche Möglichkeit betrachtet, um weitere Funktionalitäten zur Anwendung hinzuzufügen. Eine Gegenüberstellung zu anderen bestehenden Lösungen grenzt abschließend die Funktionalitäten der Applikation ab.

Facts:
Projekt-Betreuer: DI Maximilian Ernst Tschuchnig, BSc
Studierende: Alexander Krubner, Johannes Meindl und Nikolaus Pichler
Typ: Bachelorprojekt
Studiengang: Bachelor, Wirtschaftsinformatik & Digitale Transformation

Foto: FH Salzburg/Studierendengruppe

Foto: FH Salzburg/Studierendengruppe