Das Know-Center hat erfolgreich mit einem Paper an der Semantic Publishing Challenge im Rahmen der ESCW Konferenz teilgenommen.

Die European Semantic Web Conference (ESWC) ist die wichtigste europäische Konferenz zu semantischen Webtechnologien. Die mit einem A-Rating ausgezeichnete Konferenz fand dieses Jahr vom 31. Mai bis 04. Juni 2015 in Portoroz, Slowenien am Meer bei Sonnenschein und sommerlichen Temperaturen statt.

Das Know-Center war auf der ESCW mit einer Publikation vertreten – diesmal mit einem Beitrag zu der im Rahmen dieser Konferenz stattfindenden Semantic Web Evaluation Challenge bzw. zu einer der  Teilchallenges namens „Semantic Publishing“ (SemPub2015).
Ein Task von SemPub2015 bestand darin, Informationen automatisch aus wissenschaftlichen Publikationen in PDF zu extrahieren (Autoren, Affiliations, Titel, Referenzen) und in einem Linked Dataset zur Verfügung zu stellen. Der Trainingsdatensatz an PDF-Dokumenten und die zu beantwortenden SPARQL-Queries wurden dabei zur Verfügung gestellt.

In diesem Task haben Stefan Klampfl und Roman Kern vom Knowledge Discovery Team am Know-Center erfolgreich mit einer innovativen Technologie zur PDF Extraktion teilgenommen, die das Resultat aus früheren Forschungsprojekten (CODE) ist. Das Ergebnis findet sich im eingereichten Know-Center Paper mit dem Titel “Machine Learning Techniques for Automatically Extracting Contextual Information from Scientific Publications” . Im Paper wird beschrieben, wie man Informationen aus wissenschaftlichen Publikationen im PDF-Format mithilfe von Machine Learning (supervised, unsupervised) in einem modularen Framework mit trainierten Klassifiziereren und Ontologien extrahieren kann. Damit erreichten die beiden die beste Precision, den drittbesten Recall, und den drittbesten F1-Wert von 0.292 unter allen Teilnehmern der Challenge (siehe Zusammenfassung der Resultate der Challenge)

Wir gratulieren Stefan Klampfl und Roman Kern herzlich zu dieser hervorragenden Leistung!

Das Paper steht hier zum Download zur Verfügung.

Vollständige Bibliographie:
S. Klampfl, R. Kern. Machine Learning Techniques for Automatically Extracting Contextual Information from Scientific Publications. In Semantic Web Evaluation Challenges 2015. CCIS. Springer, 2015.