Knowledge Relationship Discovery

Bereichsleiter

Dr. Michael Granitzer

Tel.: +43 316 873 9263
Fax: +43 316 873 9254

E-Mail: mgrani[at]know-center.at

Stv. Bereichsleiter

Wolfgang Kienreich

Tel.: +43 316 873 9272
Fax: +43 316 873 9254
E-Mail: wkien[at]know-center.at

   
   

"Wir ertrinken in Informationen, aber uns dürstet nach Wissen." John Naisbitt (1929-heute)

 
   

"Where is the wisdom we have lost in knowledge? Where is the knowledge we have lost in information?" T.-S. Eliot (1888-1965)

 
 
 

Ziel im Knowledge Relationship Discovery ist es, Suche, Darstellung und Analyse in komplexen Wissensräumen zu unterstützen und dadurch Wissen in einem für das menschliche Informationsbedürfnis geeigneten Format zur Verfügung zu stellen. Von zentraler Bedeutung ist dabei die Identifikation von Beziehungen zwischen Wissensobjekten, da sich die semantischen Dimensionen von Wissensräumen oft nicht über Inhalte, sondern über die Beziehungen zwischen Inhalten erschließt. Unsere Vision ist es, mit unserer Arbeit inhaltsbasierte und semantische Erschließungstechniken zusammenzuführen, um damit den so genannten Semantic Gap, die Lücke zwischen Semantik und Information, in Wissensräumen zu schließen.

Die Arbeitsschwerpunkte

Unsere Ansätze sind dabei Bottom-Up gerichtet. Ausgehend von einzelnen Knowledge Repositories wie z.B. Dokumentmanagementsystemen, aber auch modernen Formen der Wissensaggregation wie z.B. Wikis, erfolgt die semantische Anreicherung der einzelnen Quellen. Aufgrund seiner konzeptionellen Dichte und Relevanz für die Praxis fokussieren unsere Arbeiten hauptsächlich auf das Medium Text, wobei unser Fokus auf sich dynamisch ändernden Quellen liegt. Die Medientypen Video, Bild und Audio werden durch die Kompetenzen unserer wissenschaftlichen Partner abgedeckt. Insbesondere in Zeiten des Prosumer-Webs, indem sich Inhalte im Sekundentakt ändern, müssen Möglichkeiten zur Berücksichtigung und Analyse dieser Dynamik geschaffen werden. Über Methoden wie dem Text und Knowledge Mining, Ontology Learning und Ontology Population zielen wir auf die Erhöhung der Informationsqualität für nachfolgende Verarbeitungsschritte wie etwa einer Suche ab. Methoden der Informationsextraktion erlauben hier z.B. die Extraktion und Disambiguierung von im Text vorkommender Personen und das Einhängen dieser in semantische Strukturen wie z.B. Ontologien.

Aufbauend auf der semantischer Anreicherung von Quellen beschäftigen wir uns mit der semantischen Harmonisierung der angereicherten Quellen. Ziel ist dabei, Konzepte zwischen verschiedenen Quellen zu harmonisieren und Änderungen in der Bedeutung von Konzepten zu erfassen. Über Methoden des Ontology Alignments sowie die Verwendung von Graph Matching Methoden zielen wir auf die Überführung einer semantischen Struktur auf eine andere ab. Zusätzlich kommen auch inhaltsbasierte Vergleichsverfahren und Ähnlichkeitsanalysen zum Einsatz, um ebenfalls einen Vergleich auf Artefaktebene zu ermöglichen. Besonders in aufstrebenden Bereichen wie Web 2.0 im Unternehmen kann dies von zentraler Bedeutung für die Bereitstellung von Single-Point-of-Access Mechanismen sein. Zum Beispiel spielen Wikis vermehrt die Rolle der zentralen Sammlung des Unternehmenswissens und ersetzen damit die Suche bzw. das Wissensmanagementsystem als zentralen Einstiegspunkt. Über die oben angeführten Methoden ist es nun möglich, unterschiedliche Inhalte dynamisch mit den Inhalten eines Wikis zu verknüpfen und somit alle Informationsquellen im Unternehmen mit dem zentralen Einstiegspunkt zu verknüpfen.

Nach semantischer Anreicherung einzelner und Harmonisierung mehrerer Datenquelle stellt sich die Frage der Nutzbarmachung dieser Datenquellen unter Berücksichtigung extrahierter Beziehungen. Unterschieden wird hier zwischen explorativen, visuell geprägten Zugängen und den damit verbunden Möglichkeiten der Visualisierung von unterschiedlichen Beziehungen. Durch Anwendung von Techniken der Wissensvisualisierung und aus dem Bereich der Visual Analytics versuchen wir das Ableiten neuen Wissens für den/die Benutzer/-in zu verbessern. Beispielsweise sollen diese Techniken die Darstellung der Entwicklung von Themen innerhalb eines Patentdatenstandes über die Zeit ermöglichen und Fragen nach verschwindenden Themen oder neuen „Hot Topics“ beantworten.
Zusätzlich setzen wir die semantische Anreicherung und Harmonisierung zur Erhöhung der Retrievalqualität in heterogenen Datenquellen ein, um Nutzer/-innen mit einem konkreten Informationsbedürfnis in ihrer Suche zu unterstützen. In all diesen Bereichen bildet auch die Entwicklung von Feedbackmethoden, d.h. Möglichkeiten für den/die Benutzer/-in die Qualität der Methoden zu bewerten und die Algorithmen entsprechend zu aktualisieren, einen wichtigen Punkt.

Als Ausgangsbasis für anwendungsorientierte Projekte und Forschungsaktivitäten wurde das intelligente KnowMiner-Framework entwickelt. Dieses Framework bietet umfassende Möglichkeiten für die rasche und effiziente Entwicklung und Evaluierung von neuen Methoden und Technologien. Weiters steht eine breite Palette von Algorithmen für die genannten Themenbereiche zur Verfügung. Aktuelle Arbeiten am KnowMiner-Framework beinhalten die Verfügbarmachung von Funktionalität über service-orientierte Schnittstellen sowie die Implementierung neuer Erkenntnisse aus dem wissenschaftlichen Umfeld und die Optimierung des Frameworks für Szenarien, die sehr große Datenmengen erfordern.

Wissenschaftliche Exzellenzfelder

  • Semantische Anreicherung von Informationsquellen mittels Knowledge Mining Methoden
  • Semantische Integration heterogener Informationsquellen über Ontologien und Graph Mining Methoden
  • Retrieval in heterogenen Wissensbestände und Visualisierung von Wissensbeziehungen

Weitere Kernkompetenzen

  • Wissensvisualisierung und Mensch-Maschine-Schnittstellen im Kontext der Darstellung und Navigation komplexer Wissensräume
  • Benutzerevaluierung und Gütebestimmung mittels statischer Methoden
  • Beschreibungsstandards für multimediale Daten, Klassifikationsschemata und Metadatenstandards
  • Service orientierte Architekturen und verteilte, datenintensive Informationsverarbeitung