Knowledge Discovery
discovery

Knowledge Discovery –
Die Erschließung von Wissen

Porträt von Roman Kern Kontakt E-Mail
senden
Roman Kern Area Head
Porträt von Matthias Heise Kontakt E-Mail
senden
Matthias Heise Deputy Area Head
Kontaktieren Sie uns

Fühlen Sie sich auch hin und wieder wie ein „Schatzsucher“ auf der Suche nach verborgenen Informationen oder benötigtem Wissen? Tatsächlich nehmen Recherche-Aktivitäten und der Umgang mit großen Datenmengen heute einen beträchtlichen Teil unserer Arbeitszeit ein. In der Area "Knowledge Discovery" entwickeln wir daher automatisierte Methoden zur Analyse, Anreicherung und Verknüpfung von komplexen Datenquellen.

Uns gehen die Ideen nie aus!
Methoden und Anwendungen

Information Retrieval

Im Bereich Information Retrieval (Suchtechnologien) machen wir unseren KundInnen die Suche im Unternehmensumfeld leichter und lösen Anforderungen wie Mehrsprachigkeit oder die Verwendung von Synonymen. Speziell im Bereich der Enterprise Search stellen sich Herausforderungen, wie beispielsweise die Einschränkung der Suchergebnisse auf nur jene Dokumente, für die die jeweiligen MitarbeiterInnen Berechtigungen haben. Unsere Lösungen basieren auf Technologien, die ohne das Mitprotokollieren von Benutzerinteraktionen auskommen.

Machine Learning

Im zweiten Bereich steht die Kategorisierung, Gruppierung und Sortierung von Dokumenten im Vordergrund. Maschinelle Lernverfahren (Machine Learning) weisen Dokumenten nach vorgegebenen Mustern oder automatisiert verschiedene Kategorien zu. Diese Kategorien können entweder im Vorfeld schon definiert sein oder sie werden automatisiert aus dem Datenbestand berechnet. Verwandte Ansätze erlauben es auch, eine automatische oder geführte Verschlagwortung von Dokumenten durchzuführen. Unsere Technologien beschränken sich dabei nicht auf textuelle Ressourcen, sondern können ebenfalls auf unterschiedliche Typen von Daten angewandt werden, beispielsweise Sensordaten oder Zeitreihen.

Natural Language Processing

Im Bereich „Natural Language Processing” extrahieren wir Informationen aus unstrukturierten, natürlichsprachlichen Daten – einfache Informationen wie Namen oder Orte, aber auch Fachbezeichnungen. Damit diese Methoden eine zufriedenstellende Qualität erreichen, ist es oft notwendig, die Algorithmen mit Trainingsdaten zu unterstützen. Um dies zu ermöglichen, entwickeln wir Tools, welche die Erstellung der Trainingsdaten erleichtern und weitestgehend automatisieren. Ebenso beschäftigen wir uns mit der Extraktion und Analyse von PDF-Dokumenten, die oft im Unternehmensumfeld gefunden werden und durch unsere Methoden für eine Weiterverarbeitung nutzbar gemacht werden können.

Big Data

Die genannten Methoden der drei Bereiche werden nicht nur auf kleine Dokumentbestände, sondern auch auf riesige Datensätze (Big Data) angewendet und im Verbund von vielen Maschinen analysiert und ausgegeben.

Projekte

  • Hyperwave

    In einem gemeinsamen Projekt mit Hyperwave entsteht zum Beispiel eine Enterprise Search Lösung für Content Management Systeme. Viele der von uns entwickelten Suchtechnologien kommen dabei zum Einsatz und werden in die bestehende Infrastruktur der Partnerorganisation integriert. Davon profitieren letztendlich alle KundInnen von Hyperwave, die eine für den jeweiligen Einsatzbereich anpassbare Suchlösung bereitgestellt bekommen. Stellvertretend dafür ist beispielsweise die Möglichkeit, das jeweilige branchenspezifische Vokabular über einen Thesaurus an die Indizierung anzubinden.

  • Lexis-Nexis

    Für LexisNexis wiederum haben wir eine Lösung zur automatischen Zuordnung und Gruppierung von juristischen Texten zu verschiedenen Rechtsgebieten entwickelt. In allen Bereichen unserer Arbeit ist ein Stichwort besonders wichtig: Big Data. Alle oben genannten Methoden werden im Know-Center nicht nur auf kleine Dokumentbestände angewendet, sondern auch auf riesige Datensätze, die im Verbund von vielen Maschinen analysiert werden können. Das Knowledge Discovery Team hat sich hier über die Jahre die entsprechenden Engineering Skills angeeignet sowie Methoden entwickelt, um mit immer größer werdenden Datenbeständen umgehen zu können.

  • Mendeley

    Ein wichtiger Teil unserer Arbeit besteht darin, unseren Projektpartnern Technologien zur Verfügung stellen, die es erlauben, innovativ tätig zu sein. Ein Beispiel dafür ist ein gemeinsames Projekt mit Mendeley, ein Anbieter für Software für die Verwaltung von Publikationen. In diesem Projekt wurden bestehende Ansätze weiterentwickelt und neue Methoden erstellt um aus unstrukturierten Dokumenten Information zu extrahieren, beispielsweise automatische Tabellen-Extraktion und Rekonstruktion des Table of Contents. Desweiteren können benannte Entitäten in den Domänen Bio-Med und Computer-Wissenschaften mit einer Qualität erkannt werden, die dem Stand der Technik entspricht und darüber hinaus geht. Diese Techniken erlauben es letztendlich, dass die Benutzer von Mendeley schneller in ihren Publikationen navigieren können.

Kontakt

Wenn Sie diese Seite nutzen stimmen Sie der Verwendung von Cookies zu mehr Information

The cookie settings on this website are set to "allow cookies" to give you the best browsing experience possible. If you continue to use this website without changing your cookie settings or you click "Accept" below then you are consenting to this.

Close