Inhalt

Motivation
Projektziel
Schwerpunkte
Teilbereiche

Motivation und Ziele

Ausgangssituation und Motivation

In nahezu allen Bereichen und Anwendungsdomänen, in denen mit elektronischen Daten gearbeitet wird, wächst die Zahl der anfallenden Dokumente und Daten tagtäglich an. Je mehr Daten sich ansammeln, desto schwerer fällt es dem Suchenden, das relevante Wissen schnell und effizient darin zu finden. Persönliche Mediensammlungen enthalten jedoch Wissen, welches den Kontext eines Nutzers, seine Erlebnisse, Erinnerungen und Gedanken, repräsentiert, und dienen ihm nicht selten der Dokumentation und Identifikation. Dieses enthaltene Wissen stellt den eigentlichen Schlüssel für eine menschengerechte Verwaltung digitaler Mediensammlungen dar. Jedoch ist dazu eine entsprechende maschinen-verarbeitbare Beschreibung notwendig, die es ermöglicht, auf Grundlage der menschlichen Wissensstrukturen, Navigations- und Ordnungsstrukturen von Programmen darstellen und verarbeiten zu lassen.

Die Frage, die sich vor allem mit Rücksicht auf den Benutzer stellt, ist, inwieweit diese semantischen Beschreibungen aus verfügbaren Informationen automatisch bzw. semi-automatisch generiert werden können. Informationen über Medien liegen zum einen explizit in Form von Annotationen und Metadaten vor, für bestimmte Medientypen auch sehr umfangreich und entsprechend etablierten Standards (vgl. EXIF, IPTC, XMP). Zum anderen ergibt sich Wissen für den Nutzer implizit aus dem Inhalt (z.B. dargestellte Personen auf einem Bild), der Struktur, dem Entstehungskontext und charakteristischen Merkmalen eines Dokumentes (z.B. Größe und Layout eines Textes).

Etablierte Verwaltungssysteme und -anwendungen unterstützen derart orientierte Ordnungsstrukturen nur bedingt, sind hauptsächlich auf hierarchische Ordnungen beschränkt, bzw. extrahieren aus den Dateien nur ausgewählte charakteristische Merkmale zu diesem Zweck. Probleme und Hürden bei Such- und Verwaltungsaufgaben innerhalb persönlicher Mediensammlungen resultieren hauptsächlich aus der mangelnden Beschreibungs- und Anpassungsfähigkeit klassischer Ordnungsstrukturen zur Abbildung individueller Wissensmodelle.

Projektziel

Ziel dieses Projektes ist die Konzeption einer semantik-basierten Verwaltung von personenbezogenen Mediensammlungen, welche dem Nutzer bei möglichst geringem Aufwand individuelle Wissensmodelle und Ordnungsstrukturen ermöglicht, gleichzeitig aber Maschinenverarbeitbarkeit und Austauschbarkeit gewährleistet.

Forschungsschwerpunkte

Wissensakquisition, -modellierung und -speicherung

Entwicklung eines für den Anwendungsbereich geeigneten, flexiblen und individuell erweiterbaren Ontologiemodells
Entwicklung eines Vorgehensmodell zum Aufbau von Medienbeschreibungen entsprechend dem entwickelten Ontologiemodell
Formatspezifische und inhaltsbasierte Verarbeitung und Analyse multimedialer Daten zum Zwecke der Akquisition von beschreibenden Informationen
- Verarbeitung textueller, visueller und auditiver Daten mit dem Ziel der automatischen Extraktion essentieller Informationen für deren Indexierung und Beschreibung
- Verarbeitung und Interpretation enthaltener Metadaten
- Erweiterung der Informationen durch den Einsatz von Klassifikationsverfahren und vorhandenem Wissen

Aspekte der Nutzung und Entwicklung individuellem Wissens

Unterstützung von Annotationen und Ontologieerweiterungen durch verschiedene Nutzer
- Entwicklung von Strategien zur Erschließung des spezifischen Wissens des Nutzers
- Mehrbenutzerunterstützung zum Zwecke des Austauschs und Verknüpfung spezifischer Modelle
Untersuchung von Aspekten der Nutzung und änderung individueller Modelle über längere Zeiträume hinweg (Knowledge Lifecycle)

Untersuchte Teilbereiche

Entsprechend der skizzierten Ziele und Forschungsschwerpunkte ergeben sich aus theoretischer und praktischer Sicht folgende Teilbereiche, die im Rahmen des Projektes näher betrachtet werden:

Medienanalyse
Semantische Modellierung
Individuelle Nutzung und Erweiterung
Langzeitaspekte

Die übergreifende Betrachtung dieser in verwandten Arbeiten eher dediziert betrachteten Bereiche stellt insbesondere ein charakteristisches Merkmal des Projektes dar. Besonders im Kontext der Verwaltung personenbezogener Mediensammlungen ist es notwendig, Akquisition, Art der Speicherung und Nutzung von Informationen als von einander abhängige Teilbereiche gleichermaßen zu betrachten und ein ganzheitliches Konzept zu entwickeln. Darüber hinaus ist die Betrachtung von Langzeitaspekten bei der Verwaltung individueller Wissensmodelle auf Basis von Ontologien ein bis heute noch recht wenig oder nur unspezifisch untersuchter Problembereich.

Medienanalyse

Für die Akquisition von Informationen über Medienobjekte werden diese zunächst als solche verarbeitet und analysiert. Wertvolle Informationen liefern dabei Dateisysteminformationen, sowie typspezifische Header-Einträge (EXIF, IPTC, XMP, etc.). Abhängig vom Medientyp lassen sich Strukturinformationen extrahieren (global, bezogen auf das gesamte Objekt, bzw. lokal, nach Segmentierung oder Dekomposition in einzelne Segmente oder Abschnitte), die zur Klassifikation nach bekannten Mustern (Prototypen) herangezogen werden können. Gleichzeitig können strukturelle Informationen, wie z.B. Farbverteilungen, auch bei der Visualisierung von Mediensammlungen zur Organisation und Navigation verwendet werden, und somit "lose" Ordnungen ergeben.

Semantische Modellierung

Um die inhalts- und kontextbeschreibenden Informationen einer Mediensammlung geeignet, und zudem semantisch abzulegen, wird ein entsprechendes Ontologiemodell entwickelt, welches als Datenmodell die Interpretationsgrundlage darstellt. Mit Hilfe von RDF [1] und OWL [2] wird das Modell in einer maschinenverarbeitbaren und über Anwendungsgrenzen hinweg austauschbaren Form spezifiziert. Somit sind gleichzeitig auch Möglichkeiten des Austausches von Beschreibungen im Sinne kooperativer Web-Anwendungen und Informationssysteme (Semantic Wikis, etc.) gegeben.

Individuelle Nutzung und Erweiterung

Gerade in Hinblick auf die Semantik von Medien und Mediensammlungen spielen individuelle Sichten und Kontexte eine große Rolle. Vor diesem Hintergrund stellt sich zunächst die Frage, wie Nutzer mit Medienkollektionen umgehen, welchen Ordnungsstrategien sie bei der Verwaltung folgen und wie ihr individuelles Wissen erschlossen werden kann. Mit Hilfe von Nutzerbefragungen und Evaluationen soll geklärt werden, welche Zugänge zu individuellem Wissen sich anbieten und welche Problemstellungen und Hürden der Verwaltung und Suche insbesondere mit dem gewählten ontologie-basierten Ansatz besser bewältigt werden können. Zusätzlich ist zu betrachten, an welchen Stellen und bis zu welchem Grad dem Nutzer Freiheiten und intelligente Unterstützung zur Verfügung gestellt werden sollen/müssen. In Bezug auf die semantische Modellierung und das verwendete Ontologiemodell wird Nutzen und Praktikabilität persönlicher Wissensmodelle und Ontologieerweiterungen betrachtet.

Langzeitaspekte

Personenbezogene Mediensammlungen und damit verbundenes Wissen existieren mitunter über Jahre hinweg und unterliegen dabei einem gewissen Wandel. So wie sich Sichten und Einstellungen verändern, kommen Informationen hinzu, werden verfeinert, geändert oder entfernt. Im Zusammenhang mit ontologie-basierter Verwaltung von Wissen müssen zum einen Konsistenz und Nutzbarkeit über diese Zeiträume gewahrt bleiben, zum anderen aber auch Transparenz für den Nutzer bzgl. Veränderungen und Entwicklungen gegeben sein.

Resource Description Framework (RDF), http://www.w3.org/TR/rdf-primer/
OWL Web Ontology Language, http://www.w3.org/TR/owl-features/