Schweizerischer Nationalfonds / Fonds national suisse
SNF: Bild des Monats Januar 2009: Informationstechnologie
Bern (ots)
- Hinweis: Bildmaterial steht zum kostenlosen Download bereit unter: http://www.presseportal.ch/de/pm/100002863 -
Innovative Lösung zur Konferenzarchivierung
Forschende des Idiap haben im Rahmen des Nationalen Forschungsschwerpunkts IM2 eine innovative Lösung zur Archivierung von Konferenzen entwickelt. Durch die Kombination verschiedener Technologien ist ein bedienungsfreundliches, zuverlässiges System entstanden. Die Forschenden haben ein Unternehmen namens «Klewel» gegründet, um ihr Produkt erfolgreich zu vermarkten. Bereits nutzen renommierte Kunden die Leistungen der neuen Software.
Konferenzen und Sitzungen bieten Unternehmen und Organisationen eine reichhaltige Informationsquelle. Wie kann das Wissen aber zum Beispiel Mitarbeitenden im Ausland zur Verfügung gestellt werden? Wie lässt es sich archivieren? Und vor allem: Wie findet man die gesuchten Informationen ohne grossen Aufwand?
Im Rahmen des Nationalen Forschungsschwerpunkts IM2 haben sich Mitarbeitende des Forschungsinstituts Idiap in Martigny mit diesen Fragen beschäftigt. Durch die Zusammenführung verschiedener Technologien aus unterschiedlichen Forschungsprojekten ist es Alessandro Vinciarelli und seinen Kollegen gelungen, eine innovative, zuverlässige und bedienungsfreundliche Lösung zur Inhaltssuche von archivierten Konferenzen zu finden. Für die Qualität dieses Produkts spricht, dass zur Kundschaft bereits ACM, der wichtigste Organisator von Fachkonferenzen, oder Nestlé und Unicef gehören. Die neue Software ist ein weiteres Beispiel für wie der lange Weg und die vielen Hürden zwischen der Grundlagenforschung bis zur Anwendung erfolgreich bewältigt werden kann.
Bilder lesen Das Konzept ist einfach: Bei einer Präsentation filmt eine Kamera den Redner, während ein Mikrofon das Gesprochene auf einem normalen Computer erfasst. Gleichzeitig zeichnet derselbe Computer auch die zum Vortrag gezeigten Diabilder auf. Diese drei Informationsquellen werden anschliessend synchronisiert. Nachdem die Präsentation archiviert wurde, lassen sich die Dias mit einer Suchmaschinen-Software durchsuchen - nach Schlüsselwörtern wie bei Google. Die Software «liest» daraufhin die Dias und schlägt jene vor, in denen das Schlüsselwort auftaucht. Der Anwender kann dann den Videoausschnitt der Konferenz anschauen und anhören, der zum gewählten Dia gehört.
Das Besondere der am Idiap entwickelten Software besteht darin, dass sie Dias lesen kann, die ja eigentlich einfach als Bilder - Zusammenstellungen unabhängiger Bildpunkte - aufgenommen wurden. Die Software hat nämlich gelernt, Textpassagen zu erkennen: Sie findet im Bild Wörter und liest diese. Damit erschliesst sie alle Arten von Text in einem Dia, etwa Bildlegenden oder Beschriftungen von Grafiken. Die Informationssuche ist besonders effizient, weil sie im gesamten Inhalt erfolgt und nicht nur in einer Liste von Schlüsselwörtern, die vom Redner zu diesem Inhalt erstellt wurde.
Bestehende Technologien kombinieren Die Konferenzarchivierung hat am Idiap Tradition. Bereits früher hat das Institut einen intelligenten Sitzungsraum entwickelt (Smart Meeting Room). Dieser bietet zwar sehr viel, ein Nachteil ist jedoch die dafür benötigte umfangreiche und komplexe Ausrüstung, die zudem ortsgebunden ist.
Anfang 2004 wollte Alessandro Vinciarelli deshalb den Smart Meeting Room vereinfachen. Dazu verband er dessen Schlüsselelemente mit den Arbeiten seines Kollegen Jean-Marc Odobez. Dieser arbeitete an der Analyse und der Extraktion von Informationen aus Videosequenzen -dem Computer also beizubringen, wie dieser ein Gesicht, eine Landschaft oder auch Text in Bildern erkennen soll.
Präsentationsgerüst auf Diapositiven Das Hauptanliegen der beiden Forscher bestand darin, ein anwenderfreundliches, zuverlässiges, Platz sparendes und für den Redner unauffälliges System bereitzustellen. Als sie Inhalt und Ablauf von Präsentationen analysierten, stellten sie fest, dass die Dias häufig eine Art Gerüst bilden, in denen die Informationen zusammenfassend und komprimiert erscheinen - zum Beispiel in Form von Schlüsselwörtern. Zwar befinden sich ein Grossteil der Botschaft und die inhaltlichen Feinheiten in den Worten und Gesten des Redners, zur Indexierung der Präsentationen reichen die Dias jedoch aus.
Bei der Entwicklung spielte eine einfache, praktische Benutzeroberfläche ebenfalls eine wichtige Rolle. Um diesen für die Vermarktung eines Produkts sehr wesentlichen Aspekt kümmerte sich der von diesem Projekt begeisterte Ingenieur Maël Guillemot. Seine bretonischen Wurzeln finden sich übrigens auch im Firmennamen wieder: «Klewel» ist ein Zusammenzug von zwei bretonischen Wörtern, die «audiovisuell» bedeuten.
Spracherkennung Die Forscher des Idiap wollen auch die Spracherkennung in ihr System integrieren. Diese Technologie ist zwar bereits etabliert, das Hauptproblem besteht jedoch darin, sie im Konferenzumfeld anzuwenden, in dem es zu häufigen Rednerwechseln kommt (während für die Anwendung von Spracherkennungsprogrammen in der Regel für jeden Redner eine Trainingssequenz notwendig ist) und zuweilen beträchtlicher Hintergrundlärm vorhanden ist - was sich stark auf die Qualität der Aufzeichnungen auswirken kann. Derzeit werden deshalb die Tests in einem Vorlesungssaal durchgeführt, wo sich die Rahmenbedingungen wesentlich einfacher kontrollieren lassen.
Demonstration der Software, die von den Forschenden entwickelt wurde: http://www.klewel.ch/demo_en.php
Texte und Bilder dieses Berichts können auf der Website des Schweizerischen Nationalfonds heruntergeladen werden unter: www.snf.ch > Medien > Bild des Monats
Kontakt:
Forschungsinstitut Idiap
Centre du Parc, Rue Marconi 19
CP592 - CH1920 Martigny
Dr. Alessandro Vinciarelli
Tel.: +41-27-7217724
Fax: +41-27-7217712
E-Mail: vincia@idiap.ch
Maël Guillemot
Tel.: +41 (0) 27 721 77 64
E-Mail: mael.guillemot@idiap.ch
Fax: +41 (0) 27 721 77 12