Das deutschsprachige Frage-Antwort-System InSicht

Einleitung

Unter einem Frage-Antwort-System versteht man ein System, das eine vom Benutzer gestellte Frage vor dem Hintergrund eines (festen oder dynamischen) Dokumentenbestands automatisch beantwortet. Das Besondere an einem natürlichsprachlichen (hier: deutschsprachigen) Frage-Antwort-System besteht darin, dass man die Frage auf Deutsch stellt und die Antwort auf Deutsch vom System formuliert wird. Damit gehen Frage-Antwort-Systeme weit über traditionalle Suchsysteme wie Suchmaschinen oder Information-Retrieval-Systeme hinaus.

InSicht

InSicht ist das am Lehrgebiet IICS der FernUniversität in Hagen entwickelte Frage-Antwort-System. Es verwendet computerlinguistische Verfahren und Ressourcen, die dem neusten Stand der Forschung entsprechen. An Verfahren wird unter anderem ein syntaktisch-semantischer Parser für das Deutsche eingesetzt. An Ressourcen kommen unter anderem ein großes, semantisch reiches Lexikon (HaGenLex), Namenslexika und große Text-Corpora zum Einsatz. Als Datenbestände, über denen Fragen beantwortet werden können, kommen sowohl Dokumentensammlungen in lokalen Datenbanken also auch Informationen im Web in Frage.

Ergebnisse

Das Frage-Antwort-System InSicht hat mit großem Erfolg bei CLEF (Cross-Language System Evaluation Campaign) teilgenommen (bei CLEF-2004 war es das beste deutschsprachige System). Es hat sich aber auch auf anderen Fragemengen bewährt. Man kann das System auch zum Retrieval von Dokumenten (ähnlich einer Suchmaschine oder einem IR-System) einsetzen. Dabei entfällt dann die Erzeugung einer deutschen Antwort; stattdessen wird eine Dokumenten-Passage angezeigt.

Mögliche Einsatzgebiete sind intelligente Suche bzw. Fragebeantwortung zu Dokumentensammlungen wie

  1. Zeitungsarchiv
  2. Zeitschriftenarchiv
  3. Web-Seiten von Firmen und Organisationen
  4. Interne Dokumentation von Firmen und Organisationen

Veröffentlichungen

Einige Publikationen mit Bezug zu InSicht finden Sie auf unserer Veröffentlichungsseite.

Kontakt

Wenn Sie mehr über das System wissen wollen oder eine unverbindliche Demonstration (gern auch auf Ihren Dokumenten) sehen wollen, nehmen Sie bitte mit Dr. Sven Hartrumpf Kontakt auf. Neuere Systeme finden Sie unter SEMPRIA.


Letze Änderung: 2006-02-04
Dr. Sven Hartrumpf, Intelligent Information and Communication Systems (IICS), FernUniversität in Hagen, © 2005-2006