Professor an der Fernuniversität entwickelt sprachbasiertes System : Hagener Suchmaschine intelligenter als Google

Professor Dr. Hermann Helbig von der FernUni Hagen meint die Internetsuchmaschine der Zukunft erfunden zu haben.
Während auf dem internationalen Parkett viele Millionen Euro investiert werden, um Google die Stirn bieten zu können, hat die FernUniversität in Hagen eine Suchmaschine entwickelt, die intelligenter als herkömmliche Internet-Suchmaschinen ist: SEMPRIA kann nicht bloß nach Stichworten suchen, sondern ganze Texte und Fragesätze verstehen und gezielt beantworten.
Welche Vorteile das hat, kann jeder schnell testen: Wer versucht, über Google den Todestag Emil Schumachers herauszufinden, erhält nach Eingabe dieser Stichworte eine Auflistung tausender Internetseiten, auf denen er nach einer Antwort suchen muss.
„Aber die Nutzer wollen nicht Seiten lesen, sondern Fragen beantwortet haben”, sagt Professor Dr. Hermann Helbig vom Lehrstuhl für Intelligente Informations- und Kommunikationssysteme (IICS). Daher müssten die Suchmaschinen der Zukunft natürliche Sprache verstehen können.
Nun zeichnet die sich aber aus durch ihre Mehrdeutig-keit, durch die Vagheit und Bedeutungsvielfalt ihrer Ausdrücke und ihre Wan-delbarkeit. Experten für künstliche Intelligenz versuchen seit Jahrzehnten, dem Computer all das beizubringen. Der Ansatz, den Professor Helbig verfolgt, nennt sich „semantisches Netz”.
Dabei ist seiner Arbeits-gruppe ein wesentlicher Fortschritt auf dem Gebiet gelungen: „Wir haben eines der größten semantik-basierten Lexika weltweit erstellt”.
Die Semantik untersucht die Bedeutung sprachlicher Ausdrücke. Eine semantik-basierte Suche kann innerhalb von Zieldokumenten nicht bloß auf Begriffe verweisen, also nach Stichworten suchen, sondern darüber hinaus auch Relationen zwischen Begriffen erfassen.
So können automatische Suchverfahren, die mit se-mantischen Netzen arbeiten, besser erkennen, was der Nutzer wissen will. Diese Netze wirken wie ein Filter in der Datenflut des Internets. Allerdings ist es noch ein langer Weg, das gesamte Web mit seinen Terabytes in semantische Netze zu übersetzen.
Auf der CeBit stellt die Gruppe um Professor Helbig gerade einen Prototyp der Suchmaschine vom IICS vor. Denkbar ist, dass sie sie in naher Zukunft online stellen werden.
Noch sei es zu früh, um zu sagen, ob SEMPRIA eine kommerzielle Richtung einschlagen wird. Besonders bieten sich solche Systeme für Unternehmen an, die große Text-Datenbestände archiviert haben, aber nichts mehr darin wiederfinden.
Noch nutzerfreundlicher würde die Hagener Suchmaschine, sobald sie auch natürliche gesprochene Sprache verstehen kann, so Professor Helbig. Die akustische Erkennung werde sich in Zukunft durchsetzen, zumal mobile Endgeräte wie das Handy danach verlangen.
Wenn aber die semantische Suche die effizientere Lösung ist, wieso bietet Google sie trotz seines Riesenbudgets nicht an? „Google scheint diese Entwicklungsrichtung verschlafen zu haben”, sagt der Experte. „Die denken wahrscheinlich, wir haben's nicht nötig; wir verdienen so viel Geld mit unserer Indexierung und der Beherrschung der Web-Dynamik. Wenn jemand zu gut wird im semantischen Web, dann schlucken wir ihn einfach”.
Fragen werden in Fragesätze statt in Stichworte gefasst. Zum Beispiel: „Wann war der Todestag von Emil Schumacher?” SEMPRIA liefert eine präzise Antwort statt Listen von Internetseiten. Bedeutungsanalyse statt Stichwortver-gleich: Die Anfragen und alle Sätze der Zieldokumente werden auf den wichtigsten sprachlichen Ebenen analysiert. Logische Auswahl statt Häufigkeitssortierung: Antwortkandidaten werden mit Mitteln der Logik überprüft; Suchmaschinen ermitteln die Relevanz eines Kandidaten-Dokuments allein auf der Grundlage von Worthäufigkeiten, Verweis-Strukturen etc.
Bisher sind die semanti-schen Verfahren nicht genügend ausgereift, um kommerziell erfolgreich zu sein. Professor Helbig selbst googelt auch. Aber er ist sich ganz sicher, dass semantik-basierte Suchmaschinen den Marktführer letztlich aushebeln werden.














