Forscher der TU Dortmund "sortiert" Trefferliste auf Google

Gerald Nill
WR-Serie "Forscher der Woche": Prof. Christian Sohler, Informatiker an der TU Dortmund
WR-Serie "Forscher der Woche": Prof. Christian Sohler, Informatiker an der TU Dortmund
Bei der Frage, wie groß denn die Datenflut im Internet eigentlich ist, muss selbst der Experte passen, der gerade 1,5 Millionen Euro Forschungsgelder für die Strukturanalyse sehr großer Netzwerke zugesprochen bekam.

Dortmund. Wenn die Schlagwortsuche im Internet noch effizienter wird, dann haben vielleicht Prof. Dr. Christian Sohler und seine Doktoranden ihre Finger im Spiel. Der Informatiker der TU Dortmund befasst sich mit der Beherrschbarkeit unglaublich großer Datenmengen.

Bei der Frage, wie groß denn die Datenflut im Internet eigentlich ist, muss selbst der Experte passen, der gerade 1,5 Millionen Euro Forschungsgelder für die Strukturanalyse sehr großer Netzwerke zugesprochen bekam. Wie findet sich die Suchmaschine im Dschungel der Peta-Bytes zurecht? Schließlich will der Nutzer seine Treffer-Anzeige bei Google nicht nach Stunden, sondern nach Sekunden.

„Das funktioniert über spezielle Algorithmen“, erklärt der Forscher, also über Rechenverfahren, die Computer erst nutzbar machen. „Die Aufbereitung und Verarbeitung der Datenmengen ist das große Problem“, so Sohler. „Die Datenmengen im Netz wachsen nämlich schneller als die Kapazitäten der Rechner.“

Gefundene Datensätze kombinieren — in Sekundenbruchteilen

Der Informatiker nennt ein Beispiel: „Versucht man beispielsweise alle weltweit vorhandenen Daten zu einer medizinischen Fragestellung zu kombinieren und dann zu analysieren, so sind die aktuellen Verfahren viel zu langsam. Damit wären alle gängigen Rechner überfordert.“ Es gehe also darum, die gefundenen Datensätze zu kombinieren.

Vieles sei Grundlagenforschung. Gleichzeitig macht Sohler seinen Doktoranden Mut, dass das Internet unglaublich viele Nischen biete, gerade auch im Hinblick auf Existenzgründungen. Einer hat sich jüngst selbstständig gemacht mit intelligenten Übersetzungen, die vor allem die Bedeutung des gesuchten Wortes in einer fremden Sprache im Blick haben und fatale Fehlübersetzungen vermeiden.

Auch bei den klassischen Suchmaschinen werden Weiterentwicklungen folgen, ist der Forscher überzeugt. Was nutzen 355 Millionen Treffer beim Wort „Jaguar“, wenn der Begriff doppel- oder mehrdeutig ist? So kann sich Sohler vorstellen, dass die bessere Suchmaschine bald fragen wird: „Welchen Jaguar meinen Sie?“ Dazu müssten die Internet-Seiten nach ihrer Bedeutung sortiert werden. Eine Mammut-Aufgabe. „Wir müssen schnellere, effizientere Algorithmen erforschen“, meint der Informatiker.

Die Zusage von 1,5 Millionen Euro aus dem europäischen ERC-Programm ist eine schöne Anerkennung des Wissenschaftlers, der auch in dem Sonderforschungsbereich der TU forscht.

Gesellschaft besser verstehen durch Facebook

In diesem Projekt will er herausfinden, wie soziale Netzwerke noch besser nutzbar gemacht werden können. Er formuliert es so: „Die Gesellschaft besser verstehen über soziale Netzwerke wie Facebook“. Den Sozialwissenschaftler interessierte die Frage, welche Aussage über das globale Netzwerk getroffen werden kann, wenn man sich nur einen kleinen Teil anschaut. Wie in der Statistik müssen hierfür die richtigen Indikatoren herausgefiltert werden.

Sohler: „Unsere Methodik ist dabei, die globale Struktur über kleine lokale Stichproben zu erkunden.“ Für ihn ist die Auswertung aber nur ein „schwieriges mathematisches Problem“.