Zufallskarte

Kontinent: ...
Image Detail
Valid XHTML 1.0 Strict CSS ist valide!

Zukunftsmusik : Semantik in der Wikipedia = maschinenlesbares Wissen für die Welt

Zukunftsmusik : Semantik in der Wikipedia = maschinenlesbares Wissen für die Welt (Wordle) (Teil 1)
Wikipedia ist nicht mehr irgendeine Enzyklopädie. Viele Jugendliche halten sie für DIE Enzyklopädie. Wurden Nachschlagewerke früher in Bücherform herausgegeben, so empfinden viele heute die Buchform als veraltet. Ja selbst CD-ROMs sind alles andere als aktuell. Denn kaum editiert, lektoriert, verlegt und herausgegeben, so haben sich viele darin enthaltene Informationen bereits überholt. Die Lösung, für die Wikipedia steht, heißt Online-Wissensspeicher.

Doch so modern Wikipedia auf den ersten Blick daherkommt, auch sie hinkt technisch bereits der Höhe der Zeit hinterher. Wenn sie ihr komplettes Potenzial entfalten möchte, müssen auch Computer das Online-Lexikon verstehen können. Und damit wären wir mittendrin in der Semantik-Debatte und den Verheißungen des Web 3.0, das auch Semantisches Web genannt wird.

Mathias Schindler ist Projekt-Manager bei Wikimedia Deutschland – dem Verein, der für die Deutsche Wikipedia administrative Aufgaben übernimmt. Er sieht, dass die Plattform noch an viele Kompromisse der Print-Zeit gebunden wäre. Beispielsweise sei die Unterteilung des Weltwissens in einzelne Artikel ein Andenken an die Zeit, als gedruckte Enzyklopädien lineare, statische Speichermedien waren. Als Visionär sieht Schindler die Zukunft der Wikipedia etwas anders. Er möchte, dass sie das Wissen nicht über den Umweg des Textes bereithält sondern die Fakten im Zusammenhang direkt erfasst und als Wissensspeicher darstellt.

Viele Wege führen nach Rom und damit auch zum maschinenlesbaren Wissensspeicher

Dies ist möglich, wird aber nicht leicht, wenn man sich die aktuelle Situation der Wikipedia vor Augen hält. An ihr sind die technischen Entwicklungen in den vergangenen Jahren zum Teil komplett vorbeigegangen. Andere Angebote machen die Einbindung von Fotos, Videos, Links, Musikdateien oder anderen Medien mit wenigen Mausklicks möglich. Bei Wikipedia wird noch viel auf „echte Handarbeit“ gesetzt. So muss nicht nur jeder Artikel zunächst geschrieben sondern auch an die Wikipedia-Konventionen angepasst werden. Dazu bedarf es einer Vielzahl von Autoren mit Erfahrung. Und dennoch lassen sich Inkonsistenzen nicht vermeiden.
Der Community gelingt es relativ gut, aktuelle Fakten und Ereignisse wie Todesfälle, Skandale oder Naturkatastrophen einzupflegen. Bei nicht ganz so prominenten Themen kommt die Wikipedia-Gemeinschaft einfach nicht hinterher. Beispiel gefällig?

Es gibt einen englischen Artikel über den ehemaligen Präsidenten des Bundesverfassungsgerichts Hans-Jürgen Papier. Auch seine Kollegin Lerke Osterloh wird dort als Verfassungsrichterin erwähnt. Allerdings ist diese mittlerweile ebenso aus dem Amt geschieden. Dieser Umstand wird derzeit noch nicht im Online-Lexikon abgebildet. Außerdem wird Osterloh in den anderen 250 Sprachversionen erst gar nicht erwähnt.

Zukunft der Suchmaschinen: Semantik & Verstehen der Nutzeranfragen, um die relevanteste Antwort zu finden

Die Lösung für die Probleme der Wikipedia liegt bereits in der Schublade der Wissenschaft. Sie heißt Semantik. Viele Suchmaschinenbetreiber bemühen sich bereits seit Jahren, Texte semantisch zu analysieren und Zusammenhänge zu erkennen, um so direkt die Fragen ihrer Nutzer beantworten zu können. Die Aufgabe für die Suchmaschinen wäre damit neu definiert: Sie sollen nicht länger mehr nur nach Suchwörtern – quasi im Trüben – fischen sondern sie sollen die Anfragen verstehen und dann die relevanteste Antwort präsentieren. Klasse statt Masse.

Schon früher versuchten sich Suchmaschinen-Startups an der Wikipedia. So probierte 2008 Powerset einen neuen Ansatz zur automatischen Auswertung der Texte aus.  Dazu sollten die Algorithmen die Inhalte in ihrem Kontext analysieren und Beziehungen zwischen einzelnen Faktensplittern - sogenannten Factz – herstellen.  Es gelang den Algorithmen mit ihrer „Intelligenz“ nicht, den Fleiß der Wikipedia-Autoren zu kompensieren. Letztlich gab es das, was Powerset aus den Artikeln extrahieren konnte, bereits in Listen von Wikipedia-Nutzern. Doch bevor Powerset weitere Ideen und Ansätze entwickeln konnte, wurde das Unternehmen von Microsoft aufgekauft.

 

Weiter mit Teil 2: Semantic Media Wiki

 


Quellen:

Aktualisiert ( Dienstag, 14. Februar 2012 um 08:15 Uhr )
 

© H[AGE]: Langenwetzendorf (2008 - 2011)