Sonntag, 9. September 2012

Semantic Web

Die Internetzukunft beginnt jetzt


Das Semantic Web, oftmals auch als Web 3.0 bezeichnet, ist Vision und Konzept  zugleich für die nächste Generation des Internets. Die Semantik bzw. Bedeutungslehre ist eine Wissenschaft, die sich mit dem Sinn  und der Bedeutung von Zeichen und Sprache befasst. Auch das Internet soll intelligenter werden, indem es in die Lage versetzt wird, kognitive Entscheidungsfähigkeiten des Menschen zu simulieren. Die grundlegende Idee des Semantic Webs besteht darin, Internetinhalte  mit semantischen Metadaten und Ontologien anzureichern, um neben Menschen auch Computer in die Lage zu versetzen, die Bedeutung von Daten zu verstehen und Beziehungen zwischen Daten zu ermitteln. Diese technischen Voraussetzungen würden die Internetlandschaft revolutionieren.

Ursprung

Die Idee des semantischen Internets ist nicht neu und stammt vom Erfinder des World Wide Web, Tim Berners-Lee. Lee hat im CERN-Institut in Genf bereits die Grundlagen für das WWW gelegt und veröffentlichte im Jahr 2001 im Scientific American einen Artikel über ein intelligenteres Internet. [1]

"I have a dream for the Web (in which computers) become capable of analyzing all the data on the Web - the content, links, and transactions between people and computers. A "Semantic Web", which should make this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines." (Tim Berners-Lee)

Technische Grundlagen des semantischen Internets

Der aktuelle Webstandard, HTML4, kann nicht selbständig Beziehungen zwischen Daten ermitteln und diese verknüpfen. Mit dem herkömmlichen Standard können lediglich Informationen präsentiert und Aussagen über Dokument-Ebenen getroffen werden. Das neue HTML5 wird bereits Daten, wie z.B. Texte, Grafiken oder Links, semantisch strukturieren und auszeichnen können. Dazu bedarf es jedoch semantische Informationen, die in einer neuen Ebene über die vorhandenen Informationen gespeichert werden: Metadaten und Ontologien.


Metadaten - Metadaten sind Daten, welche vorhandene Daten näher erläutern. Es handelt sich hierbei um Informationen, die vom Menschen konstruiert sind und nicht real existieren (z.B. Längen- und Breitengrade zur Einteilung der Erdkugel). Metadaten dienen dazu, die Wirklichkeit einzuteilen um Komplexitäten zu erfassen. Für das semantische Internet bilden Metadaten die Grundlage, digitale Informationen mit Schlagwörtern zu versehen, um diese dann für Prozesse und Programme lesbar zu machen. [2]

Ontologien - Eine weitere Voraussetzung für die Maschinenverarbeitung sind Ontologien. Dies sind explizite Spezifikationen für ein gemeinsames Verständnis eines Anwendungsbereiches. Ontologien umfassen Objekte und die Beziehungen zwischen den Objekten. Sie sind neben den Metadaten ein weiterer Hauptbestandteil des semantischen Internets und enthalten Logikausprägungen: [2]
Beispiel einer Ontologie anhand eines Vereins [3]
Mit diesen Informationen kann nicht nur der Nutzer, sondern auch der Computer ein Verständnis für Informationen entwickeln, sowie Daten interpretieren und weiterverarbeiten. Die künstliche Computerintelligenz kann mithilfe des semantischen Internets bisher ungeahnte Ausmaße annehmen.

Zur Anwendung des semantischen Internets

Unser heutiges Internet ist ein weltweites Netzwerk aus verlinkten Dokumenten (Videos, Grafiken, Internetseiten etc.) und wurde konstruiert, um für den Menschen dargestellt zu werden. Computer können diese einzelnen Informationen nicht sinnvoll miteinander verknüpfen und einen Zusammenhang erschließen.

Ein Internet, das die in der Lage ist, Information zu lesen, zu verstehen, und sinnvoll zu verknüpfen, würde unser Leben maßgeblich beeinflussen und die Arbeit mit dem Internet um ein vielfaches effizienter gestalten. Die Komplexität des Alltags könnte vom Computer erfasst und vereinfacht werden. 

Beispiele:

  • Kalender können vollautomatisch koordiniert werden in Bezug auf unseren Aufenthaltsort, Fortbewegungsmittel oder bevorzugte Unterkunftsart, um wertvolle Zeit für die Terminplanung einzusparen (Vgl. Intention Economy Scenario). 
  • Bei der Reiseplanung können Wetterdaten und Staumeldungen in Bezug zu Informationen über Reisestationen und Vorlieben des Reisenden gesetzt werden
  • Insbesondere die Wirtschaft wird profitieren, indem komplexe Arbeitsprozesse und das Informationsmanagement automatisiert werden.
  • Suchmaschinen können unterschiedliche Texte inhaltlich werten und einander zuordnen.

Die folgende Anwendung erzeugt einen kleinen Eindruck vom Potenzial semantischer Informationen, welches bisher jedoch kaum ausgeschöpft wird. Die App TripIt synchronisiert automatisch Reisedaten von verschiedenen Anbietern (z.B. Flug-, Hotel- oder Kalender-Informationen) und stellt den Reiseplan übersichtlich auf dem iPhone bzw. iPad dar. Im Ergebnis entsteht ein Reiseplan, welcher verschiedenste Informationen bündelt und dem Nutzer das umständliche Suchen seiner Reisedaten aus unterschiedlichen E-Mails erspart.

TripIt-Screenshot am iPhone [4]

Umsetzung

Das Internet besteht bisher zu einem oder zwei Prozent aus semantischen Beschreibungen. Das Semantic Web steht somit noch am Anfang seiner Entwicklung. Neu zu erstellende Webseiten könnten zeitnah mit semantischen Informationen versehen werden. Ältere Internetdokumente, welche bisher noch nicht über semantische Beschreibungen verfügen, sollen entweder automatisch mithilfe spezieller Software, oder manuell durch Nutzerpartizipation vervollständigt werden. [3]  Momentan ist ein vollständig semantisches Web jedoch nicht absehbar. Die Entwicklung von Werkzeugen und Technologien schreitet voran, um das Internet in eine noch stärkere Informationsquelle zu verwandeln. Hierfür arbeiten Wirtschaft, Wissenschaft und Politik zusammen, um das Mammutprojekt "Semantic Web" zu realisieren. Die Frage, wann dieses Projekt abgeschlossen sein wird, kann nicht beantwortet werden. Vielmehr wird eine schrittweise Entwicklung des Web 2.0 zu einem fortschrittlicherem Internet, mit einer zunehmenden Anzahl semantischer Technologien, stattfinden.


Referenzen                         
[1] Berners-Lee, Tim ; Fischetti, Mark: Weaving the Web : The Original Design and Ultimate Destiny of the World Wide Web by Its Inventor. Reprint. Cambridge: Paw Prints, 2008.
[2] Uherek, Henric C.: Vom Web 2.0 zum Semantic-Web : Einsatzmöglichkeiten des semantischen Webs im Wissensmanagement. 1. Aufl.. Hamburg: Diplomica Verlag, 2009.
[3] Eigene Darstellung, in Anlehnung an http://w5.cs.uni-sb.de/~baus/ueb/Musterloesung1.html, Abgerufen am 08.09.12
[4] TripIt-Screenshot vom Apple-App-Store: http://itunes.apple.com/app/tripit-travel-organizer-free/id311035142?mt=8, Abgerufen am 08.09.2012

Kommentare: