
Das semantische Web, erklärt
- VersionDude
- Standards
- 6 Min. Lesezeit
Die Idee eines Webs aus Daten – in dem Bedeutung maschinenlesbar ist – und die Standards wie RDF, OWL und die Reasoning-Engines, die es zum Laufen bringen.
Das semantische Web ist eine Erweiterung des Webs, in der Information eine wohldefinierte Bedeutung zugewiesen wird, sodass Maschinen – und nicht nur Menschen – sie verarbeiten können. Im gewöhnlichen Web ist eine Seite Text, der für menschliche Augen formatiert ist; Software kann ihn anzeigen, versteht aber nicht wirklich, was er sagt. Der Anspruch des semantischen Webs ist, diese Bedeutung explizit zu machen und das Web von einer Sammlung von Dokumenten in etwas zu verwandeln, das einer weltweiten Datenbank näherkommt.
Die leitende Vision ist ein Web aus Daten statt eines Webs aus Seiten. Statt dass die Bedeutung in Prosa gefangen ist, die nur ein Mensch deuten kann, werden die Beziehungen zwischen Dingen – dass ein bestimmter Autor ein bestimmtes Buch geschrieben hat, in einem bestimmten Jahr veröffentlicht – explizit in einer Form ausgedrückt, die Maschinen lesen und abfragen können. Wo das Web der Dokumente Seiten mit Seiten verbindet, verbindet das Web der Daten Fakten mit Fakten.
Der Standard-Stack: RDF, OWL, SPARQL

Diese Vision ruht auf einem Stapel von Standards, die größtenteils über das W3C entwickelt wurden, wobei jede Schicht auf der darunter aufbaut. An der Basis drückt RDF, das Resource Description Framework, Fakten als einfache Subjekt-Prädikat-Objekt-Tripel aus, etwa „dieses Buch hat diese Person als Autor“. Diese Tripel sind bewusst atomar, damit komplexes Wissen aus vielen kleinen, kombinierbaren Aussagen zusammengesetzt werden kann.
Weil jeder Fakt ein einheitliches Tripel ist, können Daten aus verschiedenen Quellen einfach durch Kombinieren ihrer Aussagen zu einem einzigen großen Graphen zusammengeführt werden. Es ist nicht nötig, unvereinbare Tabellenlayouts abzugleichen, wie man es bei traditionellen Datenbanken täte; die Tripel eines Datensatzes stehen ganz natürlich neben den Tripeln eines anderen. Diese Kombinierbarkeit ist ein Kernbestandteil der Stärke des Modells und des Grundes, warum es zu einem dezentralen Web passt.
Über RDF stehen die Ontologien, die den rohen Tripeln ein gemeinsames Vokabular und eine Struktur geben. In OWL, dem Web Ontology Language, geschriebene Ontologien beschreiben die Klassen von Dingen in einer Domäne und die Beziehungen zwischen ihnen – sie definieren etwa, was es bedeutet, ein Autor zu sein, oder dass jedes Buch genau einen Titel hat. Eine Ontologie ist im Wesentlichen ein vereinbartes Bedeutungsschema, das unabhängig erstellten Daten erlaubt zu interoperieren.
Um die Information wieder herauszuholen, dient SPARQL als Abfragesprache für diese Graphen. So wie SQL Zeilen in einer relationalen Datenbank abfragt, fragt SPARQL Tripelmuster über einen Graphen ab und erlaubt Ihnen, Fragen zu stellen wie „finde alle Bücher, deren Autor in einer bestimmten Stadt geboren wurde“. Zusammen bilden RDF für die Fakten, OWL für das Vokabular und SPARQL für die Abfrage den praktischen Werkzeugkasten des semantischen Webs.
Reasoner, die neue Fakten folgern
Reasoner sind die Engines, die dies von strukturierter Speicherung in etwas wahrhaft Intelligentes verwandeln. Ein Reasoner nimmt eine OWL-Ontologie mit einer Menge von Fakten und folgert neue Fakten, die logisch aus dem Gesagten folgen, statt nur zurückzugeben, was explizit geschrieben wurde. Es ist der Schritt, der dem System erlaubt, Fragen zu beantworten, die die Rohdaten nie direkt formuliert haben.
Pellet ist ein bekanntes Beispiel für einen solchen Reasoner. Gegeben eine OWL-Ontologie, kann er die Konsistenz der Ontologie prüfen – Widersprüche in den Definitionen melden – und abgeleitete Fakten herleiten, etwa schließen, dass ein Ding aufgrund der Regeln, die es erfüllt, zu einer bestimmten Klasse gehören muss. Der Reasoner verrichtet im Wesentlichen logische Arbeit in Ihrem Namen und bringt Schlussfolgerungen hervor, die in den Daten und ihren Regeln implizit angelegt sind.
Warum die große Vision ins Stocken geriet
Es lohnt sich, ehrlich darüber zu sein, dass die volle Vision des semantischen Webs das gewöhnliche Web nicht ersetzt hat und die Annahme der schwergewichtigeren Standards ungleichmäßig war. Reiche Ontologien zu bauen und zu pflegen ist anspruchsvoll, und viele Projekte fanden den Aufwand gegenüber einfacheren Ansätzen schwer zu rechtfertigen. Die große Idee eines vollständig maschinenverständlichen Webs bleibt eher ein Streben als eine alltägliche Realität, und das anzuerkennen gehört zu einem zutreffenden Verständnis des Felds.
Die Version, die still Erfolg hatte
Trotzdem begegnen Ihnen die Nachfahren des semantischen Webs jeden Tag. Strukturierte Daten und schema.org-Markup, die die Rich Results, Knowledge-Panels und Vorschauen speisen, die Sie in Suchmaschinen sehen, sind eine pragmatische Scheibe eben dieser Idee – die Bedeutung einer Seite maschinenlesbar zu machen. Die leichte, inkrementelle Fassung der Vision hat still Erfolg gehabt, gerade dort, wo die maximale Fassung scheiterte, und das ist die Form, mit der die meisten Entwickler arbeiten werden.



Es lohnt sich, ehrlich darüber zu sein, dass die volle Vision des semantischen Webs das gewöhnliche Web nicht ersetzt hat und die Annahme der schwergewichtigeren Standards ungleichmäßig war. Reiche Ontologien zu bauen und zu pflegen ist anspruchsvoll, und viele Projekte fanden den Aufwand gegenüber einfacheren Ansätzen schwer zu rechtfertigen. Die große Idee eines vollständig maschinenverständlichen Webs bleibt eher ein Streben als eine alltägliche Realität, und das anzuerkennen gehört zu einem zutreffenden Verständnis des Felds.