
Il web semantico, spiegato
- VersionDude
- Standard
- 6 min di lettura
L'idea di un web di dati — dove il significato è leggibile dalle macchine — e gli standard come RDF, OWL e i motori di ragionamento che lo fanno funzionare.
Il web semantico è un'estensione del web in cui all'informazione viene attribuito un significato ben definito, così che le macchine — e non solo le persone — possano trattarla. Sul web ordinario, una pagina è testo formattato per gli occhi umani; il software può visualizzarla ma non comprende veramente ciò che dice. L'ambizione del web semantico è rendere questo significato esplicito, trasformando il web da una collezione di documenti in qualcosa di più vicino a una base di dati mondiale.
La visione guida è un web di dati anziché un web di pagine. Anziché che il significato sia prigioniero di una prosa che solo un umano può interpretare, le relazioni tra le cose — che un particolare autore ha scritto un particolare libro, pubblicato in un particolare anno — sono enunciate esplicitamente in una forma che le macchine possono leggere e interrogare. Là dove il web di documenti collega pagine a pagine, il web di dati collega fatti a fatti.
La pila di standard: RDF, OWL, SPARQL

Questa visione poggia su una pila di standard sviluppata in gran parte tramite il W3C, dove ogni strato si appoggia su quello sottostante. Alla base, RDF, il Resource Description Framework, esprime i fatti sotto forma di semplici triple soggetto-predicato-oggetto, come «questo libro ha per autore questa persona». Queste triple sono deliberatamente atomiche, affinché una conoscenza complessa possa essere assemblata a partire da molte piccole affermazioni combinabili.
Poiché ogni fatto è una tripla uniforme, i dati provenienti da fonti diverse possono essere fusi semplicemente combinando le loro affermazioni in un unico grande grafo. Non è necessario riconciliare disposizioni di tabelle incompatibili come si farebbe con le basi di dati tradizionali; le triple di un insieme di dati stanno naturalmente accanto alle triple di un altro. Questa componibilità è un elemento centrale della potenza del modello, e del motivo per cui si addice a un web decentralizzato.
Al di sopra di RDF ci sono le ontologie, che danno alle triple grezze un vocabolario e una struttura condivisi. Le ontologie scritte in OWL, il Web Ontology Language, descrivono le classi di cose in un dominio e le relazioni tra di esse — definendo, ad esempio, cosa significhi essere un autore, o che ogni libro ha esattamente un titolo. Un'ontologia è essenzialmente uno schema di significato concordato che permette a dati creati indipendentemente di interoperare.
Per estrarre l'informazione, SPARQL funge da linguaggio di interrogazione per questi grafi. Proprio come SQL interroga le righe in una base di dati relazionale, SPARQL interroga motivi di triple attraverso un grafo, permettendoti di porre domande come «trova tutti i libri il cui autore è nato in una data città». Insieme, RDF per i fatti, OWL per il vocabolario e SPARQL per l'interrogazione formano la cassetta degli attrezzi pratica del web semantico.
Ragionatori che inferiscono nuovi fatti
I ragionatori sono i motori che trasformano questo da archiviazione strutturata in qualcosa di veramente intelligente. Un ragionatore prende un'ontologia OWL con un insieme di fatti e inferisce nuovi fatti che discendono logicamente da ciò che è enunciato, anziché restituire solo ciò che è stato esplicitamente scritto. È il passo che permette al sistema di rispondere a domande che i dati grezzi non hanno mai enunciato direttamente.
Pellet è un esempio ben noto di un tale ragionatore. Data un'ontologia OWL, può verificare la coerenza dell'ontologia — segnalando le contraddizioni nelle definizioni — e derivare fatti dedotti, come concludere che una cosa deve appartenere a una particolare classe in virtù delle regole che soddisfa. Il ragionatore effettua in sostanza un lavoro logico per tuo conto, facendo emergere conclusioni implicite nei dati e nelle loro regole.
Perché la grande visione si è arenata
Vale la pena essere onesti sul fatto che la piena visione del web semantico non ha sostituito il web ordinario, e che l'adozione degli standard più pesanti è stata diseguale. Costruire e mantenere ontologie ricche è impegnativo, e molti progetti hanno trovato lo sforzo difficile da giustificare di fronte ad approcci più semplici. La grande idea di un web interamente comprensibile dalle macchine rimane più un'aspirazione che una realtà quotidiana, e riconoscerlo fa parte di una comprensione corretta del campo.
La versione che ha avuto successo in silenzio
Nonostante ciò, incroci i discendenti del web semantico ogni giorno. I dati strutturati e il markup schema.org, che alimentano i risultati arricchiti, i pannelli di conoscenza e le anteprime che vedi nei motori di ricerca, sono una fetta pragmatica di questa stessa idea — rendere il significato di una pagina leggibile dalle macchine. La versione leggera e incrementale della visione ha avuto successo in silenzio, proprio là dove la versione massima ha fallito, ed è la forma con cui la maggior parte degli sviluppatori lavorerà.



Vale la pena essere onesti sul fatto che la piena visione del web semantico non ha sostituito il web ordinario, e che l'adozione degli standard più pesanti è stata diseguale. Costruire e mantenere ontologie ricche è impegnativo, e molti progetti hanno trovato lo sforzo difficile da giustificare di fronte ad approcci più semplici. La grande idea di un web interamente comprensibile dalle macchine rimane più un'aspirazione che una realtà quotidiana, e riconoscerlo fa parte di una comprensione corretta del campo.