OPEN DATA
Scelte e risultati sulla ricerca, relativi al Web 3.0 (web semantico) e LINKED OPEN DATA
Con il termine web semantico, termine coniato dal suo ideatore, Tim Berners-Lee, si intende la trasformazione del World Wide Web in un ambiente dove i documenti pubblicati (pagine HTML, file, immagini e così via) sono associati ad informazioni e dati (metadati) che ne specificano il contesto semantico in un formato adatto all’interrogazione e l’interpretazione (es. tramite motori di ricerca) e, più in generale, all’elaborazione automatica. Il web semantico si potrebbe quindi definire come il tentativo di associare un significato alle risorse disponibili su una rete di computer. Con l’interpretazione del contenuto dei documenti che il Web semantico impone, saranno possibili ricerche molto più evolute delle attuali.
Attualmente, Internet si presenta come un enorme contenitore di dati di vario genere, in cui le informazioni sono espresse senza fornire indicazioni sui loro significati, il che ne impedisce un’interpretazione automatica e rende imprescindibile l’apporto umano.
Il Web Semantico, mediante una serie di linguaggi, si prefigge di attribuire un significato alle informazioni, in modo da permettere la realizzazione di applicazioni automatiche, che possano interpretare i dati.
Un ruolo fondamentale, in tale contesto, è svolto dalle ontologie che permettono di rappresentare i significati dei dati di una determinata area di conoscenza, identificando le proprietà e le relazioni esistenti fra loro e, quindi, per mezzo di una teoria comune e condivisa sui domini, la realizzazione dell’accesso basato sui contenuti, sull’interoperabilità e della comunicazione tramite il Web.
Per avere applicazioni che possano interagire automaticamente, è necessario avere un modo comune di interpretare le collezioni di informazioni, per ridurre o eliminare la confusione concettuale e terminologica presente in uno specifico settore. Tale compito è svolto dall’ontologia che costituisce una struttura unificante fra differenti punti di vista e serve come base per abilitare la comunicazione (fra persone, fra persone e sistemi, fra sistemi).
L’ontologia elimina l’ambiguità, fornendo una base a una base semantica e un vocabolario concettuale condiviso, per permettere la costruzione di descrizioni e la comunicazione.
L’Istituto Centrale per il catalogo e la Documentazione (ICCD) del MiBACT ha avviato nel 2017 il progetto ArCo (ArCo – Architettura della conoscenza). ArCo è una rete di ontologie per la strutturazione della conoscenza per i beni culturali per rendere disponibili i dati del Catalogo generale dei beni culturali secondo i paradigmi dei Linked Open Data (LOD). Il progetto intende valorizzare il contesto dei beni culturali rendendo i dati accessibili, rintracciabili e riusabili da utenti e applicazioni. I dati dovranno essere strutturati sulla base di modelli ontologici che:
- rispecchino l’analiticità strutturale delle schede ministeriali ICCD utilizzate per la descrizione dei beni culturali;
- restituiscano tutta la complessità dell’oggetto “bene culturale” descritto;
- valorizzino e rafforzino la ricchezza semantica del Catalogo e delle relazioni esplicite e implicite presenti nelle schede;
- assicurino interoperabilità attraverso operazioni di “allineamento semantico” tramite relazioni di equivalenza con altre ontologie specifiche del dominio beni culturali (tra le quali CIDOC-CRM ed EDM) ed altre ontologie e modelli concettuali consolidate o sviluppate anche in domini più specifici (es. Bibframe, Ric-O)
Le ontologie di ArCo si compongono di più moduli. Il modulo “core” importa sia Cultural-ON che le Ontologie di OntoPiA (rilasciate dall’Agenzia per l’Italia digitale -AGid- per la modellazione dei dati prodotti dalla pubblica amministrazione italiana). Gli altri moduli finora rilasciati riguardano la “context-description”, il “cultural-event”, la “denotative-description”, il “catalogue” e la “location”.
L’ontologia è disponibile al seguente indirizzo: https://w3id.org/arco/ontology/arco
COME INTERROGARE I LINKED OPEN DATA DEI PATRIMONI CULTURALI DELLA BASILICATA
SPARQL è un linguaggio standard W3C di interrogazione dati RDF (Resource Description Framework) e costituisce una delle basi portanti dei linked open data e del web semantico, una metodologia sempre più utilizzata da provider di dati anche istituzionali.
Per eseguire un’interrogazione sui dati dei patrimoni culturali della Basilicata è possibile collegarsi direttamente all’endpoint SPARQL disponibile all’indirizzo:
https://webgis.hsh.it/lod/sparql
Esempi di query in linguaggio SPARQL possono essere le seguenti:
Per visualizzare tutti i dati sui beni culturali di geoheritage: SELECT * {?s ?p ?o}
Per visualizzare tutte le schede di catalogo: SELECT DISTINCT ?SCHEDE WHERE {?schede?o.}
Per visualizzare la città per le schede: SELECT DISTINCT ?SCHEDA ?CITTA WHERE {?scheda ?p ?o. ?scheda ?citta.}
DATASET DEL GEOCATALOGO DEI PATRIMONI CULTURALI DELLA BASILICATA
Dataset dei Linked Open Data ottenuti dalla catalogazione del patrimonio culturale della Basilicata secondo il modello catalografico SCAN (Scheda Anagrafica Bene Culturale) v. 4.0
SHAPE FILE
Shape file contenente la localizzazione dei beni culturali.