Alla scoperta di OpenARS – i Linked Data dell’Assemblea Regionale Siciliana

DATAJOURNALISM

Alla scoperta di OpenARS – i Linked Data dell’Assemblea Regionale Siciliana

Come già anticipato nel precedente post, al raduno Open Data Sicilia 2018 verrà presentato il progetto OpenARS – i linked datadell’Assemblea Regionale Siciliana. Il progetto OpenARS ha l’obiettivo di pubblicare il patrimonio informativo dell’ARS in un modo completamente nuovo, abbracciando il mondo dei Linked Data, sfruttando le potenzialità del Web Semantico, consentendo la fruizione dei dati dell’ARS in modo flessibile e dinamico.

Vediamo adesso qualche dettaglio in più sul progetto.

Come primo passo sono stati estratti i dati dell’ARS dal sito istituzionale www.ars.sicilia.it attraverso appositi programmi, chiamati scraper, in grado di “grattare il testo dalle pagine Web e di salvare il contenuto in maniera strutturata, cioè individuando per ogni dato estratto la tipologia di appartenenza. Attraverso questi tool sono state estratte informazioni relative a tutte le legislature su deputati, assessori, incarichi e gruppi parlamentari mentre è stata estratta, invece, tutta l’attività parlamentare della 16° legislatura relativa ai disegni di legge, alle risoluzioni, alle interpellanze, alle interrogazioni, agli ordini del giorno, agli iter legislativi e alle sedute.

Applicare i principi Linked Data vuol dire passare da un Web di documenti a un Web di dati. Nel Web semantico non ci sono più documenti ma dati o risorse. Ogni dato è indipendente, collegato agli altri dati e definito formalmente da un’ontologia.
Per i dati ARS è stata sviluppata infatti un’apposita ontologia, chiamata OpenARS, in grado di descrivere in modo formale, sfruttando le potenzialità del Web semantico, le diverse tipologie di dati dell’Assemblea Regionale Siciliana e le interconnessioni che intercorrono tra gli stessi.

L’ontologia ha consentito di dare ad ogni risorsa un significato e di trasformare i dati dell’ARS in un enorme grafo direttamente interrogabile, esplorabile, riutilizzabile in altri contesti, in modo da arricchire il valore dei dati presenti sul sito ARS, abilitare e facilitare l’analisi dati, creare nuova conoscenza dai dati.

Questo è stato reso possibile applicando i principi dei Linked Data che prevedono la definizione univoca di ogni risorsa sul Web, la descrizione di ciascuna risorsa e l’interconnessione delle risorse con altri dataset, apportando così un importante contributo al progetto  LOD – Linked Open Data.

Con OpenARS sono state raggiunte le “5 stelle” di Tim Berners-Lee, cioè il livello più alto nella classificazione degli Open Data in termini di apertura e fruibilità.

Nei prossimi post vedremo più nel concreto cosa sono i LOD e come interrogare direttamente  i dati di OpenARS, esploreremo il grafo dei dati per capire come sia possibile iniziare a sviluppare applicazioni, report, ricerche, monitoraggi e statistiche.

Non dimenticatevi di iscrivervi al raduno Open Data Sicilia 2018. L’ingresso è gratuito ma i posti sono limitati.