Inizio Contenuto

Linked Open Data



I 'Linked Open Data'(LOD) consentono di accedere e navigare dati in formato open sulla base di tecnologie e standard del Web semantico. La pubblicazione dei dati in formato LOD si basa sulla definizione delle ontologie (rappresentazioni formali, condivise ed esplicite della concettualizzazione di un dominio di interesse). Il primo nucleo di 'Linked Open Data' pubblicato dall'Istat è costituito da dati provenienti dal Censimento della popolazione e delle abitazioni 2011. In particolare, sono state definite le seguenti ontologie :


  1. Ontologia delle Basi Territoriali

  2. Ontologia dei Dati Censuari





Ontologia delle Basi Territoriali



L'ontologia delle Basi Territoriali formalizza e descrive il territorio Italiano analizzandolo sia dal punto di vista amministrativo che statistico-geografico. In particolare, dal punto di vista amministrativo il territorio è suddiviso in:


  • Stato: Entità politica che governa ed esercita il potere sovrano su un determinato territorio e sui soggetti ad esso appartenenti

  • Ripartizione geografica: Nord-Ovest, Nord-Est, Centro, Sud, Isole

  • Regione: ente territoriale presente nell'ordinamento giuridico Italiano

  • Provincia: ente locale avente una competenza su un gruppo di comuni, non necessariamente contigui

  • Comune: ente amministrativo determinato da precisi limiti territoriali sui quali insiste una porzione di popolazione

  • Area sub-comunale: municipi, quartieri, ecc. nei 34 comuni di maggiore Dimensioni demografica e con popolazione non inferiore a 100.000 abitanti



Dal punto di vista statistico-geografico il territorio è partizionato nel seguente modo:


  • Sezioni di censimento: porzione di territorio su cui sono effettuate le rilevazioni dell'Istat in occasione dei censimenti. La popolazione media è di circa 170 individui

  • Aree di censimento: raggruppamenti di sezioni di censimento, tra loro contigue, intermedie tra sezioni e località di centro abitato, appartenenti ai centri principali

  • Località: area più o meno vasta di territorio, conosciuta di norma con un nome proprio, sulla quale sono situate una o più case raggruppate o sparse



Nell'ontologia vengono inoltre caratterizzate le aree speciali, quali le entità geomorfologiche (stagni, valli da pesca, fiume, laguna,..), le isole amministrative e le zone in contestazione; i nuclei speciali quali ad esempio ospedali, abbazie, centri di accoglienza,.. per un totale di 45 nuclei speciali. Tutte queste caratterizzazioni sono collegate tra loro sia da relazioni di gerarchia che da altre relazioni quali ad esempio la relazione eAssegnataA che lega una zona in contestazione con il comune a cui tale zona è stata assegnata, mentre la relazione eContesaDa esplicita il comune che rivendica l'appartenenza della zona in contestazione. Infine, sono stati effettuati i collegamenti con i concetti equivalenti presenti nella ontologia Geonames, ad esempio per i Fiumi descritti come area speciale nonchè entità geomorfologica è stata esplicitata la relazione di equivalenza con la codifica H.STM presente nell'ontologia internazionale Geonames.




Ontologia dei Dati Censuari



L'ontologia dei Dati Censuari formalizza e descrive i metadati delle variabili censuarie. Trattandosi di dati statistici è stata utilizzata la meta ontologia Data Cube Vocabulary creata appositamente per la rappresentazione di dati multi-dimensionali.
Le variabili censuarie sono suddivisibili in otto gruppi: (i) popolazione residente, (ii) popolazione straniera, (iii) famiglie, (iv) grado di istruzione, (v) condizione professionale, (vi) pendolarismo, (vii) alloggi, (viii) edifici. Per ognuno di tali gruppi, di seguito si elencano le misure e le dimensioni formalizzate nell'ontologia :


  1. Popolazione Residente
    • Misure: popolazione residente

    • Dimensioni: anno, territorio, sesso, classi di età, stato civile.

  2. PopolazioneStraniera
    • Misure: stranieri e apolidi residenti

    • Dimensioni:classi di età, paese di provenienza, anno, territorio, sesso.

  3. Famiglie
    • Misure: numero famiglie, numero componenti

    • Dimensioni: componenti della famiglia, condizione di godimento dell'alloggio, territorio, anno.

  4. Grado di Istruzione
    • Misure: popolazione residente

    • Dimensioni: territorio, anno, grado di istruzione, classi di età, sesso.

  5. CondizioneProfessionale
    • Misure: popolazione residente

    • Dimensioni: tforza lavoro, stato occupazionale, classi di età, anno, territorio, sesso..

  6. Pendolarismo
    • Misure: popolazione residente

    • Dimensioni: spostamenti lavorativi, anno, territorio.

  7. Alloggi
    • Misure: numero alloggi, superficie

    • Dimensioni: stato di occupazione, tipo di alloggio, territorio, anno.

  8. Edifici
    • Misure: numero edifici, numero interni dell’edificio

    • Dimensioni: territorio, materiale di costruzione, periodo di costruzione, stato di conservazione, anno, numero di piani, classi di interni, tipo di utilizzo dell'edificio.





Certificazione della provenienza dei dati



Pur aprendosi alla nuova frontiera dei Linked Open Data, l'Istat non sottovaluta l'importanza della qualità del dato quindi certifica la provenienza dei propri dati utilizzando la meta ontologia PROV-O che consente di descrivere in dettaglio la provenienza dei dati. In maggior dettaglio, i dati pubblicati sono corredati del seguente insieme di metadati che ne descrivono e certificano la provenienza nonchè la qualità:


  • Entità, attività e agenti partecipanti al processo di generazione del dato

  • Responsabile del dato

  • Possessore dei diritti sui dati

  • Chi pubblica il dato

  • Data di ultima modifica dei dati

  • Titolo dei dati pubblicati

  • Periodo di riferimento dei dati

  • Licenza di pubblicazione

  • Descrizione dei dati

  • Riferimento spaziale dei dati





Approfondimenti



Per un approfondimento sui dati pubblicati si legga il documento 'Descrizione dei dati geografici e delle variabili censuarie per sezione di censimento Anni 1991, 2001, 2011' (scarica il documento). Per approfondire l'aspetto tecnologico della pubblicazione dei dati in formato LOD da parte dell'Istat, si veda legga l'articolo 'Publishing the 15th Italian Population and Housing Census in Linked Open Data' SemStat 2014 ( scarica il documento). Per conoscere le direttive per la valorizzazione del patrimonio informativo pubblico si leggano le linee guida pubblicate dall'agenzia per l'Italia digitale ( scarica il documento).