Il tema

La disponibilità di dati geospaziali liberamente consultabili e utilizzabili è un tema particolarmente controverso. Vi sono situazioni di grandi apertura e stimolo che si  contrappongono ad altre di grande chiusura. Un rapporto dell'apile 2007 prodotto per il Ministero degli Interni olandese, ad esempio, raccomanda di distribuire i dati al costo della loro distribuzione (che, in caso di distribuzione via internet, si avvicina a zero) e di non porre limiti, se non in casi molto specifici e limitati, al loro riuso. Secondo GFOSS.it, la libera circolazione di dati geografici è un potente fattore di democrazia, nonché di sviluppo del mercato geospaziale. In questa sezione ci proponiamo di offrire una panoramica dei dati geografici liberamente accessibili in rete. Le tipologie di accesso sono molteplici e non sempre all'altezza delle aspettative. Particolare attenzione va anche posta sui formati usati per lo scambio delle informazioni e sulle licenze utilizzate per la loro distribuzione, favorendo ogni qualvolta sia possibile formati aperti e documentati e incentivandone la diffusione ad ogni livello.

I formati proprietari sono dannosi, perché richiedono l'acquisto di software proprietario per il loro uso. Perciò limitano la diffusione del software libero. Ciò è particolarmente vero nel mondo GIS, dove l'interoperabilità è un requisito fondamentale. In particolare, i formati file DWG ed ECW non sono leggibili in legalità con software libero. Chiediamo alle nostre Amministrazioni Pubbliche di adottare altri formati file in sostituzione di quelli citati.

A partire dal mese di novembre 2007 GFOSS.it ha promosso in modo continuo attività di sensibilizzazione sul tema dei dati liberi, e su quello delle licenze di utilizzo che devono essere associate a tali dati. Tale attività si è svolta attraverso l'organizzazione di frequenti incontri e dibattiti con esperti a livello nazionale, e attraverso la realizzazione di iniziative "sul territorio" (ad esempio M(')appare Milano), ad esempio in collaborazione con gruppi di lavoro di progetti quali OpenStreetMap.


Tale percorso ha portato in meno di un anno a:

  1. una crescente diffusione di una sensibilità sul tema dell'informazione geografica, e dell'importanza di una fruizione più libera della stessa
  2. un ampliamento della base di dati liberi attualmente utilizzabili, nella combinazione di dati raccolti da singoli cittadini secondo logiche collaborative, e dati rilasciati da alcuni enti e produttori
  3. un riconoscimento del ruolo dell'associazione come promotore su questo tema, mediando le esigenze e gli interessi di vari profili di utenti (ente pubblico, privato, università, fornitore di dati o servizi)
  4. un consolidamento dell'idea che le licenze attualmente più utilizzate a livello globale per i dati geografici acquisiti secondo modalità collaborative da comunità aperte, quali le licenze Creative Commons (in particolare nella variante identificata come CC-BY-SA) sono sì la miglior approssimazione possibile di una "licenza libera", ma stanno anche mostrando limiti dal punto di vista giuridico e della effettiva applicabilità.
Tale aspetto determina anche una conseguente incertezza da parte di alcuni soggetti fornitori di dati nel considerare la possibilità di utilizzare "licenze libere" in generale.
A questo proposito: mentre nelle comunità legate a livello globale ai progetti di mappatura collaborativa alcuni gruppi di interesse stanno ragionando su possibili sviluppi per definire una nuova licenza, GFOSS.it ha identificato, assieme ad alcuni attori a livello nazionale, un passo operativo: la realizzazione di una licenza  ad hoc per i dati geografici in Italia (quindi verificando in partenza la conformità ad alcuni requisiti nazionali e in armonia con lo stato dell'arte comunitario e altri gruppi di interesse che a livello comunitario stanno sul tema.

DATI GEOGRAFICI PUBBLICI NELLA PUBBLICA AMMINISTRAZIONE

Preambolo

Il giorno 13 Aprile 2011 l'associazione GFOSS.it ha organizzato a Bologna, presso la sede della Regione Emilia Romagna, una Giornata di Studio sul tema dei dati aperti in ambito geografico: l'incontro ha visto la partecipazione diretta di GFOSS.it, Regione Emilia Romagna e CSI Piemonte.

Il presente documento rappresenta la sintesi di quanto emerso a Bologna: evidentemente limitarsi a vaghe enunciazioni di principio ha poco senso nel contesto attuale, quindi il documento ha un carattere spiccatamente operativo e ben calato all'interno dei processi realmente in atto e delle tecnologie disponibili allo stato dell'arte.

Poiché si tratta di un insieme di linee guida sicuramente utili come riferimento per tutti i soggetti interessati alla pubblicazione dei dati aperti in ambito geografico, il documento è comunque permanentemente aperto alla partecipazione di tutti gli Enti ed Associazioni che riterranno di aderire anche in tempi successivi.  
I sottoscritti enti ed associazioni:

  • Associazione GFOSS.it
  • etc etc

si impegnano a promuovere la diffusione di dati pubblici[1] come dati aperti quali definiti nella Open Definition della Open Knowledge Foundation che, nella sua formulazione sintetica[2], recita:
A piece of content or data is open if anyone is free to use, reuse, and redistribute it — subject only, at most, to the requirement to attribute and share-alike
ovvero:
Un contenuto o un dato è aperto se chiunque ha la possibilità di usarlo, riutilizzarlo e ridistribuirlo liberamente – con l'eventuale vincolo di citare la fonte e/o ridistribuire allo stesso modo (http://www.opendefinition.org i termini della suddetta definizione vanno intesi nel modo in cui sono definiti nella open knowledge definition).

Finalità

La diffusione dei dati e il loro riutilizzo favorisce la creazione di nuova conoscenza e lo sviluppo dell'economia immateriale. La facilità di riproduzione dei dati digitali e la semplicità di accesso offerta dalla rete grazie agli standard di interoperabilità permettono in poco tempo una diffusione globale del dato. Ciò rende impensabile l'eventualità che alcuni soggetti possano lucrare sulla vendita di dati pubblici ottenuti gratuitamente: si aprono invece le porte alla creazione di servizi a valore aggiunto che utilizzano e integrano i dati pubblici accessibili e diffusi[3].

Licenze

Si ritengono utilizzabili licenze che prevedono esclusivamente vincoli di attribuzione ed eventuale condivisione secondo i termini della stessa licenza; qualunque restrizione al riutilizzo commerciale dei dati deve essere assente. Riteniamo importante l'uso di licenze riconosciute a livello internazionale: viceversa l'uso di  licenze realizzate ad-hoc è fortemente disincentivata. Una volta che i dati sono disponibili lo devono essere per chiunque, e quindi l'uso di standard di riferimento riconosciuti ed apprezzati a livello internazionale non può che garantire una corretta diffusione. Si considerano pertanto adatte le licenze elencate nell'Allegato "A"

Pricing

I dati pubblici devono essere disponibili al costo marginale di distribuzione ovvero ad un costo di riproduzione ragionevole, preferibilmente tramite il download gratuito via Internet[4].
 
Formato aperto
I dati pubblici devono essere disponibili in formato aperto[5].
Con riferimento specifico ai dati geografici / dati territoriali[6] i principali formati aperti sono elencati nell'Allegato "B"
 
Dato grezzo e servizi di consultazione WEB
E' auspicabile la messa a disposizione del pubblico di dati tramite servizi web basati su protocolli aperti[7] (in particolare, per i dati geografici / dati territoriali, mediante protocolli conformi agli standard OGC[8]). Tali servizi web possono affiancare ma mai sostituire la messa a disposizione in forma ulteriormente rielaborabile dei dati grezzi (raw data)[9] corrispondenti.
Le linee guida specifiche per la pubblicazioni di servizi web conformi agli standard OGC sono elencate nell'Allegato "C"
 
ALLEGATO "A" - LICENZE
 
Considerato che la situazione delle licenze è in continua evoluzione, definire la lista delle licenze consigliate in un allegato separato facilita e semplifica la manutenzione futura del documento.
Alla data attuale [Maggio 2011] la situazione può essere sintetizzata come segue:
 
Licenze senza vincoli (dominio pubblico)
Creative Commons CC0[A1]
Open Data Commons Public Domain Dedication and License (ODC PDDL[A2])
 
Licenze che richiedono attribuzione
Open Data Commons Attribution License (ODC By[A3])
Creative Commons Attribution (BY[A4])
 
Licenze che richiedono attribuzione e la stessa modalità di condivisione (share alike)
Open Data Commons Open Database License (ODC ODbL[A5])
Creative Commons Attribution Share Alike (BY-SA[A6])
Italian Open Data License (IODL versione 1.0[A7])
 
Preferenza di massima
Tutte le licenze sopra elencate sono perfettamente valide ed adeguate. Scegliere l'una o l'altra evidentemente dipende da condizioni particolari che verranno valutate per ciascun singolo caso concreto di applicazione.
Tuttavia si consiglia l'uso della licenza CC0 - pubblico dominio come opzione di base più adeguata per la maggior parte dei casi: questo modello favorisce maggiormente la circolazione dei dati, crea meno problematiche di costi verso la Pubblica Amministrazione ed incentiva l'effettivo il ri-uso.
 
Modalità di pubblicazione della licenza
Le informazioni sulla licenza devono essere presenti e facilmente identificabili sul sito WEB di distribuzione dei dati in forma breve con collegamento ai relativi dettagli.
Si consiglia comunque di allegare direttamente il testo della licenza ai files dati (p.es. all'interno del file .zip offerto in download etc).
 
ALLEGATO "B" – FORMATI DATI
 
Considerato che anche la situazione dei formati dei dati è soggetta ad evoluzione tecnologica, definire la lista dei formati dei dati consigliati in un allegato separato facilita e semplifica la manutenzione futura del documento.
Alla data attuale [Maggio 2011] la situazione può essere sintetizzata come segue:
Dati vettoriali (geometrie: eventualmente con attributi informativi associati)
ESRI Shapefile[B1]
GML (Geography Markup Language, qualsiasi versione)
altri formati vettoriali pubblicamente documentati (GeoJSON etc)[B2]
 
Dati raster (immagini e matrici numeriche georeferenziate)
 
1 - Dati raster (immagini: foto satellitari, ortofoto, mappe scannerizzate etc)
GeoTIFF (monochrome, palette, grayscale, RGB)
GIF, PNG e/o JPEG con WorldFile[B3] allegato
 
2 - Dati raster (matrici numeriche: GRID, DEM, DTM, DSM etc)
GeoTIFF[B4] (int16, int32, float, double)
Ascii Grid
altri formati binari pubblicamente documentati (.hgt, .bin, .flt etc)
 
Linee guida per la pubblicazione / download dei dati grezzi (= raw data):
I dati geografici tipicamente sono di rilevanti dimensioni. Pare quindi opportuno frammentare i dati in porzioni di dimensioni ragionevoli e di pratico utilizzo (fogli sezionali etc).
In ogni caso è opportuno pubblicare contestualmente i relativi quadri di unione, in modo tale da facilitare l'identificazione delle sezioni di effettivo interesse.
L'uso di interfacce interattive per la navigazione ed il download è sicuramente utile ed opportuno, ma possibilmente dovrebbe comunque essere supportato anche l'utilizzo di strumenti automatici e/o semiautomatici per il download (wget, ftp etc).
 
ALLEGATO "C" – SERVIZI WEB OGC
Considerato che anche la situazione dei servizi WEB OGC è soggetta ad evoluzione tecnologica, definire le pratiche di pubblicazione consigliate in un allegato separato facilita e semplifica la manutenzione futura del documento. 
Alla data attuale [Maggio 2011] la situazione può essere sintetizzata come segue:
 
Consultazione contro veicolazione
I servizi WEB OGC possono essere tecnologicamente utilizzati in due contesti ben diversi:

  • possono essere utilizzati per consentire la consultazione remota del servizio (essenzialmente, visualizzazione)
  • ma possono anche essere utilizzati per il trasferimento e la conseguente memorizzazione locale di massicce quantità di dati verso la postazione remota: in questo sono simili (anche se non esattamente identici) al download.

Dato che si tratta di un'area tecnologica generalmente sottovalutata e/o mal compresa, risulta quindi particolarmente opportuno disciplinare esplicitamente i termini d'uso ammessi per tutti i servizi WEB OGC pubblicati.
Qualsiasi eventuale restrizione d'uso del servizio deve quindi essere specificata in modo chiaro e facilmente identificabile, evitando qualsiasi ambiguità.
 
Uso dei servizi WEB OGC come strumenti di distribuzione
Come già visto al punto precedente, i servizi di pubblicazione WEB OGC si prestano tecnologicamente ad essere utilizzati anche come strumenti per la distribuzione dei dati grezzi (raw data).
Di fatto un servizio WMS veicola immagini raster georeferenziate, un servizio WFS veicola contenuti vettoriali GML etc.
Resta il fatto che utilizzando i servizi WEB OGC risulta abbastanza difficoltoso scaricare coperture cartografiche complesse e/o di vasta estensione.
Pertanto il supporto di tradizionali sistemi di download basati su fogli sezionali e relativi quadri di unione risulta in ogni caso un'opzione di gran lunga preferibile dal punto di vista operativo.
Tra l'altro la soluzione di offrire direttamente in download i raw data consente di alleggerire il carico di lavoro del servizio WEB OGC, che quindi potrà essere effettivamente utilizzato per i fini specifici per cui è stato creato con la massima efficienza e senza fattori di disturbo.

Modalità cascading
Per loro stessa natura i servizi OGC possono essere utilizzati in modalità cascading: cioè un server di terze parti può ulteriormente propagare i servizi erogati dal server primario di pubblicazione, eventualmente modificandoli e/o integrandoli (appunto: meccanismo di pubblicazione a cascata).
Dato che il cascading ha sicuramente un forte impatto prestazionale sia sul server che sulle linee di comunicazione, mentre viceversa non è strettamente indispensabile ai fini della libera consultazione dei dati, risulta estremamente opportuno disciplinare esplicitamente le specifiche modalità di cascading ammesse (oppure proibite) per ciascun servizio OGC pubblicato, evitando qualsiasi ambiguità.
 
[1] Sono dati pubblici ai sensi dell'art. 1 lett. n del D. Lgs. 82/05 (Codice dell'Amministrazione Digitale) “i dati conoscibili da chiunque”.

[2] La definizione estesa è disponibile all'URI http://www.opendefinition.org/okd/italiano/

[3] http://www.datagov.it/il-manifesto/trattare-linformazione-come-infrastru...

http://www.datagov.it/il-manifesto/open-data-per-lo-sviluppo-economico-d...

[4] http://www.epsiplus.net/content/download/3241/35000/file/Italian_l_34520... cfr paragrafo 5 della Direttiva 2003/98/CE del Parlamento Europe e del Consiglio (direttiva PSI): "Più ampie possibilità di riutilizzo delle informazioni del settore pubblico dovrebbero, tra l'altro, consentire alle imprese europee di sfruttarne il potenziale e contribuire alla crescita economica e alla creazione di posti di lavoro."

[5] Sono formati di tipo aperto ai sensi dell'art. 68, 3 del D. Lgs. 82/05, i formati resi pubblici e documentati esaustivamente. La documentazione deve essere disponibile gratuitamente oppure ad un costo puramente nominale e gli eventuali diritti che ne possano limitare l'uso (brevetti od altri diritti di privativa) devono essere licenziati gratuitamente ed irrevocabilmente

[6] Quali definiti all'art. 59 comma 1 del D. Lgs. 82/05.

[7] Il protocollo aperto è disponibile al pubblico, esaustivamente documentato ed il cui documento è disponibile gratuitamente oppure ad un costo puramente nominale e per il quale gli eventuali diritti che ne possano limitare l'uso (brevetti od altri diritti di privativa) sono licenziati gratuitamente ed irrevocabilmente.

[8] Open Geospatial Consortium http://www.opengeospatial.org

[9] Si intende per "dato grezzo" l'accesso ai dati secondo un formato aperto

[A1] http://creativecommons.org/publicdomain/zero/1.0/

[A2] http://www.opendatacommons.org/licenses/pddl/1-0/

[A3] http://www.opendatacommons.org/category/odc-by/

[A4] http://creativecommons.org/licenses/by/3.0/deed.it

[A5] http://www.opendatacommons.org/licenses/odbl/

[A6] http://creativecommons.org/licenses/by-sa/3.0/deed.it

[A7] http://www.formez.it/iodl/

[B1] anche se questo formato appartiene formalmente ad ESRI, tuttavia è pubblicamente documentato, ed è inoltre supportato dalla quasi totalità dei SW GIS disponibile, sia di tipo proprietario che libero. Per consentire l'effettivo riutilizzo dei dati occorrerà tuttavia specificare esplicitamente il sistema di riferimento spaziale (SRID) nonchè il charset encoding utilizzati, dato che l'informazione non è supportata direttamente dal formato.

[B2] la preferenza va comunque ai primi due, dato che sono quelli maggiormente utilizzati e più facilmente utilizzabili.

[B3] anche in questo caso occorrerà specificare esplicitamente il sistema di riferimento spaziale (SRID) utilizzato, dato che l'informazione non è supportata direttamente dal formato.

[B4] in questo caso occorrerà specificare esplicitamente il valore NODATA utilizzato, dato che l'informazione non è supportata direttamente dal formato.

I cookie ci aiutano ad erogare servizi di qualità. Utilizzando i nostri servizi, l'utente accetta le nostre modalità d'uso dei cookie.Maggiori Informazioni