[Gfoss] Libro Bianco per il riutilizzo dell'informazione del settore pubblico

>Vi giro FYI una segnalazione appena girata sulla  ML di OKFN
>(scusatemi per l'eventuale cross posting).
>
>IMHO questo Libro Bianco e' un documento veramente molto interessante e
>pieno di spunti utili per tutti coloro che sono interessati ai processi
>Open Data (anche in ambito geografico, ovviamente).
>
>Direi che soprattutto e' una lettura sicuramente utile ed altamente
>consigliata (anche dal punto di vista pratico) per tutti i funzionari
>che lavorano in qualche P.A. ;-)
>
>buona lettura,
>Sandro

Te ritieni che sia applicabile anche ai dati GIS ?

A me non sembra.
Parla di catasto, è vero, ma gli esempi che porta sono francamente neanche da prendere in considerazione.

A meno che non mi spieghi come fa' un immobiliarista e una banca a trarre profitto dai dati catastali.

Oppure pensano che chi vuole fare una lottizzazione non la fa' perche' non conosce i numeri di particella del terreno su cui deve farla ? :)

Piu' in generale a me pare forzata e troppo semplicistica l'affermazione iniziale su cui tutto il resto del libro si regge:

Oppure l'orario dei tram per favorire la vendita di gelati ....
A quale orario pensa ? Quello salvato nel fogli excel di chi ha progettato i tragitti , e che mai corrisponde al vero perche' sulle strade no circolano solo i tram , ma anche tanti altri mezzi 

e vuoi per incidenti, vuoi per traffico, i ritardi sono all'ordine del giorno ?

Oppure a un orario prodotto al volo da un sistema che collegandosi al satellite, riceve via GPS la posizione, sulla base della posizione e conoscendo la posizione di tutte le altre macchine che circolano, calcola al volo il tempo necessario a percorrere il tragitto e ti fa’ sapere che tra 7 minuti e 23 secondi arriva, per cui puoi comprare il gelato oppure bere un caffe. Non puoi mangiare un panino perche’ forse non ce la farai a terminarlo ?

Scherzi a parte.

Questo libro a mio parere poteva avere piu’ senso se fosse stato la seconda puntata di un altro libro, che come al solito manca e che nessuno sente la necessita’ di scrivere.

Una sorta di “analisi comparata dei dati prodotti dalla pubblica amministrazione e del loro processo produttivo”.
In cui si prenda in analisi i processi di produzione dei dati, e , ancora piu’ importante, i processi di aggiornamento dei medesimi.

Poi, passati in reassegna i processi produttivi e analizzati, si puo’ capire realisticamente, quali dati sono adatti per un business e quali no.
“L’affermazione diamo tutto a tutti e garantiamo aggiornamenti costanti”, è troppo semplicistica e tende a ignorare dei costi che invece ci sarebbero , e sarebbe elevatissimi.

Nel libro portano qualche esempio, ma il vero problema e’ solamente sfiorato.

Per dare una misura concreta, la realizzazione della carta di un grande centro urbano (a scala 1:2000, con un aggiornamento
tendenzialmente necessario ogni due anni) comporta una spesa di circa 50 euro all’ettaro.

Ma probabilmente ignorano (o sottovalutano) che un aggiornamento di un foglio di CTR 2K non si fa’ sistematicamente, proprio perche’ costa molto e i fondi non ci sono (giustamente).
Per cui si fa’ solo quando serve.

il problema e’ proprio nell’affermazione “quando serve”. Infatti se da una parte e’ giusto e condivisibile dire di mettere i dati a disposizione di chi deve farci altro, e’ anche vero che chi vuole farci un business, deve avere dati aggiornati, altrimenti che cavolo di business ci fa’ ?
Ma per la PA tenere questi dati (50 euro l’ettaro) aggiornati annualmente , o come dicono loro per addolcire il concetto :slight_smile: Ogni due anni, significa mettere in campo un fracasso di miliardi.

Prendiamo a caso un comune (milano ad esmepio e’ 18.000 ettari).

aggiornare ogni due anni la cartografia del comune a 50 euro all’ettaro, ai costi riportati (50 euro + iva all’ettaro) implica solo di aggiornamento 900.000 euro + iva.
A cui vanno aggiunti i costi di informatizzazione e di integrazione nelle varie banche dati. Per cui si va molto sopra il milione.
E questo viene ipotizzato ogni due anni.

Dubito che questa sia una cosa che possa essere fatta sistematicamente da ogni comune italiano.

E infatti non documenti si riportnao le cifre, ma non si dice ogni quanto tempo viene aggiornata.
Ci si limita a dire che sarebbe utile per il business che sia aggiornata ogni 2 anni.
Bella scoperta !

Il problema e’ proprio chi mette i fondi per questo aggiornamento cosi’ sistematico e continuo . :slight_smile:
Specie se poi i dati una volta che il grosso della spesa e’ stato fatto vengono dati a privati che capitalizzano i guadagni con i vari business.

Oppure si gioca sul significato di cosa sia un “aggiornamento”
Perche’ se per aggiornamento si intende prendere un foglio di ctr vecchio di una decina o piu’ di anni fa’, roba che per i business descritti nel libro equivarrebbe a considerarlo “fatiscente” e tracciarci sopra una sola singola linea nuova, senza controllare che tutto il resto sia rimasto tale e quale oppure no, e solo perche’ ha tirato una nuova riga ribattezza il foglio come aggiornato ad oggi. Allora parliamo due linguaggi differenti. Ma e’ questo il tipo di dato su cui uno puo’ realisticamente pensare di fare un business ?

L’esempio che porto puo’ sembrare forzato, ma non lo e’ , infatti spesso si assiste a platee di servizi in cui il soggetto di turno mostra come e’ agile via internet aggiornare una linea su un database.
Purtroppo per questi soggetti il discorso finisce li’. Dove si aggiorna una linea se ne puo’ aggiornare un milione.
Il sistema informativo costa qualche centinaio di milgliaiai di euro e il gioco e’ fatto. Tutto sembra semplice e sembra funzionare…
Facile a dirsi, “un po meno a farsi”.

Specie nella cartografia che per sua natura vuole essere un rilievo del territorio. Per cui in tutti i sistemi di aggiornamento, manca sempre il “convitato di pietra” ovvero il “territorio”.
quasi che esso fosse un inutile orpello che rovina l’armonia, lo splendido automatismo, del sistema informativo stesso.

Invece, i dati cartografici devono essere rappresentativi del territorio, e quindi un sistema informativo da solo non riesce a garantire questo.
Per arrivare a cio’ occorre realmente rivoluzionare, parti del processo produttivo, ma qui si va ben oltre i concetti espressi nel libro bianco di cui si parla.

In cui si da’ per scontato che gia’ tutto sia cosi’ e quindi basta e resta solo da condividere questo messe di dati dato ricca e aggiornata per far nascere nuovi business e ricchezze.

Tanto che a volte viene da pensare che forse l’unico che farebbe il business e’ chi vende il sistema informatico atto a garantire questo tipo di “pseudo aggiornamento”, ma per il resto resterebbe un dato vecchio, anzi , peggiorato, dal mio punto di vista, perche’ escolando roba vecchia e roba nuova si perderebbe pure l’omogeneità del foglio, che di per se’ e’ un valore anche esso.

Per me questo e’ il punto critico di questi discorsi, si basano su presupposti Ecco. Qui sta’ il punto. Io non ci credo che questo sia possibile, per cui ritorniamo al puto di partenza se gli aggiornamenti non sono cosi’ frequenti come serve , chi puo’ realmente fare un business su dati obsoleti ?

Qualche volta la ragione per cui i dati non sono messi in circolo e’ perche’ sono obsoleti e ritenuti poco adatti a usi piu’ commerciali.

Posso essere daccordo sul concetto di condividere, ma lo sono “un po meno” se poi chi dice cio’ aggiunge anche “purche siano tenuti aggiornati”.

Troppo semplice impostare un business ipotizzando che le spese le faccia la collettività, mentre i guadagni saranno poi capitalizzati dai singoli.
E’ giusto dire che se si sono spesi dei soldi per produrre dei dati mettili a disposizione. Naturalmente serve la giusta normativa a supporto.
Ma supponiamo che ci sia.

Pero’ non trovo giusto che poi la PA debba sobbarcarsi le spese per tenere dei dati aggiornati con un livello di aggiornamento sovradimensionato rispetto alle sue esigenze solamente per mantenere in vita aritificosamente un business per soggetti privati.

Andrea Peri
. . . . . . . . .
qwerty àèìòù

On Wed, 25 Apr 2012 08:35:11 +0200, Andrea Peri wrote:

Andrea,

intanto provo a risponderti su un paio di questioni piu' attinenti
al GIS, poi ti daro' una risposta separata per orari autobus e dintorni.

E' giusto dire che se si sono spesi dei soldi per produrre dei dati
mettili a disposizione. Naturalmente serve la giusta normativa a
supporto. Ma supponiamo che ci sia.

Pero' non trovo giusto che poi la PA debba sobbarcarsi le spese per
tenere dei dati aggiornati con un livello di aggiornamento
sovradimensionato rispetto alle sue esigenze solamente per mantenere
in vita aritificosamente un business per soggetti privati.

Su questo punto non posso che darti pienamente ragione.
le premesse concettuali su cui si basano gli Open Data sono:
- la P.A. comunque deve produrre (o ha gia' prodotto) dei datasets per
   proprie esigenze / processi interni
- i costi di produzione dei dati sono sicuramente elevati, ma sono gia'
   stati coperti dalla fiscalita' generale, quindi dai cittadini
- i costi di distribuzione dei dati sono assolutamente marginali rispetto
   a quelli di produzione
- quindi redistribuire pubblicamente i datasets a costo zero (o al
   massimo compensando i meri costi di distribuzione, supporti etc) ha
   pienamente senso, sia in termini giuridici che economici

chiaro che nel paradigma di cui sopra il pilastro fondamentale e' che
"la P.A. ha gia' prodotto i datasets per esigenze interne"

se viceversa la P.A. iniziasse a produrre (o aggiornare) i datasets solo
ed esclusivamente perche' viene sollecitata in questo senso da soggetti
privati che ne traggono un immediato beneficio economico, allora saremmo
sicuramente in presenza di una degenerazione patologica.

personalmente pero' io mi porrei il problema in termini differenti:
se alcuni specifici datasets sono altamente appetibili per alcuni
operatori economici, perche' non provare a coinvolgerli direttamente
nei processi di aggiornamento delle informazioni ?

dopo tutto, il senso di adottare una licenza "virale" come la CC-BY-SA
dovrebbe essere esattamente questo: "ti regalo gratis il dataset iniziale,
ma ti vincolo legalmente a condividere e pubblicare tutte le rielaborazioni,
migliorie etc che apporterai a quel dataset"

giusto per provare a fare un esempio concreto/realistico: immaginati una
regione che abbia mappato i sentieri escursionistici, le ciclovie, i percorsi
per l'equitazione, i siti di interesse naturalistico etc.
a me sembra che se poi quella regione rilascia tutto sotto CC-BY-SA, (e magari
riesce anche ad attivare tutta una serie di convenzioni/intese ad hoc), chi
meglio dei vari ARCI, WWF, CAI, Amici della Bicicletta, IppoClub, BoyScout etc
sara' poi in grado di garantirne la tempestiva verifica ed aggiornamento ?
[con ovvio risparmio economico per l'ente, e con altrettanto ovvio
miglioramento in termini di accuratezza, completezza ed efficienza]

Te ritieni che sia applicabile anche ai dati GIS ?

A me non sembra.
Parla di catasto, è vero, ma gli esempi che porta sono francamente
neanche da prendere in considerazione.

A meno che non mi spieghi come fa' un immobiliarista e una banca a
trarre profitto dai dati catastali.

a me non pare che sia poi cosi' impossibile immaginare uno scenario:
dopo tutto la Bussiness Intelligence (BI) si occupa proprio di questo.

p.es. si potrebbero incrociare i dati catastali con i dati aggregati del
censimento; e da li si potrebbe facilmente arrivare a definire un profilo
anagrafico e socio-economico dei residenti con una elevata risoluzione
spaziale. poi magari si potrebbero fare ulteriori incroci con i dati della
camera di commercio, e cosi' si riuscirebbe ad ottenere il profilo delle
attivita' industriali, artigianali e commerciali della zona.

a me personalmente pare che informazioni dettagliate a questo livello
di granularita' (singolo isolato) potrebbero facilmente avere un valore
economico elevato, visto che poi potrebbero venire usate p.es. per decidere
dove aprire un nuovo negozio/laboratorio/agenzia, di che tipologia, con
quali caratteristiche etc

oppure potrebbero servire per decidere dove investire in terreni (o costruire
immobili) con buone prospettive di valorizzazione a medio termine etc

temo fortemente che informazioni ed elaborazioni di questo tipo gia' da
decenni siano accessibili (in modi non sempre trasparenti, e non sempre
legali) per pochi operatori economici ben inseriti "nei circuiti giusti".

magari una coraggiosa operazione Open Data potrebbe anche servire a
ripristinare elementi di piena legalita', di totale trasparenza e di
genuina libera concorrenza su basi di assoluta parita' per tutti,
chissa mai ? :wink:

ciao Sandro

--
Il messaggio e' stato analizzato alla ricerca di virus o
contenuti pericolosi da MailScanner, ed e'
risultato non infetto.

On Wed, 25 Apr 2012 08:35:11 +0200, Andrea Peri wrote:

Oppure l'orario dei tram per favorire la vendita di gelati ....
A quale orario pensa ? Quello salvato nel fogli excel di chi ha
progettato i tragitti

giusto per la precisione: magari bastasse semplicemente un foglio excel
(o equivalente o.s. per non discriminare nessuno) per descrivere decentemente
gli orari degli autobus e dei treni :smiley:
serve piuttosto una marea di dati altamente strutturati, in parte tabellari
(orari, calendari) ma in parte anche georeferenziati (posizione delle fermate,
rappresentazione dei percorsi).
se non ricordo male, p.es. per descrivere tutta la rete ferro+gomma della
Toscana servono diverse decine di GB di dati.

normalmente si usano schemi XML abbastanza complessi: purtroppo non esiste
uno standard vero e proprio, o meglio, ne esistono un paio ma sono troppo
complicati/astratti e non hanno incontrato buona accoglienza da parte
delle aziende che gestiscono l'esercizio.
un modello dati ragionevole (forse un po' troppo semplificato, ma largamente
adottato proprio perche' semplice) e' quello definito da Google Transit:
https://developers.google.com/transit/gtfs/reference

... e che mai corrisponde al vero perche' sulle
strade no circolano solo i tram , ma anche tanti altri mezzi
e vuoi per incidenti, vuoi per traffico, i ritardi sono all'ordine del
giorno ?

questo e' il cosiddetto "orario programmato"; normalmente e' quello piu'
largamente utilizzato, proprio perche' e' il modello dati piu' semplice
da gestire praticamente.
ok, non e' il vangelo: ma in condizioni di esercizio normali, ed in
assenza di eventi eccezionali (scioperi, manifestazioni, catastrofi)
e' comunque una base di partenza molto ragionevole e realistica.

considera che in genere i mezzi urbani sono "a frequenza", quindi non
e' tanto rilevante sapere che il bus passa esattamente alle 11.32; il
dato rilevante e' che su quella linea (in media) hai un transito ogni
4 minuti piuttosto che ogni 30 minuti.
i servizi extra-urbani hanno cadenze molto piu' sporadiche: ma soffrono
anche molto meno della congestione del traffico (almeno, in media).

Oppure a un orario prodotto al volo da un sistema che collegandosi al
satellite, riceve via GPS la posizione, sulla base della posizione e
conoscendo la posizione di tutte le altre macchine che circolano,
calcola al volo il tempo necessario a percorrere il tragitto e ti fa'
sapere che tra 7 minuti e 23 secondi arriva, per cui puoi comprare il
gelato oppure bere un caffe. Non puoi mangiare un panino perche' forse
non ce la farai a terminarlo ?

andrea, non e' fantascienza ...
i cosidetti sistemi AVM fanno proprio questo: a bordo di ciascun mezzo
c'e' una centralina GPS, che ogni tot secondi rileva le coordinate e
le trasmette in centrale: spesso inviando un banale SMS
dopo di che in centrale vengono determinati anticipi e ritardi rispetto
al pianificato.
i sistemi piu' sofisticati addirittura sono agganciati in real-time
ad un modello matematico di simulazione del traffico, che si ricalibra in
continuazione in base ai ritardi rilevati (insomma, e' il bus stesso che
diventa un sensore viaggiante che permette di rilevare ingorghi, deviazioni
impreviste etc)

alcune reti urbane si sono attrezzate gia' da oltre dieci anni: p.es. proprio
Firenze (se non erro, ATAF e' stata la prima azienda in Italia a dotarsi
di un sistema AVM, gia' a partire dalla fine degli anni 90).

il problema vero non e' affatto tecno-informatico: e' piuttosto che poi
comune, provincia, regione, aziende di trasporto, vigili urbani etc faticano
a riuscire a costruire una rete efficacemente integrata (e quindi realmente
utile per qualsiasi scopo pratico).
proprio perche' ciascuno tende a tenersi belli stretti e sotto chiave i
propri dati, acquisiti con tanta paziente fatica e con onerosi investimenti.

Regione Toscana e' stata la prima in Italia (ed una delle prime in EU)
a gestire tutti gli orari pianificati sull'intero territorio regionale,
fin dai primi anni 2000: il sistema RT ha iniziato ad essere pubblicamente
consultabile su Google Transit fin dal 2009. e per quanto mi risulta sono
in corso svariate iniziative per riuscire finalmente a coprire tutto il
territorio regionale con un unico sistema AVM integrato.

quindi il problema non e' tanto la carenza di dati: i dati ci sono, sono
gia' di qualita' elevata, e potrebbero addirittura diventare di qualita'
"fantascientifica" nei prossimi anni.
anche i terminali ci sono gia': qualsiasi smart-phone con capacita' di
posizionamento GPS potrebbe integrarsi in mille modi in questo contesto,
sia come fruitore di informazioni (condizioni traffico, disponibilita'
parcheggi, orari bus+treno, pianificazione percorsi calibrata sulle
condizioni reali etc) ma anche come "sensore mobile".

a me pare piuttosto che il problema "vero" e' che fino a quando tutta
questa impressionante miniera di informazioni non viene liberamente messa
a disposizione di tutti, in modo tale da consentire un'integrazione efficace
e tempestiva, ben difficilmente possiamo sperare che nasca un qualsiasi tipo
di mercato indotto.

IMHO se mai esiste un esempio evidente di come sia proprio la mancanza
di dati grezzi a dispozione che impedisce lo sviluppo di iniziative
(anche economiche, anche su basi commerciali) e' proprio quello della
mobilita', del traffico e dei trasporti pubblici.
insomma, la cosiddetta info-mobility

ciao Sandro

--
Il messaggio e' stato analizzato alla ricerca di virus o
contenuti pericolosi da MailScanner, ed e'
risultato non infetto.