[Gfoss] "qualità peggiore di quanto mi avevano detto" (was [Talk-it] confini amministrativi)

buongiorno a tutti -

si conferma che il finale della settimana è quello dove compaiono i
thread interessanti, almeno secondo i dati del mio istituto di
statistiche sulle mailing list che ci leggono.

0. PREMESSA

come in messaggi passati - colgo lo spunto di un post specifico, ma
vedo una ricorrenza di situazioni analoghe anche in mail (e
discussioni vive) con diverse altre persone....

se la cosa vi fa l'effetto di un off-topic o di una sistematica
"astrazione" rispetto al tema iniziale, fatemi sapere ;)...per me non
lo è...ma magari risulta "stonato"...

1. possibili dati per confronto incrociato

anche la provincia di Lodi mette a disposizione dati scaricabili a
condizioni che "sembra che non abbiano problemi d'uso ecc."
ecc ecc ecc ....tanti enti pubblicano tanti dati (per esempio:
http://www.gfoss.it/drupal/geodati per alcuni rimandi)

- allo stesso tempo stiamo vedendo che nessuno si sta lanciando a
confermare che i dati sono *proprio proprio* utilizzabili secondo
*procedure* definite, condivisibili, riusabili.
questo non è un problema, se si pensa che non c'è nessuna urgenza, dal
punto di vista proprio delle scadenze, a liberare tanti dati.

o c'è ?

allo stesso tempo, sicuramente è condivisa l'importanza de "LA
licenza". per cui chi vuole sta contribuendo a un percorso in questa
direzione.

domani si parla di queste cose (delle licenze per dati geografici, non
solo di OpenStreetMap) a Vigheffio di Parma e porteremo aggiornamenti
a chi non ci sarà.

2. incrocio dati con dati noti:

Simone - circa le problematiche cui accenni: ti chiederei quasi di
darci degli esempi precisi, ma ...

come GFOSS.it (e prima di GFOSS.it come persone comunque interessate a
far maturare una "filiera" delle cose geografiche libere) puntiamo
molto sul lanciare stimoli di ricerca e studio.

una analisi comparativa tipo quella fra dati comuni amministrativi
ISTAT e dati comuni amministrativi di altre fonti è una ricerca/studio
estremamente interessante.

sette-otto anni fa ricordo uno lavoro simile fatto in Olanda da
qualcuno che confrontava il calcolo delle aree boschive fatto a
partire da fonti vettoriali differenti (come se fosse fatto il
confronto fra carte nazionali, regionali, provinciali e di qualche
parco vero e proprio) e uscivano differenze sostanziali, sia sulla
geometria che sull'estensione delle aree vera e propria.

nota al caso olandese: essendo nei Paesi Bassi una decina d'anni fa,
qualcuno avrebbe anche potuto condurre tutti i calcoli comparativi in
un coffee-shop, con relativi problemi di allineamento dati...
oppure, possiamo dire che non esiste "il dato" buono per qualsiasi
utilizzo....aggiungo anche che il problema degli algoritmi di
generalizzazione dei dati (ad es. come ottenere un dato "come se fosse
al 100.000 a partire da un dato al 10.000" sono cose complesse, e anzi
mi farebbe piacere se qualcuno ci aggiorna.

PROPOSTA 1:

ci legge qualche studente intrepido interessato a cimentarsi in un
esercizio (che avrebbe poi opportunità di pubblicazione, visibilità e
curriculum) ?

PROPOSTA 2:

meglio ancora: ci legge qualche ricercatore stagionato che ha già
fatto questi conti magari cinque anni fa (o dieci...i dati erano già
tutti lì...) e ci può dare i riferimenti di una pubblicazione...da
mettere in mano allo studente intrepido ?

ultimo, ma non ultimo:

- la cognizione della qualità dei dati deve essere un punto di
partenza, non di "mezza via". chiedo a chi è più attivo allo stato
attuale nel progetto OSM in Italia se vedono possibilità di ragionare
su questo tema.

il rischio è di lanciare nel planet dati di livelli di qualità
differente ecc ecc ecc.

- l'espressione usata da Simone, che ho poi preso come spunto per il
nuovo thread:

va bene nel contesto colloquiale di una mailing list informale. però
da un punto di vista formale la qualità non dovrebbe "essere detta",
ma documentata e certificata. voi comprereste un'auto con sistemi di
sicurezza che "ci dicono che funzionano bene" senza la certificazione
di un collaudo e di test di sicurezza vari ?

si accettano manifestazioni di interesse per presentare lavori che
parlino di queste problematiche a Pula (prossimo convegno GFOSS-GRASS
ecc ecc) a Febbraio 2009 (poi il comitato scientifico valuterà)

un saluto!

andrea giacomelli
ingegnere civile per la difesa del suolo e la pianificazione
territoriale (quando ci facevano fa' tecnica delle costruzioni)
vicepresidente e responsabile comunicazione GFOSS.it

---------- Forwarded message ----------
From: enrico lambertini <lamba84@gmail.com>
Date: 2008/7/24
Subject: Re: [Talk-it] confini amministrativi
To: List for italian speaking users <talk-it@openstreetmap.org>

da qui: http://geo.regione.emilia-romagna.it/catalogo_web/catalogo/
puoi scaricare i confini della regione emilia romagna in formato
shapefile, mi sembra che la licenza non abbia problemi con l'uso purchè
si citi la fonte, ma per questo attendo persone più competenti di me

Simone Cortesi ha scritto:

ciao,

sto facendo delle verifiche con i dati istat dei confini
amministrativi per poterli importare in OSM, ma ho il dubbio di avere
sbagliato qualcosa.

quindi vorrei fare delle verifiche: qualcuno di voi ha inserito i
confini amministrativi di un comune che conosce bene e dei quali è
relativamente sicuro?

PS: i dati istat inoltre mi sembrano di qualità peggiore rispetto a
quanto mi avevano detto....

grazie,
S.

_______________________________________________
Talk-it mailing list
Talk-it@openstreetmap.org
http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/talk-it

_______________________________________________
Talk-it mailing list
Talk-it@openstreetmap.org
http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/talk-it

2008/7/25 andrea giacomelli <pibinko@gmail.com>:

- allo stesso tempo stiamo vedendo che nessuno si sta lanciando a
confermare che i dati sono *proprio proprio* utilizzabili secondo
*procedure* definite, condivisibili, riusabili.
questo non è un problema, se si pensa che non c'è nessuna urgenza, dal
punto di vista proprio delle scadenze, a liberare tanti dati.

utilizzabili, i dati dell'istat sono. ma preferisco inserire un dato
piu' corretto. un dato troppo grossolano come quello che ho trovato,
non lo metterei.

e non è come quando niccolo ha inserito in osm i toponimi, quelli sono
arbitrari, approssimati per definizione. ma i confini no, per quanto
mi riguarda non possono essere approssimati (oggetto di diatribe fra
comuni e province, si, ma non sbagliati).

allo stesso tempo, sicuramente è condivisa l'importanza de "LA
licenza". per cui chi vuole sta contribuendo a un percorso in questa
direzione.

ho letto ora la licenza
http://geo.regione.emilia-romagna.it/catalogo_web/catalogo/ per quanto
mi hanno spiegato le mie conoscenze in istat, la licenza EM è
assolutamente compatibile con i nostri scopi OSM.

domani si parla di queste cose (delle licenze per dati geografici, non
solo di OpenStreetMap) a Vigheffio di Parma e porteremo aggiornamenti
a chi non ci sarà.

ci si vede a Parma.

Simone - circa le problematiche cui accenni: ti chiederei quasi di
darci degli esempi precisi, ma ...

preparerò una mail, ma piu' avanti oggi.

il discorso è che il poligono è semplificato rispetto a quello che
appare essere il confine dei comuni che conosco bene (a casa mia il
confine del comune ha una forma ben particolare, quasto non si scorge
nei dati in mio possesso).

-S

Il giorno 25/lug/08, alle ore 13:13, Simone Cortesi ha scritto:

2008/7/25 andrea giacomelli <pibinko@gmail.com>:

- allo stesso tempo stiamo vedendo che nessuno si sta lanciando a
confermare che i dati sono *proprio proprio* utilizzabili secondo
*procedure* definite, condivisibili, riusabili.
questo non è un problema, se si pensa che non c'è nessuna urgenza, dal
punto di vista proprio delle scadenze, a liberare tanti dati.

utilizzabili, i dati dell'istat sono. ma preferisco inserire un dato
piu' corretto. un dato troppo grossolano come quello che ho trovato,
non lo metterei.

e non è come quando niccolo ha inserito in osm i toponimi, quelli sono
arbitrari, approssimati per definizione. ma i confini no, per quanto
mi riguarda non possono essere approssimati (oggetto di diatribe fra
comuni e province, si, ma non sbagliati).

Chiedo scusa se mi inserisco, partecipo davvero poco alla ML, ma mi occupo di qualita' del dato GIS da circa 15 anni.
  Per quanto riguarda la "precisione" dei confini, vorrei far presente che non esiste un dato PRECISO in assoluto, ma la precisione e' sempre funzione della scala di acquisizione del dato. Il dato preciso in assoluto e' quello reale, presente nello spazio "mondo" in scala 1:1, e senza soluzione di continuita'. Qualunque dato cartografico, discretizzato nel momento in cui e' stato acquisito, soffre di una approssimazione legata alla scala di acquisizione. Di conseguenze, e' giocoforza dover fare i conti con differenti precisioni su tutti gli elementi spaziali.
Quando si fanno analisi topologiche (vedi esempio che e' stato fatto precedentemente per l'uso del suolo da dati vettoriali in Olanda) si presume che si stiano confrontando topologicamente dataset che abbiano precisioni comparabili, e molte volte la stima delle discrepanze tra un dataset e l'altro va fatta proprio per validare il tipo di analisi topologica che si sta facendo: inutile pretendere di ottenere indici di variazione con un significato reale se si confrontano dataset non confrontabili... nella fattispecie, se le variazioni riscontrate sono piu' piccole degli ambiti di validita' dei singoli dataset, le variazioni tra dataset non hanno significato. Per questo ogni analisi andrebbe corredata da un test di significativita' (cosa che vedo fare davvero raramente). Troppo spesso ho visto colleghi geologi, tecnici GIS o simili che "se la prendevano" con chi aveva digitalizzato o fornito il dato (spesso con gli Enti pubblici), dimenticando di fare, a priori, un po' di stime sugli errori intrinseci dei dataset, legati inevitabilmente alla scala di acquisizione. C'e' ancora, troppo spesso, la pretesa di far valere in "assoluto" topologie che sono sempre dei "modelli", ovvero delle rappresentazioni approssimate della realta' e che non hanno mai una validita' assoluta. Inoltre ricordiamoci che non c'e' solo il problema della scala ma anche il problema della proiezione, della conversione tra sistemi di coordinate, dei modelli di elissoide, dei delta tra gli elissoidi e il geoide......
Insomma, i confini di Comuni e Provincie, da qualunque parte la prendi, in un modo o nell'altro saranno SEMPRE approssimati. Non "sbagliati", intendiamoci bene, ma approssimati negli ambiti di validita' del modello stesso.

Saluti

Marco - giro la tua risposta anche in lista talk-it (caso mai ti
mancasse, dato che ho visto che hai risposto solo a gfoss, si tratta
di una lista che raccoglie mappatori liberi legati dal collaborare
secondo logiche wiki nell'ambito del progetto OpenStreetMap)

dalla tua premessa mi viene da pensare che ci voglia una quindicina
d'anni per maturare questo tipo di linea di pensiero ? :wink:

battute a parte - grazie per gli ulteriori elementi di riflessione,
su cui concordo appieno.

buon fine settimana!

a.

2008/7/25 Marco Gualdrini <guald@worldonline.it>:

Il giorno 25/lug/08, alle ore 13:13, Simone Cortesi ha scritto:

2008/7/25 andrea giacomelli <pibinko@gmail.com>:

- allo stesso tempo stiamo vedendo che nessuno si sta lanciando a
confermare che i dati sono *proprio proprio* utilizzabili secondo
*procedure* definite, condivisibili, riusabili.
questo non è un problema, se si pensa che non c'è nessuna urgenza, dal
punto di vista proprio delle scadenze, a liberare tanti dati.

utilizzabili, i dati dell'istat sono. ma preferisco inserire un dato
piu' corretto. un dato troppo grossolano come quello che ho trovato,
non lo metterei.

e non è come quando niccolo ha inserito in osm i toponimi, quelli sono
arbitrari, approssimati per definizione. ma i confini no, per quanto
mi riguarda non possono essere approssimati (oggetto di diatribe fra
comuni e province, si, ma non sbagliati).

Chiedo scusa se mi inserisco, partecipo davvero poco alla ML, ma mi occupo
di qualita' del dato GIS da circa 15 anni.
Per quanto riguarda la "precisione" dei confini, vorrei far presente che
non esiste un dato PRECISO in assoluto, ma la precisione e' sempre funzione
della scala di acquisizione del dato. Il dato preciso in assoluto e' quello
reale, presente nello spazio "mondo" in scala 1:1, e senza soluzione di
continuita'. Qualunque dato cartografico, discretizzato nel momento in cui
e' stato acquisito, soffre di una approssimazione legata alla scala di
acquisizione. Di conseguenze, e' giocoforza dover fare i conti con
differenti precisioni su tutti gli elementi spaziali.
Quando si fanno analisi topologiche (vedi esempio che e' stato fatto
precedentemente per l'uso del suolo da dati vettoriali in Olanda) si presume
che si stiano confrontando topologicamente dataset che abbiano precisioni
comparabili, e molte volte la stima delle discrepanze tra un dataset e
l'altro va fatta proprio per validare il tipo di analisi topologica che si
sta facendo: inutile pretendere di ottenere indici di variazione con un
significato reale se si confrontano dataset non confrontabili... nella
fattispecie, se le variazioni riscontrate sono piu' piccole degli ambiti di
validita' dei singoli dataset, le variazioni tra dataset non hanno
significato. Per questo ogni analisi andrebbe corredata da un test di
significativita' (cosa che vedo fare davvero raramente). Troppo spesso ho
visto colleghi geologi, tecnici GIS o simili che "se la prendevano" con chi
aveva digitalizzato o fornito il dato (spesso con gli Enti pubblici),
dimenticando di fare, a priori, un po' di stime sugli errori intrinseci dei
dataset, legati inevitabilmente alla scala di acquisizione. C'e' ancora,
troppo spesso, la pretesa di far valere in "assoluto" topologie che sono
sempre dei "modelli", ovvero delle rappresentazioni approssimate della
realta' e che non hanno mai una validita' assoluta. Inoltre ricordiamoci che
non c'e' solo il problema della scala ma anche il problema della proiezione,
della conversione tra sistemi di coordinate, dei modelli di elissoide, dei
delta tra gli elissoidi e il geoide......
Insomma, i confini di Comuni e Provincie, da qualunque parte la prendi, in
un modo o nell'altro saranno SEMPRE approssimati. Non "sbagliati",
intendiamoci bene, ma approssimati negli ambiti di validita' del modello
stesso.

Saluti