[Gfoss] Facciamo un fork dei dati Istat?

Ciao, un'idea buttata la', giusto per parlarne:

Qualche tempo fa cercavo le coordinate GPS dei centri
abitati italiani

Ho avuto dall'Istat l'elenco di circa 8100 comuni. Ho anche le
coordinate di altre migliaia di centri abitati, anche
piccolissimi, sempre Istat. Il tutto con licenza praticamente CC.

Un riassunto e' qui:
http://paros.rigacci.org/wiki/doku.php/tecnica/gps_cartografia_gis/download

I problemi sono:

- Le modifiche dal 1991 ad oggi mancano (nuove province, ecc.)
- La toponomastica e' orribile: tutti i nomi in maiuscolo,
  apostrofi al posto degli accenti, ecc.

Ho lavorato un po' a manina e ho ripulito per quanto possibile i
dati (minuscole, accenti, ...).

Mi pare pero' che la manutenzione dei dati non sia fattibile per
un singolo. La speranza che Istat produca nuovi dati o accetti
bugfix dal basso e' scarsa.

Che ne pensate di metter su un wiki con questi waypoint, un
sistema di discussione/editing piu' o meno aperto per la
manutenzione/miglioramento dei dati?

--
Niccolo Rigacci
Firenze - Italy

Iraq, missione di pace: 61294 morti - www.iraqbodycount.net

Niccolo Rigacci ha scritto:

Ciao, un'idea buttata la', giusto per parlarne:

A me sembra una ottima idea :slight_smile:

Qualche tempo fa cercavo le coordinate GPS dei centri
abitati italiani

Ho avuto dall'Istat l'elenco di circa 8100 comuni. Ho anche le
coordinate di altre migliaia di centri abitati, anche
piccolissimi, sempre Istat. Il tutto con licenza praticamente CC.

Spiega meglio cosa intendi con "Il tutto con licenza *praticamente* CC"
E' il "praticamente" che mi sfugge: sono CC si e no?
E in caso che genere di CC?

Un riassunto e' qui:
http://paros.rigacci.org/wiki/doku.php/tecnica/gps_cartografia_gis/download

Fico :slight_smile:

I problemi sono:

[...]

Che ne pensate di metter su un wiki con questi waypoint, un
sistema di discussione/editing piu' o meno aperto per la
manutenzione/miglioramento dei dati?

Che e' una ottima idea.
Alcune osservazioni:
- non c'e' modo di far interagire questa base dati con geonames.org?
- qualora non sia possibile il punto sopra, si potrebbe pensare comunque
ad una serie di webservices per interagire con i dati
(vd http://www.geonames.org/export/)
- appoggiarsi a wikipedia?
- la coordinata del toponimo in base a cosa e' data?
(questo qualora la base dati cominci ad essere "indipendente" dall'ISTAT)

------------------
ITC -> dall'1 marzo 2007 Fondazione Bruno Kessler
ITC -> since 1 March 2007 Fondazione Bruno Kessler
------------------

- non c'e' modo di far interagire questa base dati con geonames.org?

Giusta, osservazione. Avevo a suo tempo ispezionato geonames.org,
i limiti mi parevano essere quelli di un wiki partito da zero:

- duplicazione di informazioni
- grosse lacune
- mancanza di uniformita' (c'e' il romitorio di Giangiacomo di
  Fralla e magari non c'e' qualcosa di piu' importante)

I dati da cui vorrei partire io invece hanno dalla loro parte una
completezza invidiabile, quello che serve e' una manutenzione che
non distrugga la qualita' iniziale.

Uno scambio da/verso geonames e/o wikipedia e' indubbiamente da
fare! Idee?

--
Niccolo Rigacci
Firenze - Italy

Iraq, missione di pace: 61294 morti - www.iraqbodycount.net

-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Piu' in generale, mi pare utile mantenere un server con tutti i dati
italiani liberi (incluso quindi landsat, ecc.). Ci vuole un po' di
investimento (banda, macchina, amministrazione), ma e' una cosa di
grande utilita' e visibilita', secondo me.
Un buon obiettivo per GFOSS.it, mi pare.
pc

Niccolo Rigacci ha scritto:

- non c'e' modo di far interagire questa base dati con geonames.org?

Giusta, osservazione. Avevo a suo tempo ispezionato geonames.org,
i limiti mi parevano essere quelli di un wiki partito da zero:

- duplicazione di informazioni
- grosse lacune
- mancanza di uniformita' (c'e' il romitorio di Giangiacomo di
  Fralla e magari non c'e' qualcosa di piu' importante)

I dati da cui vorrei partire io invece hanno dalla loro parte una
completezza invidiabile, quello che serve e' una manutenzione che
non distrugga la qualita' iniziale.

Uno scambio da/verso geonames e/o wikipedia e' indubbiamente da
fare! Idee?

- --
Paolo Cavallini
http://www.faunalia.it/pc
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.6 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iD8DBQFGIKM5/NedwLUzIr4RAhngAJ9utQx66haDyKc3zuGWaibdYJtIGgCff3gC
AhuDYO4RDhxhxUwPDL0oVZI=
=3Z4L
-----END PGP SIGNATURE-----

Il 14/04/07, Paolo Cavallini <cavallini@faunalia.it> ha scritto:

-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Piu’ in generale, mi pare utile mantenere un server con tutti i dati
italiani liberi (incluso quindi landsat, ecc.). Ci vuole un po’ di
investimento (banda, macchina, amministrazione), ma e’ una cosa di
grande utilita’ e visibilita’, secondo me.
Un buon obiettivo per GFOSS.it, mi pare.

si mi sembra un’ottima idea!
Ci sarebbero da inserire anche i dati scaricabili dalla regione Piemonte, anche se non sono di alta qualità possono servire…

pc

Luca

Il giorno sab, 14/04/2007 alle 11.37 +0200, Niccolo Rigacci ha scritto:

Uno scambio da/verso geonames e/o wikipedia e' indubbiamente da
fare! Idee?

http://dbpedia.org/docs/

Così su due piedi...
L'importante è tenere a mente l'importanza di dati consistenti e
machine-readable.

STeko
--
Stefano Costa
Jabber: steko@jabber.linux.it
http://www.iosa.it Open Archaeology
Io uso GNU/Linux!

Il giorno sab, 14/04/2007 alle 11.09 +0200, Maurizio Napolitano ha
scritto:

> Ho avuto dall'Istat l'elenco di circa 8100 comuni. Ho anche le
> coordinate di altre migliaia di centri abitati, anche
> piccolissimi, sempre Istat. Il tutto con licenza praticamente CC.

Spiega meglio cosa intendi con "Il tutto con licenza *praticamente* CC"
E' il "praticamente" che mi sfugge: sono CC si e no?
E in caso che genere di CC?

Tanto per essere noioso... non valgono le stesse considerazioni che ho
fatto per i confini amministrativi?

Sarebbe il caso di chiedere lumi all'ISTAT, magari con il supporto di
qualcuno che capisca di diritto d'autore & affini.

Vedo un po' cosa posso inventarmi. Chi ha tempo può mettere su una
pagina del wiki al riguardo?

Steko
--
Stefano Costa
Jabber: steko@jabber.linux.it
http://www.iosa.it Open Archaeology
Io uso GNU/Linux!

http://wikimapia.org/ ??

pg

On 4/14/07, Stefano Costa <steko@iosa.it > wrote:

Il giorno sab, 14/04/2007 alle 11.37 +0200, Niccolo Rigacci ha scritto:

Uno scambio da/verso geonames e/o wikipedia e’ indubbiamente da
fare! Idee?

http://dbpedia.org/docs/

Così su due piedi…
L’importante è tenere a mente l’importanza di dati consistenti e
machine-readable.

STeko

Stefano Costa
Jabber: steko@jabber.linux.it
http://www.iosa.it Open Archaeology
Io uso GNU/Linux!


Gfoss mailing list
Gfoss@faunalia.com
http://www.faunalia.com/cgi-bin/mailman/listinfo/gfoss


Piergiorgio Cipriano
pg.cipriano@gmail.com

Paolo Cavallini ha scritto:

Piu' in generale, mi pare utile mantenere un server con tutti i dati
italiani liberi (incluso quindi landsat, ecc.). Ci vuole un po' di
investimento (banda, macchina, amministrazione), ma e' una cosa di
grande utilita' e visibilita', secondo me.
Un buon obiettivo per GFOSS.it, mi pare.
pc

Condivido l'idea.
A questo punto pero' il progetto si allarga notevolmente.
Oltre calle questioni di investimento che hai fatto, occorre allora
pensare anche agli strumenti.
A questo punto forse, le osservazioni che ho fatto io a Nicola, non
hanno piu' senso e conviene prendere una propria strada.

Si potrebbe anche pensare a qualche strumento e/o gioco per favorire la
raccolta di dati.
Sto pensando a progetti come geocaching o http://www.giscover.com/

... una cosa alla volta pero' :slight_smile:

Ciao

------------------
ITC -> dall'1 marzo 2007 Fondazione Bruno Kessler
ITC -> since 1 March 2007 Fondazione Bruno Kessler
------------------

On Sat, Apr 14, 2007 at 11:09:01AM +0200, Maurizio Napolitano wrote:

Niccolo Rigacci ha scritto:

...

> Che ne pensate di metter su un wiki con questi waypoint, un
> sistema di discussione/editing piu' o meno aperto per la
> manutenzione/miglioramento dei dati?

Che e' una ottima idea.
Alcune osservazioni:
- non c'e' modo di far interagire questa base dati con geonames.org?

Una integrazione con geonames.org sarebbe ottimo.

- qualora non sia possibile il punto sopra, si potrebbe pensare comunque
ad una serie di webservices per interagire con i dati
(vd http://www.geonames.org/export/)

Gia' fatto :slight_smile:
http://wiki.osgeo.org/index.php/Geodata_Repository#PostGIS_serving_vector_data
* graphical overview via MapServer
* WMS GetCapabilities and WFS GetCapabilities
* GeoNames: Complete content of the "allCountries" export table
  - populated places aggiunti + schema

ciao
markus

- appoggiarsi a wikipedia?
- la coordinata del toponimo in base a cosa e' data?
(questo qualora la base dati cominci ad essere "indipendente" dall'ISTAT)

------------------
ITC -> dall'1 marzo 2007 Fondazione Bruno Kessler
ITC -> since 1 March 2007 Fondazione Bruno Kessler
------------------

--
Markus Neteler <neteler itc it> http://mpa.itc.it/markus/
FBK-irst - Centro per la Ricerca Scientifica e Tecnologica
MPBA - Predictive Models for Biol. & Environ. Data Analysis
Via Sommarive, 18 - 38050 Povo (Trento), Italy

------------------
ITC -> dall'1 marzo 2007 Fondazione Bruno Kessler
ITC -> since 1 March 2007 Fondazione Bruno Kessler
------------------

Spiega meglio cosa intendi con "Il tutto con licenza *praticamente* CC"
E' il "praticamente" che mi sfugge: sono CC si e no?
E in caso che genere di CC?

Testuale quello che mi hanno detto all'Istat:

Date: 13 Jul 2005

I dati che le ho trasmesso vengono diffusi dall'Istat senza
licenza d'uso e possono essere citati purché se ne indichi la
fonte Istat.

Cordiali saluti.

Maria Polsoni
Istituto nazionale di statistica
Direzione centrale per la diffusione della cultura
e dell'informazione statistica
Servizio sistema informativo diffusione e servizi
all'utenza - Sid/b
Tel. +39 06 46733269
Fax +39 06 46733477
mail to richieste.dati@istat.it

Io direi che e' una "CC-BY".

--
Niccolo Rigacci
Firenze - Italy

Iraq, missione di pace: 61294 morti - www.iraqbodycount.net

Continuo lo sproloquio in pubblico...

Necessità del fork
------------------------------
- Dati Istat aggiornati al 1991, gli (eventuali)
  aggiornamenti non sono disponibili in tempo reale.
  Nuove province, residenti, coordinate più precise, ecc.

- La comunità non può intervenire per migliorare i
  dati Istat. In caso di nuovo rilascio da parte di
  Istat gli interventi migliorativi vanno persi.
  Es. tutto il lavoro che ho fatto per la correzione dei
  toponimi; l'Istat ha ancora dati in maiuscolo con gli
  apostrofi al posto dell'accento (es. VESTIGNE') oppure
  sconosce l'uso dell'accento acuto (Gressoney La Trinitè
  invece di Gressoney La Trinité).

- I dati Istat non sono disponibili in download
  facile e rapido.

I dati in mio possesso sono 8100 record completi (escluso il
collegamento a Wikipedia e Geonames) più un totale di 51594
centri abitati minori (privi del numero di residenti e
col toponimo da normalizzare).

Questo il tracciato record che ho buttato giù:

Centro abitato
------------------------------
- ID
- Tipo
- Toponimo
- idprovincia (codice Istat)
- idcomune (codice Istat)
- idcentro (codice Istat)
- Coordinate
- Residenti
- Collegamento a it.wikipedia.org
- Collegamento a www.geonames.org

Tipo di centro abitato
------------------------------
- Capoluogo di regione
- Capoluogo di provincia
- Capoluogo comunale
- Centro abitato

Province
------------------------------
- idprovincia (codice Istat)
- idregione (codice Istat)
- Toponimo
- Residenti

Regioni
------------------------------
- idregione (codice Istat)
- Toponimo

Relazione con la categoria "Comuni italiani" di it.wikipedia.org
--------------------------------------------------------------------
Valore aggiunto rispetto a Wikipedia:
- Download del database facile e veloce
- Visualizzazione su mappa (una libera e una Google map)
- Accesso tramite WFS

E' immaginabile uno strumento automatico per verificare
l'allineamento dei dati, segnalando i casi di
differenza/incompletezza (con logica fuzzy?).

Lo scambio di informazioni da e verso wikipedia potrebbe
essere effettuato con strumenti semiautomatici.

Relazione con www.geonames.org
--------------------------------------------------------------------
Valore aggiunto rispetto a Geonames:
- Dati non presenti in Geonames (appartenenza a
  provincia/regione, residenti, ...).
- Base dati di partenza più completa e controllata.

E' immaginabile uno strumento automatico che verifichi la
presenza del dato Istat su Geonames (un po' di fuzzy su
toponimo e coordinate) e provveda a caricare su Geonames
i dati mancanti.

Non credo che sia immaginabile il viceversa: i dati di Geonames
sono poco dettagliati per poter arricchire il database Istat.

--
Niccolo Rigacci
Firenze - Italy

Iraq, missione di pace: 61294 morti - www.iraqbodycount.net

ottima sintesi niccolò - qua c’è materiale per tre giorni di ragionamenti. bisogna che me la stampi!

l’idea è molto buona e vale la pena elaborarla un poco: far emergere note, potenziali problemi di manutenzione (ad es. i codici istat dei comuni possono cambiare nel tempo), di trattamento intermedio (correzioni) e di consultazione (posti con più nomi, bilinguismi ecc).

l’idea può essere realizzata in una settimana come 2 anni di lavoro…

due cose che farei prima di attivarsi

(a) decidiamo prima qual è l’obiettivo di questo database.
(b) capiamo chi c’è e chi non c’è per supportarne il raggiungimento.

penso che la cosa funzioni meglio via wiki. Paolo: si apre una paginetta ?

…io un un elenco di toponimi scaricato nel 1999 o giù di lì, e ce ne sono trenta e rotti mila…sarei molto curioso di incrociarlo con i cinquantuno e rotti di ora.

a presto

andrea, noto pibinko
http://pibinko.altervista.org

Il 14/04/07, Niccolo Rigacci <niccolo@rigacci.org > ha scritto:

Continuo lo sproloquio in pubblico…

Necessità del fork

  • Dati Istat aggiornati al 1991, gli (eventuali)
    aggiornamenti non sono disponibili in tempo reale.
    Nuove province, residenti, coordinate più precise, ecc.

  • La comunità non può intervenire per migliorare i
    dati Istat. In caso di nuovo rilascio da parte di
    Istat gli interventi migliorativi vanno persi.
    Es. tutto il lavoro che ho fatto per la correzione dei
    toponimi; l’Istat ha ancora dati in maiuscolo con gli
    apostrofi al posto dell’accento (es. VESTIGNE’) oppure
    sconosce l’uso dell’accento acuto (Gressoney La Trinitè
    invece di Gressoney La Trinité).

  • I dati Istat non sono disponibili in download
    facile e rapido.

I dati in mio possesso sono 8100 record completi (escluso il
collegamento a Wikipedia e Geonames) più un totale di 51594
centri abitati minori (privi del numero di residenti e
col toponimo da normalizzare).

Questo il tracciato record che ho buttato giù:

Centro abitato

  • ID
  • Tipo
  • Toponimo
  • idprovincia (codice Istat)
  • idcomune (codice Istat)
  • idcentro (codice Istat)
  • Coordinate
  • Residenti
  • Collegamento a it.wikipedia.org
  • Collegamento a www.geonames.org

Tipo di centro abitato

  • Capoluogo di regione
  • Capoluogo di provincia
  • Capoluogo comunale
  • Centro abitato

Province

  • idprovincia (codice Istat)
  • idregione (codice Istat)
  • Toponimo
  • Residenti

Regioni

  • idregione (codice Istat)
  • Toponimo

Relazione con la categoria “Comuni italiani” di it.wikipedia.org

Valore aggiunto rispetto a Wikipedia:

  • Download del database facile e veloce
  • Visualizzazione su mappa (una libera e una Google map)
  • Accesso tramite WFS

E’ immaginabile uno strumento automatico per verificare
l’allineamento dei dati, segnalando i casi di
differenza/incompletezza (con logica fuzzy?).

Lo scambio di informazioni da e verso wikipedia potrebbe
essere effettuato con strumenti semiautomatici.

Relazione con www.geonames.org

Valore aggiunto rispetto a Geonames:

  • Dati non presenti in Geonames (appartenenza a
    provincia/regione, residenti, …).
  • Base dati di partenza più completa e controllata.

E’ immaginabile uno strumento automatico che verifichi la
presenza del dato Istat su Geonames (un po’ di fuzzy su
toponimo e coordinate) e provveda a caricare su Geonames
i dati mancanti.

Non credo che sia immaginabile il viceversa: i dati di Geonames
sono poco dettagliati per poter arricchire il database Istat.


Niccolo Rigacci
Firenze - Italy

Iraq, missione di pace: 61294 morti - www.iraqbodycount.net


Gfoss mailing list
Gfoss@faunalia.com
http://www.faunalia.com/cgi-bin/mailman/listinfo/gfoss

Posso contribuire? Ho fatto anch'io un paziente lavoro di revisione di dati di provenienza Istat, scaricati nel 2002 dal sito di una scuola, e che oggi non saprei più come ripescare: i file principali si chiamavano el_com2000.xls, coordina.dat... Ho corretto accenti e maiuscole a tutti i toponimi delle 59671 località di cui ho le coordinate, inoltre, con l'aiuto di altre informazioni effettivamente scaricabili dal sito Istat, ho aggiornato tutti i dati per tenere conto dell'istituzione di nuove province, istituzioni di nuovi comuni, accorpamenti di comuni e variazioni di circoscrizioni comunali almeno fino al 2005. Insomma, credo di aver percorso un pezzo di strada in più di Niccolo, e che la base di dati in mio possesso (custodita ora in un DB Postgis) possa essere un buon punto di partenza per un progetto del genere, che va ben al di là dello scopo per il quale mi ero messo in cerca dei dati.

L'idea di una base di dati collaborativa, aggiornabile on line "à la wiki" mi sembra quanto mai appropriata, anche perché per certi versi quei dati lasciano un po' a desiderare: non si capisce come mai di certi comuni sono riportate tutte le cascine mentre di altri non ci sono nemmeno le frazioni!

Rimango a disposizione... per adesso, buona notte!

Guido
Nerviano MI
aka guido.piazzi@{parcoticino|studenti.unimi}.it

(a) decidiamo prima qual è l'obiettivo di questo database.

Per me l'obiettivo e' disegnare una mappa (libera) dell'Italia,
tra le scale 1:50.000 e 1:200.000 e metterci un centroide o
qualcosa del genere per i centri abitati.

(b) capiamo chi c'è e chi non c'è per supportarne il raggiungimento.

Per il setup iniziale io ci sono: database, wiki, qualche script
che monitorizzi il sync con geonames e wikipedia, hosting
mediamente affidabile.

A conferma che Wikipedia non e' adattissima a trattare questi
dati ho appena scovato e corretto alcuni errori sul numero dei
residenti in http://it.wikipedia.org/wiki/Provincia_italiana.
Inoltre c'e' una tabella con un bel totale in fondo, secondo voi
quante probabilita' ci sono che sia errato?

...io un un elenco di toponimi scaricato nel 1999 o giù di lì,
e ce ne sono trenta e rotti mila...sarei molto curioso di
incrociarlo con i cinquantuno e rotti di ora.

Solo toponimi o anche le coordinate? Io ho le coordinate, alcune
alquanto particolari come questa (perdonate il sessismo!):

http://maps.google.com/maps?q=44.15360+10.01790

Io ci sono stato. Se volete vi racconto.

--
Niccolo Rigacci
Firenze - Italy

Iraq, missione di pace: 61391 morti - www.iraqbodycount.net

ciao Niccolò,

  • dei 30 e rotti mila ho anche le coordinate (ma penso anche gli altri elenchi di cui si parla :wink: .)

  • una precisazione: quando mi riferivo all’utilità di usare un wiki, non intendevo per il “servizio”, ma per scrivere il “progetto”.

a dopo!

pibinko


A conferma che Wikipedia non e’ adattissima a trattare questi
dati ho appena scovato e corretto alcuni errori sul numero dei
residenti in http://it.wikipedia.org/wiki/Provincia_italiana.
Inoltre c’e’ una tabella con un bel totale in fondo, secondo voi
quante probabilita’ ci sono che sia errato?

…io ho un un elenco di toponimi scaricato nel 1999 o giù di lì,
e ce ne sono trenta e rotti mila…sarei molto curioso di
incrociarlo con i cinquantuno e rotti di ora.

Solo toponimi o anche le coordinate? Io ho le coordinate, alcune
alquanto particolari come questa (perdonate il sessismo!):

http://maps.google.com/maps?q=44.15360+10.01790

Io ci sono stato. Se volete vi racconto.


Niccolo Rigacci
Firenze - Italy

Iraq, missione di pace: 61391 morti - www.iraqbodycount.net


Gfoss mailing list
Gfoss@faunalia.com
http://www.faunalia.com/cgi-bin/mailman/listinfo/gfoss

On Sat, 2007-04-14 at 12:27 +0200, Maurizio Napolitano wrote:

A questo punto pero' il progetto si allarga notevolmente.

L'unico punto da chiarire è la questione legale, mentre quella
tecnica/tecnologica è secondaria IMHO.

Come FSFE abbiamo ripreso e pubblicato l'elenco dei CAP italiani, dato
pubblico per eccellenza (facendo innervosire Poste Italiane). Con ISTAT
si potrebbe fare una manovra simile. Se alla neonata GFOSS serve
supporto legale FSFE Italia può offrirlo, basta chiederlo :slight_smile:

bye
stef

-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Ottimo!
Pero' secondo me l'aspetto legale e quello tecnico devono andare in
tandem, nel senso che prima si definisce la licenza di un dato (lo si
"libera" ufficialmente), subito dopo va reso effettivamente disponibile
(visibile e scaricabile).
Grazie dell'offerta di aiuto prezioso.
Potete cominciare dall'istat con l'analisi legale?
Saluti.
pc

Stefano Maffulli ha scritto:

On Sat, 2007-04-14 at 12:27 +0200, Maurizio Napolitano wrote:

A questo punto pero' il progetto si allarga notevolmente.

L'unico punto da chiarire è la questione legale, mentre quella
tecnica/tecnologica è secondaria IMHO.

Come FSFE abbiamo ripreso e pubblicato l'elenco dei CAP italiani, dato
pubblico per eccellenza (facendo innervosire Poste Italiane). Con ISTAT
si potrebbe fare una manovra simile. Se alla neonata GFOSS serve
supporto legale FSFE Italia può offrirlo, basta chiederlo :slight_smile:

bye
stef

_______________________________________________
Gfoss mailing list
Gfoss@faunalia.com
http://www.faunalia.com/cgi-bin/mailman/listinfo/gfoss

- --
Paolo Cavallini
http://www.faunalia.it/pc
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.6 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iD8DBQFGIyXf/NedwLUzIr4RAnq7AJ4hIXvnygJBFOH+IbkJ0l8sW/8IcACgoYR4
4ukWuDBmxOVb5DYkWO0xJGI=
=pzI2
-----END PGP SIGNATURE-----

Scrive Niccolo Rigacci <niccolo@rigacci.org>:

> I dati che le ho trasmesso vengono diffusi dall'Istat senza
> licenza d'uso e possono essere citati purché se ne indichi la
> fonte Istat.
>
Io direi che e' una "CC-BY".

"senza licenza d'uso" non è molto adatto a essere definito come Creative
Commons. Io preferirei che fossero definiti come una specie di Public Domain
(all'italiana, certo.. però!). Sarebbe un primo passo per far capire alla PA in
che direzione è utile muoversi.

my 2¢

Steko

--
Stefano Costa
http://www.iosa.it * Software Libero per l'Archeologia
Jabber: steko@jabber.linux.it

----------------------------------------------------------------
This message was sent using IMP, the Internet Messaging Program.

Concordo con pibinko.
Multilinguismo (che non si limita solo ad Alto-Adige, Val d’Aosta e Sardegna, ma bene o male interessa tutte le Regioni) e multidizione (per lo stesso luogo più nomi da fonti diverse).

Niccolo, perchè dici che i dati ISTAT sono al 1991 e non scaricabili?
Almeno per i Comuni (non per le località): … http://www.istat.it/ambiente/cartografia/
(rimangono problemi di accenti/apostrofi)
Qualche dubbio (anche se prematuro):

  • tracciato / modellodati: coordinate … quale SRS? solo wgs84 e per tutti? perchè i residenti?
  • WFS o WFS-G (che è ancora in discussione e si prevedono possibili modifiche in ISO19112 derivanti dal DT data specification di Inspire)
  • altri accessi? es. SOAP/WSDL?

pg

pg

On 4/15/07, andrea giacomelli <pibinko@gmail.com> wrote:

ottima sintesi niccolò - qua c’è materiale per tre giorni di ragionamenti. bisogna che me la stampi!

l’idea è molto buona e vale la pena elaborarla un poco: far emergere note, potenziali problemi di manutenzione (ad es. i codici istat dei comuni possono cambiare nel tempo), di trattamento intermedio (correzioni) e di consultazione (posti con più nomi, bilinguismi ecc).

l’idea può essere realizzata in una settimana come 2 anni di lavoro…

due cose che farei prima di attivarsi

(a) decidiamo prima qual è l’obiettivo di questo database.
(b) capiamo chi c’è e chi non c’è per supportarne il raggiungimento.

penso che la cosa funzioni meglio via wiki. Paolo: si apre una paginetta ?

…io un un elenco di toponimi scaricato nel 1999 o giù di lì, e ce ne sono trenta e rotti mila…sarei molto curioso di incrociarlo con i cinquantuno e rotti di ora.

a presto

andrea, noto pibinko
http://pibinko.altervista.org

Il 14/04/07, Niccolo Rigacci <niccolo@rigacci.org > ha scritto:

Continuo lo sproloquio in pubblico…

Necessità del fork

  • Dati Istat aggiornati al 1991, gli (eventuali)
    aggiornamenti non sono disponibili in tempo reale.
    Nuove province, residenti, coordinate più precise, ecc.

  • La comunità non può intervenire per migliorare i
    dati Istat. In caso di nuovo rilascio da parte di
    Istat gli interventi migliorativi vanno persi.
    Es. tutto il lavoro che ho fatto per la correzione dei
    toponimi; l’Istat ha ancora dati in maiuscolo con gli
    apostrofi al posto dell’accento (es. VESTIGNE’) oppure
    sconosce l’uso dell’accento acuto (Gressoney La Trinitè
    invece di Gressoney La Trinité).

  • I dati Istat non sono disponibili in download
    facile e rapido.

I dati in mio possesso sono 8100 record completi (escluso il
collegamento a Wikipedia e Geonames) più un totale di 51594
centri abitati minori (privi del numero di residenti e
col toponimo da normalizzare).

Questo il tracciato record che ho buttato giù:

Centro abitato

  • ID
  • Tipo
  • Toponimo
  • idprovincia (codice Istat)
  • idcomune (codice Istat)
  • idcentro (codice Istat)
  • Coordinate
  • Residenti
  • Collegamento a it.wikipedia.org
  • Collegamento a www.geonames.org

Tipo di centro abitato

  • Capoluogo di regione
  • Capoluogo di provincia
  • Capoluogo comunale
  • Centro abitato

Province

  • idprovincia (codice Istat)
  • idregione (codice Istat)
  • Toponimo
  • Residenti

Regioni

  • idregione (codice Istat)
  • Toponimo

Relazione con la categoria “Comuni italiani” di it.wikipedia.org

Valore aggiunto rispetto a Wikipedia:

  • Download del database facile e veloce
  • Visualizzazione su mappa (una libera e una Google map)
  • Accesso tramite WFS

E’ immaginabile uno strumento automatico per verificare
l’allineamento dei dati, segnalando i casi di
differenza/incompletezza (con logica fuzzy?).

Lo scambio di informazioni da e verso wikipedia potrebbe
essere effettuato con strumenti semiautomatici.

Relazione con www.geonames.org

Valore aggiunto rispetto a Geonames:

  • Dati non presenti in Geonames (appartenenza a
    provincia/regione, residenti, …).
  • Base dati di partenza più completa e controllata.

E’ immaginabile uno strumento automatico che verifichi la
presenza del dato Istat su Geonames (un po’ di fuzzy su
toponimo e coordinate) e provveda a caricare su Geonames
i dati mancanti.

Non credo che sia immaginabile il viceversa: i dati di Geonames
sono poco dettagliati per poter arricchire il database Istat.


Niccolo Rigacci
Firenze - Italy

Iraq, missione di pace: 61294 morti - www.iraqbodycount.net


Gfoss mailing list
Gfoss@faunalia.com
http://www.faunalia.com/cgi-bin/mailman/listinfo/gfoss


Gfoss mailing list
Gfoss@faunalia.com
http://www.faunalia.com/cgi-bin/mailman/listinfo/gfoss


Piergiorgio Cipriano
pg.cipriano@gmail.com