[Gfoss] Geonames Premium

http://www.geonames.org/products/premium-dump.html

Dati geografici commerciali basati sul più grande database di toponimi
libero.

Un modello di business interessante.

Ciao
steko

--
Stefano Costa
http://www.iosa.it/ Open Archaeology

Stefano
l’impressione è che geonames standard non sia usabile per fini professionali, mentre quella premium sì. A quel punto la differenza col mondo commerciale svanisce.

The GeoNames Monthly Premium Data is a high quality release that has passed a huge number of consistency checks. The modifications and differences to the previous data release have been monitored and verified by members of the GeoNames team. The Monthly Premium Data is an excellent choice for enterprise users. Applications using the Premium Data can reduce their own consistency checks and let the GeoNames team to this job.
The Premium Data Subscription covers the toponyms, the postal code files are not yet available as premium offering.

Sbaglio l’interpretazione?

Ciao
Cristoforo

On Mon, 08 Nov 2010 10:29:16 +0100, Cristoforo Abbattista wrote

Stefano
l’impressione è che geonames standard non sia usabile per fini professionali, mentre quella premium sì. A quel punto la differenza col mondo commerciale svanisce.

The GeoNames Monthly Premium Data is a high quality release that has passed a huge number of consistency checks. The modifications and differences to the previous data release have been monitored and verified by members of the GeoNames team. The Monthly Premium Data is an excellent choice for enterprise users. Applications using the Premium Data can reduce their own consistency checks and let the GeoNames team to this job.
> The Premium Data Subscription covers the toponyms, the postal code files are not yet available as premium offering.
>
Sbaglio l’interpretazione?

secondo me anche GeoNames standard lo puoi usare
tranquillamente per qualsiasi uso (compreso quelli
professionali/commerciali).
infatti è rilasciato sotto CC-by-attribution, quindi
basta semplicemente che tutte le volte che riutilizzi
il dato tu indichi esplicitamente la fonte.

ma visto che proprio in questo momento sto
facendo delle prove su GeoNames, devo segnalare
che spesso nel dataset ci sono delle gran belle
frescacce:

a) ho sottoestratto tutti i toponimi con Country=“IT”:
mi trovo un centinaio di punti sparsi in mezzo
all’atlantico, nel nord europa, in africa e nei balcani :frowning:
b) vado ad esplorare i dintorni di Arezzo: ci trovo
qualche ameno paesello che in effetti invece
si trova nella maremma grossetana.

insomma, una gran bella mole di dati, sicuramente
utile ed interessante, ma da prendere comunque
cum grano salis …

chissà mai se la Premium invece è verificata in maniera
un po’ più affidabile: però (se fosse veramente così)
non la troverei una gran bela cosa, perchè vorrebbe
dire in soldoni:

  • puoi avere liberamente un dataset incasinato
  • se invece vuoi quello pulito te lo devi pagare :frowning:

ciao Sandro

On Mon, Nov 08, 2010 at 10:29:16AM +0100, Cristoforo Abbattista wrote:

Stefano
l'impressione è che geonames standard non sia usabile per fini
professionali, mentre quella premium sì. A quel punto la differenza col
mondo commerciale svanisce.

Intendi dire la differenza con il mondo proprietario?

Sarebbe interessante capire la relazione tra la licenza di
Geonames standard (parrebbe CC-By) e la licenza di Geonames
Premium.

Mi pare di capire che quest'ultima non sia libera.

Quindi il modello sarebbe questo: raccogliere dati con licenza
libera (ma non virale/reciproca), ripulirli, applicare una
licenza non libera e quindi distribuirli.

Visto che Gfoss risulta tra le fonti [1] dei dati liberi,
potremmo discutere se questo modello ci piace o meno.

[1] http://www.geonames.org/data-sources.html

--
Niccolo Rigacci
Firenze - Italy

Per chiarezza, le conclusioni di Sandro sono esattamente quello che volevo intendere con la mia eMail.

Chiedo inoltre venia, ho usato “commerciale” per “proprietario”

2010/11/8 <a.furieri@lqt.it>:

ma visto che proprio in questo momento sto
facendo delle prove su GeoNames, devo segnalare
che spesso nel dataset ci sono delle gran belle
frescacce: ...

Non ho mai avuto accesso alla versione Premium, ma dubito che sia
molto meglio di quella standard. Per quanto potenti, i vari controlli
automatici non possono correggere gli errori che riscontro piu` di
frequente.

In particolare, ho accumulato una certa esperienza per quel che
riguarda le zone di montagna (nomi di cime, altitudini, etc.) e, a
meno di interventi correttivi significativi da parte della comunita`
degli utenti o di casi particolarmente favorevoli (ad es. USA,
Svizzera), i dati non sono molto precisi. In molte zone ci sono solo
le cime piu` importanti, spesso con un errore di posizionamento
nell'ordine delle centinaia di metri e con altitudine derivata da
GTopo30.

insomma, una gran bella mole di dati, sicuramente
utile ed interessante, ma da prendere comunque
cum grano salis ....

confermo e, come gia` detto, dubito che la versione Premium possa
essere significativamente migliore...

michele

On Mon, 8 Nov 2010 10:45:48 +0100, Niccolo Rigacci wrote

Quindi il modello sarebbe questo: raccogliere dati con licenza
libera (ma non virale/reciproca), ripulirli, applicare una
licenza non libera e quindi distribuirli.

Visto che Gfoss risulta tra le fonti [1] dei dati liberi,
potremmo discutere se questo modello ci piace o meno.

[1] http://www.geonames.org/data-sources.html

Niccolo,
condivido pienamente il tuo malessere.

attenzione però a non darci la zappa sui piedi
da soli: mi spiego meglio ...

se una licenza è libera ma non virale (come la
CC-by), è del tutto legittimo (anche se sicuramente
antipatico) fare un'operazione di quel tipo.
Saranno poi evidentemente le condizioni sul libero
mercato che porteranno casomai un sacco di utenti
a dire "No grazie: preferisco usare la versione
free (e magari sono anche disposto a rendendermi
parte attiva per migliorarla, sia per me che tutti
gli altri)"

Se fossimo noi stessi a lamentarci per primi di questo
stato di cose, rischieremmo di portare acqua al mulino
delle argomentazioni di quegli Enti Pubblici che
sostengono:
"uso libero dei miei dati SI, purchè sia escluso
qualsiasi utilizzo commerciale"

ma noi (come GFOSS.it) stiamo invece facendo grossi
sforzi per superare questa posizione, no ?

morale genuina: possibilmente evitare di rilasciare i
dati sotto CC-by 'liscia', proprio perchè c'è il rischio
che qualche "furbetto" poi li "privatizzi" a proprio uso
e consumo.
sicuramente la CC-by-SA rappresenta un'opzione di gran
lunga migliore, perchè quanto meno obbliga a redistribuire
liberamente anche i lavori derivati.
lezione da tenere presente il futuro :slight_smile:

ciao Sandro

On Mon, Nov 08, 2010 at 11:45:29AM +0100, a.furieri@lqt.it wrote:

se una licenza è libera ma non virale (come la
CC-by), è del tutto legittimo (anche se sicuramente
antipatico) fare un'operazione di quel tipo.
Saranno poi evidentemente le condizioni sul libero
mercato che porteranno casomai un sacco di utenti
a dire "No grazie: preferisco usare la versione
free (e magari sono anche disposto a rendendermi
parte attiva per migliorarla, sia per me che tutti
gli altri)"

Temo di dover condividere, ed e' esattamente per questo motivo
che licenziare BSD non e' cosa che io gradisca. Una licenza
che fa la felicita' della Microsoft, ma non certo dei
copyright holder. La CC-by-attribution e' esattamente
lo stesso tipo di oggetto.

--
Francesco P. Lovergine

Temo di dover condividere, ed e' esattamente per questo motivo
che licenziare BSD non e' cosa che io gradisca. Una licenza
che fa la felicita' della Microsoft, ma non certo dei
copyright holder. La CC-by-attribution e' esattamente
lo stesso tipo di oggetto.

sicuramente una non copyleft espone un software OS all'eventuale
utilizzo commerciale (inteso come proprietario). D'altro canto e'
altrettanto vero che in qualche caso tale utilizzo puo' portare
sovente a situazioni benefiche quali ad es. un maggiore interesse del
software, e, di riflesso, a delle sue migliorie.
Mi viene in mente l'esempio di GDAL inserita nella suite Esri:
l'utilizzo di tale libreria da parte di Esri ha portato a un
finanziamento che ha consentito sviluppi aggiuntivi su GDAL, con
beneficio di tutta l'utenza (e chiaramente degli sviluppatori, anzi
dello sviluppatore, in questo caso).
Chiaramente dipende dai casi, perche' l'esempio citato e' una libreria
che e' un colosso sul settore GIS. Per piccoli software/componenti,
licenziare senza una virale potrebbe essere un cane che si morde la
coda.

ciao
P

--
Paolo Corti
GIS specialist and web developer
web: http://www.paolocorti.net
twitter: @paolo_corti

2010/11/8 <a.furieri@lqt.it>:
...

ma visto che proprio in questo momento sto
facendo delle prove su GeoNames, devo segnalare
che spesso nel dataset ci sono delle gran belle
frescacce:

a) ho sottoestratto tutti i toponimi con Country="IT":
mi trovo un centinaio di punti sparsi in mezzo
all'atlantico, nel nord europa, in africa e nei balcani :frowning:

Questi dati sono con altissima probabilita' dal
GNS americano (militare) che hanno un sacco
di inversione numeri etc x le coordinate.... con un po di
fatica si potrebbe sistemare.

b) vado ad esplorare i dintorni di Arezzo: ci trovo
qualche ameno paesello che in effetti invece
si trova nella maremma grossetana.

apparentemente il militare USA aveva inserito una
parte delle coordinate a mano (non GPS).. :slight_smile:

insomma, una gran bella mole di dati, sicuramente
utile ed interessante, ma da prendere comunque
cum grano salis ....

In primis pasta un "v.overlay" in GRASS (o quello che
volete) con l'italia ISTAT per scartare i punti fuori.
Per il resto magari qualche verifica con altri sistemi in
maniera automatica?

ciao
Markus

- OT perché questa lista si occupa prevalentemente
di argomenti strettamente connessi con il GIS
- "mica tanto" perché immagino che comunque un
gran numero di noi deve via via occuparsi della
gestione di qualche WebServer

ho appena scoperto, abbastanza casualmente, che
SpatialiteGui può essere un valido strumento
per analizzare un LOG-File di Apache (yes!!!)

------------------------------------------------

a) si attiva il tool "Virtual CSV/TXT"
b) si seleziona il path del LOG-File
c) le altre impostazioni da utilizzare sono:
   "first line contains column names" = NO
   "text separator" = DOUBLE QUOTES
   "column separator" = SPACE
   "decimal separator" = POINT
   "charset encoding" = UTF-8

dopo di che è facilissimo interrogare il
LogFile via SQL
P.Es. è possibile scoprire immediatamente
quante connessioni si sono verificate per
ciascun indirizzo IP di origine:
SELECT COL001, Count(*) FROM AccessLog
GROUP BY COL001 ORDER BY 2 DESC;

oppure quanti/quali "accessi strani" si
sono verificati:
SELECT * FROM AccessLog
WHERE COL007 != 200;

quante volte è stato scaricata una certa
risorsa:
SELECT Count(*) FROM AccessLog
WHERE COL006 LIKE '%index.html%';

qual'è il browser preferito dei nostri
utenti:
SELECT Count(*) FROM AccessLog
WHERE COL010 LIKE '%firefox%';
SELECT Count(*) FROM AccessLog
WHERE COL010 LIKE '%safari%';
SELECT Count(*) FROM AccessLog
WHERE COL010 LIKE '%chrome%';
SELECT Count(*) FROM AccessLog
WHERE COL010 LIKE '%opera%';
SELECT Count(*) FROM AccessLog
WHERE COL010 LIKE '%MSIE 6%';
SELECT Count(*) FROM AccessLog
WHERE COL010 LIKE '%MSIE 7%';
SELECT Count(*) FROM AccessLog
WHERE COL010 LIKE '%MSIE 8%';

sempre buono a sapersi, no ?

ciao Sandro

On Mon, Nov 08, 2010 at 06:47:04PM +0100, a.furieri@lqt.it wrote:

SELECT Count(*) FROM AccessLog
WHERE COL010 LIKE '%firefox%';
SELECT Count(*) FROM AccessLog
WHERE COL010 LIKE '%safari%';
SELECT Count(*) FROM AccessLog
WHERE COL010 LIKE '%chrome%';
SELECT Count(*) FROM AccessLog
WHERE COL010 LIKE '%opera%';
SELECT Count(*) FROM AccessLog
WHERE COL010 LIKE '%MSIE 6%';
SELECT Count(*) FROM AccessLog
WHERE COL010 LIKE '%MSIE 7%';
SELECT Count(*) FROM AccessLog
WHERE COL010 LIKE '%MSIE 8%';

SpatialLite non supporta il Group-By ?

SELECT COL010, Count(*) FROM AccessLog
GROUP BY COL010 ORDER BY count;

--strk;

  () Free GIS & Flash consultant/developer
  /\ http://strk.keybit.net/services.html

On Mon, 8 Nov 2010 18:57:06 +0100, strk wrote

On Mon, Nov 08, 2010 at 06:47:04PM +0100, a.furieri@lqt.it wrote:

> SELECT Count(*) FROM AccessLog
> WHERE COL010 LIKE '%firefox%';
> SELECT Count(*) FROM AccessLog
> WHERE COL010 LIKE '%safari%';
> SELECT Count(*) FROM AccessLog
> WHERE COL010 LIKE '%chrome%';
> SELECT Count(*) FROM AccessLog
> WHERE COL010 LIKE '%opera%';
> SELECT Count(*) FROM AccessLog
> WHERE COL010 LIKE '%MSIE 6%';
> SELECT Count(*) FROM AccessLog
> WHERE COL010 LIKE '%MSIE 7%';
> SELECT Count(*) FROM AccessLog
> WHERE COL010 LIKE '%MSIE 8%';

SpatialLite non supporta il Group-By ?

SELECT COL010, Count(*) FROM AccessLog
GROUP BY COL010 ORDER BY count;

certo che supporta GROUP BY: ma la fantasia
supera l'immaginazione :slight_smile:
provare per credere: la proliferazione di
versioni, sotto-versioni e sotto-sotto-versioni
dei browser è tale che sul mio LogFile in
questo modo ottengo qualcosa più di 800
righe ....

ciao Sandro

On Mon, Nov 08, 2010 at 07:12:44PM +0100, a.furieri@lqt.it wrote:

On Mon, 8 Nov 2010 18:57:06 +0100, strk wrote

> SpatialLite non supporta il Group-By ?
>
> SELECT COL010, Count(*) FROM AccessLog
> GROUP BY COL010 ORDER BY count;
>

certo che supporta GROUP BY: ma la fantasia
supera l'immaginazione :slight_smile:
provare per credere: la proliferazione di
versioni, sotto-versioni e sotto-sotto-versioni
dei browser è tale che sul mio LogFile in
questo modo ottengo qualcosa più di 800
righe ....

SELECT COL010, Count(*) FROM AccessLog
GROUP BY COL010 ORDER BY count
LIMIT 10;

Facci dare un'occhiata !

PS: credo proprio che attivero' il logging spatiallite :slight_smile:

--strk;

  () Free GIS & Flash consultant/developer
  /\ http://strk.keybit.net/services.html