[Gfoss] inividuare record doppioni

Ummarino · October 10, 2013, 12:51pm

QGIS 2.0
Qualcuna mi sa indicare la procedura corretta per individuare (e
selezionare) dei valori (di un campo) doppi in un tabella attributi con + di
8000 record da passare i rassegna ?

-----
A.Ummarino
--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.

Luca_Mandolesi · October 10, 2013, 1:11pm

Ho capito bene, una cosa tipo questa ti servirebbe: http://stackoverflow.com/questions/2594829/finding-duplicate-values-in-a-sql-table

Ciao
Luca

···

2013/10/10 Ummarino <alessandro.ummarino@gmail.com>

QGIS 2.0
Qualcuna mi sa indicare la procedura corretta per individuare (e
selezionare) dei valori (di un campo) doppi in un tabella attributi con + di
8000 record da passare i rassegna ?

A.Ummarino

View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918.html
Sent from the Gfoss – Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.

Gfoss@lists.gfoss.it
http://lists.gfoss.it/cgi-bin/mailman/listinfo/gfoss
Questa e’ una lista di discussione pubblica aperta a tutti.
I messaggi di questa lista non hanno relazione diretta con le posizioni dell’Associazione GFOSS.it.
666 iscritti al 22.7.2013

Ummarino · October 10, 2013, 1:20pm

Mi sembra di si...ma in QGIS come posso selzionare (o meglio fare una
selezione) in una tabella attribuiti dei doppioni di un valore di un campo??
Pensavo di selezionare i valori unici e poi invertire la selezione....ma mi
sono accorto che non sò come selezionare i valori unici !!!! (la tabella ha
più di 8000 record)

-----
A.Ummarino
--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7583921.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.

Andrea_Peri · October 10, 2013, 1:51pm

su spatialite-GUI e anche sulla CLI

ci sono due procedure per localizzare doppioni e per rimuoverli.

On 10/10/2013 15:20, Ummarino wrote:

Mi sembra di si...ma in QGIS come posso selzionare (o meglio fare una
selezione) in una tabella attribuiti dei doppioni di un valore di un campo??
Pensavo di selezionare i valori unici e poi invertire la selezione....ma mi
sono accorto che non sò come selezionare i valori unici !!!! (la tabella ha
più di 8000 record)

-----
A.Ummarino
--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7583921.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.
_______________________________________________
Gfoss@lists.gfoss.it
http://lists.gfoss.it/cgi-bin/mailman/listinfo/gfoss
Questa e' una lista di discussione pubblica aperta a tutti.
I messaggi di questa lista non hanno relazione diretta con le posizioni dell'Associazione GFOSS.it.
666 iscritti al 22.7.2013

Andrea_Peri · October 10, 2013, 1:52pm

aspetta, forse te ti riferivi a un capo solo.

Le procedure di spatialite invece localizzano record doppioni.

Ovvero doppioni su tutti i campi salvo la PK ovviamente.

Andrea.

On 10/10/2013 15:20, Ummarino wrote:

Mi sembra di si...ma in QGIS come posso selzionare (o meglio fare una
selezione) in una tabella attribuiti dei doppioni di un valore di un campo??
Pensavo di selezionare i valori unici e poi invertire la selezione....ma mi
sono accorto che non sò come selezionare i valori unici !!!! (la tabella ha
più di 8000 record)

-----
A.Ummarino
--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7583921.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.
_______________________________________________
Gfoss@lists.gfoss.it
http://lists.gfoss.it/cgi-bin/mailman/listinfo/gfoss
Questa e' una lista di discussione pubblica aperta a tutti.
I messaggi di questa lista non hanno relazione diretta con le posizioni dell'Associazione GFOSS.it.
666 iscritti al 22.7.2013

Luca_Mandolesi · October 10, 2013, 2:00pm

2013/10/10 Ummarino <alessandro.ummarino@gmail.com>

Mi sembra di si...ma in QGIS come posso selzionare (o meglio fare una
selezione) in una tabella attribuiti dei doppioni di un valore di un
campo??
Pensavo di selezionare i valori unici e poi invertire la selezione....ma mi
sono accorto che non sò come selezionare i valori unici !!!! (la tabella ha
più di 8000 record)

Allora, fatico ancora a capire, stai dicendo che in una tabella
persone
ID | nome | cognome
1 | Luca | Mandolesi

Tabella attributi

ID | ForegnKey | Indirizzo
1 | 1 | Via san Giorgio 12
2 | 1 | Via san Giorgio 12

é questo a cui ti riferisci?

Vuoi individuare i record doppi sia per foreignKey che per campo che scegli
tu?

Ho capito bene?

-----
A.Ummarino
--
View this message in context:
http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7583921.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian
mailing list mailing list archive at Nabble.com.
_______________________________________________
Gfoss@lists.gfoss.it
http://lists.gfoss.it/cgi-bin/mailman/listinfo/gfoss
Questa e' una lista di discussione pubblica aperta a tutti.
I messaggi di questa lista non hanno relazione diretta con le posizioni
dell'Associazione GFOSS.it.
666 iscritti al 22.7.2013

Ummarino · October 10, 2013, 2:30pm

Forse è un pò piu semplice:
In QGIS il layer "persone.shp" ha una tabella attributi "persone.dbf".
Voglio "selezionare" i doppioni relativi a un campo attributi:

Devo eliminare il record ID 3.....sulla base del doppione del campo ALTRO,
quindi o lancio una selezione di tutti i recod univoci (sempre sulla base
del campo ALTRO) e poi per eslusione elemino gli altri che a questo punto
sono i miei doppioni...o individuo i doppioni....e li elimino
Come si fa in QGIS ?

-----
A.Ummarino
--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7583925.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.

Luca_Mandolesi · October 10, 2013, 2:52pm

AH attributi in quel senso…il dbf alla fine fa sempre parte di quelle che definiamo shapefile. Cmq io lo passerei dentro a spatialite e userei l’SQL per ripulirlo… sul DBF non mi viene in mente nulla. Ma magari son bollito a fine giornata…QUalche Guru di Qgis in ascolto?

Antonio_Vinci · October 10, 2013, 6:44pm

mando wrote/

sul DBF non mi viene in mente nulla

/

Credo che il metodo piu' veloce sia caricare il DBF in Excel, estrapolare i
doppioni con una condizione IF e, sempre in Excel, assemblare una clausola
Sql per Qgis che nell'esempio suddetto sarebbe:

"ID" = "1" OR "ID" = "3"

-----

--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7583932.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.

Ummarino · October 12, 2013, 12:32pm

Direi che alla fine la soluzione più veloce è proprio come dici tu...foglio
di calcolo e via

-----
A.Ummarino
--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7583990.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.

Andrea_Peri · October 12, 2013, 12:58pm

E come fai a tenere allineate le geometrie del file .shp con gli attributi del file .dbf ?
:))

Lo shapefile ha una relazione posizionale.

Il foglio excel ti consente di rimuovere elementi da il dbf, ma non interviene nel file .shp.

Per cui ti ritrovi alla fine con uno shapefile "corretto", perche' avrai
N record nel file shp e N-X record nel file dbf (dove X sono i doppioni rimossi).

Stai attento a fare le cose per bene altrimenti ti ritrovi poi con un altro problema molto meno gestibile di questo.

Io userei la spatialite-gui .

Andrea.

On 12/10/2013 14:32, Ummarino wrote:

Direi che alla fine la soluzione più veloce è proprio come dici tu...foglio
di calcolo e via

-----
A.Ummarino
--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7583990.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.
_______________________________________________
Gfoss@lists.gfoss.it
http://lists.gfoss.it/cgi-bin/mailman/listinfo/gfoss
Questa e' una lista di discussione pubblica aperta a tutti.
I messaggi di questa lista non hanno relazione diretta con le posizioni dell'Associazione GFOSS.it.
666 iscritti al 22.7.2013

Marco2 · October 12, 2013, 1:20pm

Andrea Peri wrote

E come fai a tenere allineate le geometrie del file .shp con gli
attributi del file .dbf ?

L'importante è individuare i doppioni; una volta individuati
li selezioni da dentro qgis.

Se i doppioni sono pochi, filtrare il dbf mi pare la soluzione
più veloce; se sono molti è meglio portare tutto su spatialite,
come hai detto tu.

Ciao,
Marco

--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7583992.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.

Antonio_Vinci · October 12, 2013, 2:53pm

Marco Curreli wrote/

L'importante è individuare i doppioni; una volta individuati li selezioni
da dentro qgis.

/

Esattamente

Marco Curreli wrote/

Se i doppioni sono pochi, filtrare il dbf mi pare la soluzione più veloce

/

Siccome Unmarino parlava di 8000 record, quindi un numero inferiore ai 2^16
gestiti da Excel 200x, la procedura che ho indicato sopra e' probabilmente
la piu' agile.

Piuttosto mi chiedo se Libreoffice (o altro foglio elettronico opensource)
la supporti, sia nella fase IF che nell'assemblaggio dell'espressione Sql...

-----

--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7583998.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.

Marco2 · October 12, 2013, 6:37pm

Novarese wrote

Siccome Unmarino parlava di 8000 record, quindi un numero inferiore ai
2^16 gestiti da Excel 200x, la procedura che ho indicato sopra e'
probabilmente la piu' agile.

io preferisco la riga di comando, è molto più veloce (v. messaggio del 10
ottobre).

--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7584005.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.

Antonio_Vinci · October 12, 2013, 6:58pm

Marco Curreli wrote/

io preferisco la riga di comando, è molto più veloce

/

Cronometro alla mano, hai senz'altro ragione, ma permettimi un appunto da
ignorante totale dell'ambiente Grass.

Quando tu deleghi l'eliminazione automatica dei doppioni ad un comando a
basso livello, non sai "quale" verra' cancellato, e mi spiego.

Se i 2 oggetti di uguali attributi sono geometricamente sovrapposti, poco
male, mi sta bene anche l'automatismo.

Qualora invece gli oggetti siano fisicamente distanti fra loro (pur avendo
identici attributi), quale dei due Grass eliminera' e con quale criterio?

-----

--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7584006.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.

Marco2 · October 12, 2013, 7:46pm

Novarese wrote

Marco Curreli wrote

/

io preferisco la riga di comando, è molto più veloce

/

Cronometro alla mano, hai senz'altro ragione, ma permettimi un appunto da
ignorante totale dell'ambiente Grass

Nello specifico, mi riferivo all'indivuazione dei doppioni, partendo dal dbf
esportato come csv:
cat miofile.csv | gawk -F"," '{print $3}' | uniq -dc

oppure in grass:
v.db.select map=mymap | gawk -F"|" '{print $4}' | uniq -dc

restituisce le righe duplicate, indicando il numero di duplicazioni

--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7584007.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.

Matteo_Asioli · October 29, 2013, 3:01pm

Scusate se mi attacco alla discusione un po in ritardo e forse chiusa, ma
avevo proprio l'identico problema sulla individuazione dei doppioni. Ho
visto che in QGis c'è un comando sulla ricerca dei valori univoci...che poi
non capisco come diceva Novarese che invertiva per selezionare i
doppioni....poi non ho ben capito come è stata risolta la questione sulla
eliminazione di uno dei due doppioni individuati...chiedo in particolare a
Novarese..
Grazie

--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7584549.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.

Antonio_Vinci · October 29, 2013, 5:22pm

Matteo Asioli wrote/

chiedo in particolare a Novarese

/

Cosa in particolare non ti funziona, la fase nel foglio elettronico o quella
in Qgis.._

-----

--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7584550.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.

Matteo_Asioli · October 29, 2013, 7:41pm

in Qgis riesco ad individuare i record univoci, ma non capisco come selezionare poi i doppioni, e ad ogni modo una volta individuati, quale procedura usare per andare a escludere uno dei due valori doppi. In sostanza non ho ben capito la soluzione che si proponeva.

···

Il giorno 29 ottobre 2013 18:22, Novarese <sieradz@gmail.com> ha scritto:

Matteo Asioli wrote/

chiedo in particolare a Novarese
/

Cosa in particolare non ti funziona, la fase nel foglio elettronico o quella
in Qgis…_

–
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7584550.html

Sent from the Gfoss – Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.

Gfoss@lists.gfoss.it
http://lists.gfoss.it/cgi-bin/mailman/listinfo/gfoss
Questa e’ una lista di discussione pubblica aperta a tutti.
I messaggi di questa lista non hanno relazione diretta con le posizioni dell’Associazione GFOSS.it.
666 iscritti al 22.7.2013

Antonio_Vinci · October 30, 2013, 7:15am

Matteo Asioli wrote/

in Qgis riesco ad individuare i record univoci

/

La tecnica che ho suggerito scova i doppioni all'interno di un foglio
elettronico, dopodichè costruisce l'interrogazione SQL da incollare in Qgis.

1] lancia l'opensource Libreoffice, e setta la lingua come "inglese"
2] apri una copia PIPPO del file .DBF contenuto nello shapeset PLUTO
3] cancellare tutto tranne la colonna contenente i doppioni
4] sortare alfabeticamente la colonna A
5] supponendo che in A1 ci sia il nome del campo, inserisci in B2 la formula
*=IF(A3=A2)*
6] propaga il contenuto di B1 a tutta la colonna B
7] dove vedi TRUE significa che c'è un doppione
8] DATA => FILTER => AUTOFILTER ed estrapoli solo i valori TRUE (che in
Libreoffice sono marcati come "1")
9] copia la sotto-colonna A in un foglio vuoto, ottenendo i valori doppi
come occorrenze univoche

Rifatti vivo quando sei arrivato a questo punto, grazie.

-----

--
View this message in context: http://gfoss-geographic-free-and-open-source-software-italian-mailing.3056002.n2.nabble.com/inividuare-record-doppioni-tp7583918p7584553.html
Sent from the Gfoss -- Geographic Free and Open Source Software - Italian mailing list mailing list archive at Nabble.com.