[QGIS-it-user] problemi di classificazione

Buongiorno a tutti,
sono una neoiscritta nonché neoutilizzatrice di QGis come sistema informativo geografico.
Spero qualcuno possa darmi delle indicazioni in merito alla classificazione dei dati. Il problema é questo: ho due set di dati, che esprimono valori quantitativi della stessa sostanza, unica unità di misura ma misurata in ambienti diversi.
Il range dei dati di ciascun set si differenzia però sostanzialmente. I valori di uno sono mooolto più piccoli dell’altro.
Faccio un esempio:
I set - x : ( 1; 2; 3,;4…)
II set - y : ( 20.000; 30.000; 40.000…)
Ho bisogno di visualizzare questi due campioni di dati utilizzando una scala comune, per confrontarli spazialmente e fin’ora non sono riuscita a classificarli correttamente. Ho anche provato a normalizzarli, attraverso media e st.dev ma il risultato é sempre falsato. Non so come trovare una classificazione comune che possa includere il range completo di dati dei due set mostrandone realmente la discrepanza. Ho trasformato i dati in vettoriale centroid, quindi vorrei semplicemente esprimere la differenza visiva classificandoli attraverso un graduated size.

Spero di essere stata chiara, non é facile spiegare ste cose.
Comunque grazie in anticipo,
Claudia

Ciao Claudia,
spero di aver capito il problema. Tu vuoi usare la stessa vestizione per due layer diversi con dati diversi. Non è un problema geografico questo ma del dato. Quello che posso consigliarti è di portare entrambi i dataset in un intervallo da 0 a 1. Creare una vestizione per classi (quante classi devi deciderlo tu) e applicare la vestizione ad entrambi i dataset.

Da un punto di vista pratico credo sia una soluzione valida.

Non mi pare un ragionamento corretto da un punto di vista teorico. Se due fenomeni hanno un andamento diverso per essere analizzati correttamente (in un grafico come in una mappa) hanno bisogno di una vestizione diversa. Anche perchè se tu hai una misura che varia fra 0 e 1 ma il grosso dei dati è nel primo percentile, mentre l’altra misura varia sempre da 0 a 1 ma ha una distribuzione normale, ti ritrovi una mappa con un dataset di colore tutto uguale mentre l’altro varia in maniera più uniforme. In pratica nella visualizzazione perderesti la rappresentazione di tutta quella che è la variabilità del primo dataset (che è comunque presente solo con una diversa distribuzione). L’ho fatta breve ma spero di essermi spiegato.

Saluti
Sergio

···

Sergio Gollino
Profilo su Linkedin

Questo messaggio, comprensivo di eventuali allegati, è ad uso esclusivo del destinatario e potrebbe contenere informazioni riservate; se è stato recapitato per errore ci scusiamo per l’accaduto e Vi invitiamo cortesemente a darcene notizia provvedendo alla sua distruzione.

Vi ricordiamo che la diffusione, l’utilizzo e/o la conservazione dei dati ricevuti per errore costituiscono violazione alle disposizioni del D.Lgs. n. 196/2003 “Codice in materia di protezione dei dati personali”.

Ciao Sergio,
grazie per la tua risposta. Hai centrato perfettamente il problema, infatti avevo già provato a normalizzare i dati in un dataset tra 0 ed 1 ed il risultato era prevedibile. Nessuna variabilità visualizzabile del dataset con valori più piccoli.
Non so quindi come aggirare il problema. Se uso la medesima vestizione dovrò necessariamente classificarli con parametri diversi altrimenti uno sarebbe invisibile o viceversa enorme…Vorrei che visivamente fosse evidente che si tratta del medesimo fenomeno, degli stessi elementi ma con valori completamente diversi.

Sarebbe magari efficace una vestizione puntuale, nel senso di creare tanti punti in base alla quantità da evidenziare. Anche in questo caso, ho provato con filled ma non essendo georeferenziati i puntini finiscono a casaccio ed il risultato é comunque confuso. La mia sorgente di dati é un database che ho collegato ad uno shp.
Se avessi un’idea te ne sarei molto grata.

Grazie ancora
Claudia

···

Sergio Gollino
Profilo su Linkedin

Questo messaggio, comprensivo di eventuali allegati, è ad uso esclusivo del destinatario e potrebbe contenere informazioni riservate; se è stato recapitato per errore ci scusiamo per l’accaduto e Vi invitiamo cortesemente a darcene notizia provvedendo alla sua distruzione.

Vi ricordiamo che la diffusione, l’utilizzo e/o la conservazione dei dati ricevuti per errore costituiscono violazione alle disposizioni del D.Lgs. n. 196/2003 “Codice in materia di protezione dei dati personali”.

Ciao Claudia,

ma se è solamente un problema di rappresentazione grafica, perché non scegli semplicemente una palette di colori ampia e ti crei manualmente delle classi di valori (e colori) che riescano a rappresentare adeguatamente i due set di dati e le loro differenze?

Potresti magari calcolarti i quantili dei due dataset indipendentemente e poi usare quelle classi di valori, ma una palette di colori comune.

Non so se puoi condividere un estratto dei tuoi darti, in modo da poter fare un esempio…

Ale

···

On 05/08/19 17:37, Claudia de Bari wrote:

Ciao Sergio,
grazie per la tua risposta. Hai centrato perfettamente il problema, infatti avevo già provato a normalizzare i dati in un dataset tra 0 ed 1 ed il risultato era prevedibile. Nessuna variabilità visualizzabile del dataset con valori più piccoli.
Non so quindi come aggirare il problema. Se uso la medesima vestizione dovrò necessariamente classificarli con parametri diversi altrimenti uno sarebbe invisibile o viceversa enorme…Vorrei che visivamente fosse evidente che si tratta del medesimo fenomeno, degli stessi elementi ma con valori completamente diversi.

Sarebbe magari efficace una vestizione puntuale, nel senso di creare tanti punti in base alla quantità da evidenziare. Anche in questo caso, ho provato con filled ma non essendo georeferenziati i puntini finiscono a casaccio ed il risultato é comunque confuso. La mia sorgente di dati é un database che ho collegato ad uno shp.
Se avessi un’idea te ne sarei molto grata.

Grazie ancora
Claudia

Il giorno 3 ago 2019, alle ore 08:51, Sergio Gollino <gollinosergio@gmail.com> ha scritto:

Ciao Claudia,
spero di aver capito il problema. Tu vuoi usare la stessa vestizione per due layer diversi con dati diversi. Non è un problema geografico questo ma del dato. Quello che posso consigliarti è di portare entrambi i dataset in un intervallo da 0 a 1. Creare una vestizione per classi (quante classi devi deciderlo tu) e applicare la vestizione ad entrambi i dataset.

Da un punto di vista pratico credo sia una soluzione valida.

Non mi pare un ragionamento corretto da un punto di vista teorico. Se due fenomeni hanno un andamento diverso per essere analizzati correttamente (in un grafico come in una mappa) hanno bisogno di una vestizione diversa. Anche perchè se tu hai una misura che varia fra 0 e 1 ma il grosso dei dati è nel primo percentile, mentre l’altra misura varia sempre da 0 a 1 ma ha una distribuzione normale, ti ritrovi una mappa con un dataset di colore tutto uguale mentre l’altro varia in maniera più uniforme. In pratica nella visualizzazione perderesti la rappresentazione di tutta quella che è la variabilità del primo dataset (che è comunque presente solo con una diversa distribuzione). L’ho fatta breve ma spero di essermi spiegato.

Saluti
Sergio

Il giorno gio 1 ago 2019 alle ore 18:22 Claudia de Bari <claudiadebari@hotmail.com> ha scritto:

Buongiorno a tutti,
sono una neoiscritta nonché neoutilizzatrice di QGis come sistema informativo geografico.
Spero qualcuno possa darmi delle indicazioni in merito alla classificazione dei dati. Il problema é questo: ho due set di dati, che esprimono valori quantitativi della stessa sostanza, unica unità di misura ma misurata in ambienti diversi.
Il range dei dati di ciascun set si differenzia però sostanzialmente. I valori di uno sono mooolto più piccoli dell’altro.
Faccio un esempio:
I set - x : ( 1; 2; 3,;4…)
II set - y : ( 20.000; 30.000; 40.000…)
Ho bisogno di visualizzare questi due campioni di dati utilizzando una scala comune, per confrontarli spazialmente e fin’ora non sono riuscita a classificarli correttamente. Ho anche provato a normalizzarli, attraverso media e st.dev ma il risultato é sempre falsato. Non so come trovare una classificazione comune che possa includere il range completo di dati dei due set mostrandone realmente la discrepanza. Ho trasformato i dati in vettoriale centroid, quindi vorrei semplicemente esprimere la differenza visiva classificandoli attraverso un graduated size.

Spero di essere stata chiara, non é facile spiegare ste cose.
Comunque grazie in anticipo,
Claudia


QGIS-it-user mailing list
QGIS-it-user@lists.osgeo.org
https://lists.osgeo.org/mailman/listinfo/qgis-it-user

Sergio Gollino
Profilo su Linkedin

Questo messaggio, comprensivo di eventuali allegati, è ad uso esclusivo del destinatario e potrebbe contenere informazioni riservate; se è stato recapitato per errore ci scusiamo per l’accaduto e Vi invitiamo cortesemente a darcene notizia provvedendo alla sua distruzione.

Vi ricordiamo che la diffusione, l’utilizzo e/o la conservazione dei dati ricevuti per errore costituiscono violazione alle disposizioni del D.Lgs. n. 196/2003 “Codice in materia di protezione dei dati personali”.

_______________________________________________
QGIS-it-user mailing list
[QGIS-it-user@lists.osgeo.org](mailto:QGIS-it-user@lists.osgeo.org)
[https://lists.osgeo.org/mailman/listinfo/qgis-it-user](https://lists.osgeo.org/mailman/listinfo/qgis-it-user)

Ciao Alessandro,

questo é un estratto dei dati. Come vedi L#ordine di grandezza é all’incirca tre volte superiore. Ho provato a scegliere io la classificazione ma credo che l’algoritmo del software sia molto più preciso di me, e comunque in ogni caso il problema sussiste. Tutti i campioni del primo dataset rientrano in una classe sola del secondo dataset, perché sia valida, qualsiasi classificazione io scelga.

Ovviamente ho sempre scelto una vestizione comune ad entrambe. Essendo però delle quantità, sarebbe più intuitivo se fossero delle forme geometriche di dimensione differente. Usando i colori la percezione della differenza dovrei esprimerla in ciascuno dei poligoni perché sia comprensibile. e come si fa?

Clau

Il giorno 5 ago 2019, alle ore 17:54, Alessandro Sarretta <alessandro.sarretta@gmail.com> ha scritto:

Ciao Claudia,

ma se è solamente un problema di rappresentazione grafica, perché non scegli semplicemente una palette di colori ampia e ti crei manualmente delle classi di valori (e colori) che riescano a rappresentare adeguatamente i due set di dati e le loro differenze?

Potresti magari calcolarti i quantili dei due dataset indipendentemente e poi usare quelle classi di valori, ma una palette di colori comune.

Non so se puoi condividere un estratto dei tuoi darti, in modo da poter fare un esempio…

Ale

On 05/08/19 17:37, Claudia de Bari wrote:

Ciao Sergio,
grazie per la tua risposta. Hai centrato perfettamente il problema, infatti avevo già provato a normalizzare i dati in un dataset tra 0 ed 1 ed il risultato era prevedibile. Nessuna variabilità visualizzabile del dataset con valori più piccoli.
Non so quindi come aggirare il problema. Se uso la medesima vestizione dovrò necessariamente classificarli con parametri diversi altrimenti uno sarebbe invisibile o viceversa enorme…Vorrei che visivamente fosse evidente che si tratta del medesimo fenomeno, degli stessi elementi ma con valori completamente diversi.

Sarebbe magari efficace una vestizione puntuale, nel senso di creare tanti punti in base alla quantità da evidenziare. Anche in questo caso, ho provato con filled ma non essendo georeferenziati i puntini finiscono a casaccio ed il risultato é comunque confuso. La mia sorgente di dati é un database che ho collegato ad uno shp.
Se avessi un’idea te ne sarei molto grata.

Grazie ancora
Claudia

Il giorno 3 ago 2019, alle ore 08:51, Sergio Gollino <gollinosergio@gmail.com> ha scritto:

Ciao Claudia,
spero di aver capito il problema. Tu vuoi usare la stessa vestizione per due layer diversi con dati diversi. Non è un problema geografico questo ma del dato. Quello che posso consigliarti è di portare entrambi i dataset in un intervallo da 0 a 1. Creare una vestizione per classi (quante classi devi deciderlo tu) e applicare la vestizione ad entrambi i dataset.

Da un punto di vista pratico credo sia una soluzione valida.

Non mi pare un ragionamento corretto da un punto di vista teorico. Se due fenomeni hanno un andamento diverso per essere analizzati correttamente (in un grafico come in una mappa) hanno bisogno di una vestizione diversa. Anche perchè se tu hai una misura che varia fra 0 e 1 ma il grosso dei dati è nel primo percentile, mentre l’altra misura varia sempre da 0 a 1 ma ha una distribuzione normale, ti ritrovi una mappa con un dataset di colore tutto uguale mentre l’altro varia in maniera più uniforme. In pratica nella visualizzazione perderesti la rappresentazione di tutta quella che è la variabilità del primo dataset (che è comunque presente solo con una diversa distribuzione). L’ho fatta breve ma spero di essermi spiegato.

Saluti
Sergio

Il giorno gio 1 ago 2019 alle ore 18:22 Claudia de Bari <claudiadebari@hotmail.com> ha scritto:

Buongiorno a tutti,
sono una neoiscritta nonché neoutilizzatrice di QGis come sistema informativo geografico.
Spero qualcuno possa darmi delle indicazioni in merito alla classificazione dei dati. Il problema é questo: ho due set di dati, che esprimono valori quantitativi della stessa sostanza, unica unità di misura ma misurata in ambienti diversi.
Il range dei dati di ciascun set si differenzia però sostanzialmente. I valori di uno sono mooolto più piccoli dell’altro.
Faccio un esempio:
I set - x : ( 1; 2; 3,;4…)
II set - y : ( 20.000; 30.000; 40.000…)
Ho bisogno di visualizzare questi due campioni di dati utilizzando una scala comune, per confrontarli spazialmente e fin’ora non sono riuscita a classificarli correttamente. Ho anche provato a normalizzarli, attraverso media e st.dev ma il risultato é sempre falsato. Non so come trovare una classificazione comune che possa includere il range completo di dati dei due set mostrandone realmente la discrepanza. Ho trasformato i dati in vettoriale centroid, quindi vorrei semplicemente esprimere la differenza visiva classificandoli attraverso un graduated size.

Spero di essere stata chiara, non é facile spiegare ste cose.
Comunque grazie in anticipo,
Claudia


QGIS-it-user mailing list
QGIS-it-user@lists.osgeo.org
https://lists.osgeo.org/mailman/listinfo/qgis-it-user

Sergio Gollino
Profilo su Linkedin

Questo messaggio, comprensivo di eventuali allegati, è ad uso esclusivo del destinatario e potrebbe contenere informazioni riservate; se è stato recapitato per errore ci scusiamo per l’accaduto e Vi invitiamo cortesemente a darcene notizia provvedendo alla sua distruzione.

Vi ricordiamo che la diffusione, l’utilizzo e/o la conservazione dei dati ricevuti per errore costituiscono violazione alle disposizioni del D.Lgs. n. 196/2003 “Codice in materia di protezione dei dati personali”.

_______________________________________________
QGIS-it-user mailing list
[QGIS-it-user@lists.osgeo.org](mailto:QGIS-it-user@lists.osgeo.org)
[https://lists.osgeo.org/mailman/listinfo/qgis-it-user](https://lists.osgeo.org/mailman/listinfo/qgis-it-user)


QGIS-it-user mailing list
QGIS-it-user@lists.osgeo.org
https://lists.osgeo.org/mailman/listinfo/qgis-it-user

esempio.pdf (22 KB)

Allora, in parte ho risolto con una mappa di densità di punti, anche se il dataset più piccolo si perde nel mare di puntini dell’altro. Ma variando le dimensioni, anche se si altera un po’ la questione concettuale, l’idea forse é più chiara.
proverò a fare una combo tra densità e simbolo graduato…
Il lato positivo é che ora mi é molto più chiaro la capacità di strumentalizzazione dei dati a cui siamo sottoposti quotidianamente.

Grazie per l’aiuto a tutti!

Il giorno 5 ago 2019, alle ore 18:09, Claudia de Bari <claudiadebari@hotmail.com> ha scritto:

Ciao Alessandro,

questo é un estratto dei dati. Come vedi L#ordine di grandezza é all’incirca tre volte superiore. Ho provato a scegliere io la classificazione ma credo che l’algoritmo del software sia molto più preciso di me, e comunque in ogni caso il problema sussiste. Tutti i campioni del primo dataset rientrano in una classe sola del secondo dataset, perché sia valida, qualsiasi classificazione io scelga.

Ovviamente ho sempre scelto una vestizione comune ad entrambe. Essendo però delle quantità, sarebbe più intuitivo se fossero delle forme geometriche di dimensione differente. Usando i colori la percezione della differenza dovrei esprimerla in ciascuno dei poligoni perché sia comprensibile. e come si fa?

Clau

Il giorno 5 ago 2019, alle ore 17:54, Alessandro Sarretta <alessandro.sarretta@gmail.com> ha scritto:

Ciao Claudia,

ma se è solamente un problema di rappresentazione grafica, perché non scegli semplicemente una palette di colori ampia e ti crei manualmente delle classi di valori (e colori) che riescano a rappresentare adeguatamente i due set di dati e le loro differenze?

Potresti magari calcolarti i quantili dei due dataset indipendentemente e poi usare quelle classi di valori, ma una palette di colori comune.

Non so se puoi condividere un estratto dei tuoi darti, in modo da poter fare un esempio…

Ale

On 05/08/19 17:37, Claudia de Bari wrote:

Ciao Sergio,
grazie per la tua risposta. Hai centrato perfettamente il problema, infatti avevo già provato a normalizzare i dati in un dataset tra 0 ed 1 ed il risultato era prevedibile. Nessuna variabilità visualizzabile del dataset con valori più piccoli.
Non so quindi come aggirare il problema. Se uso la medesima vestizione dovrò necessariamente classificarli con parametri diversi altrimenti uno sarebbe invisibile o viceversa enorme…Vorrei che visivamente fosse evidente che si tratta del medesimo fenomeno, degli stessi elementi ma con valori completamente diversi.

Sarebbe magari efficace una vestizione puntuale, nel senso di creare tanti punti in base alla quantità da evidenziare. Anche in questo caso, ho provato con filled ma non essendo georeferenziati i puntini finiscono a casaccio ed il risultato é comunque confuso. La mia sorgente di dati é un database che ho collegato ad uno shp.
Se avessi un’idea te ne sarei molto grata.

Grazie ancora
Claudia

Il giorno 3 ago 2019, alle ore 08:51, Sergio Gollino <gollinosergio@gmail.com> ha scritto:

Ciao Claudia,
spero di aver capito il problema. Tu vuoi usare la stessa vestizione per due layer diversi con dati diversi. Non è un problema geografico questo ma del dato. Quello che posso consigliarti è di portare entrambi i dataset in un intervallo da 0 a 1. Creare una vestizione per classi (quante classi devi deciderlo tu) e applicare la vestizione ad entrambi i dataset.

Da un punto di vista pratico credo sia una soluzione valida.

Non mi pare un ragionamento corretto da un punto di vista teorico. Se due fenomeni hanno un andamento diverso per essere analizzati correttamente (in un grafico come in una mappa) hanno bisogno di una vestizione diversa. Anche perchè se tu hai una misura che varia fra 0 e 1 ma il grosso dei dati è nel primo percentile, mentre l’altra misura varia sempre da 0 a 1 ma ha una distribuzione normale, ti ritrovi una mappa con un dataset di colore tutto uguale mentre l’altro varia in maniera più uniforme. In pratica nella visualizzazione perderesti la rappresentazione di tutta quella che è la variabilità del primo dataset (che è comunque presente solo con una diversa distribuzione). L’ho fatta breve ma spero di essermi spiegato.

Saluti
Sergio

Il giorno gio 1 ago 2019 alle ore 18:22 Claudia de Bari <claudiadebari@hotmail.com> ha scritto:

Buongiorno a tutti,
sono una neoiscritta nonché neoutilizzatrice di QGis come sistema informativo geografico.
Spero qualcuno possa darmi delle indicazioni in merito alla classificazione dei dati. Il problema é questo: ho due set di dati, che esprimono valori quantitativi della stessa sostanza, unica unità di misura ma misurata in ambienti diversi.
Il range dei dati di ciascun set si differenzia però sostanzialmente. I valori di uno sono mooolto più piccoli dell’altro.
Faccio un esempio:
I set - x : ( 1; 2; 3,;4…)
II set - y : ( 20.000; 30.000; 40.000…)
Ho bisogno di visualizzare questi due campioni di dati utilizzando una scala comune, per confrontarli spazialmente e fin’ora non sono riuscita a classificarli correttamente. Ho anche provato a normalizzarli, attraverso media e st.dev ma il risultato é sempre falsato. Non so come trovare una classificazione comune che possa includere il range completo di dati dei due set mostrandone realmente la discrepanza. Ho trasformato i dati in vettoriale centroid, quindi vorrei semplicemente esprimere la differenza visiva classificandoli attraverso un graduated size.

Spero di essere stata chiara, non é facile spiegare ste cose.
Comunque grazie in anticipo,
Claudia


QGIS-it-user mailing list
QGIS-it-user@lists.osgeo.org
https://lists.osgeo.org/mailman/listinfo/qgis-it-user

Sergio Gollino
Profilo su Linkedin

Questo messaggio, comprensivo di eventuali allegati, è ad uso esclusivo del destinatario e potrebbe contenere informazioni riservate; se è stato recapitato per errore ci scusiamo per l’accaduto e Vi invitiamo cortesemente a darcene notizia provvedendo alla sua distruzione.

Vi ricordiamo che la diffusione, l’utilizzo e/o la conservazione dei dati ricevuti per errore costituiscono violazione alle disposizioni del D.Lgs. n. 196/2003 “Codice in materia di protezione dei dati personali”.

_______________________________________________
QGIS-it-user mailing list
[QGIS-it-user@lists.osgeo.org](mailto:QGIS-it-user@lists.osgeo.org)
[https://lists.osgeo.org/mailman/listinfo/qgis-it-user](https://lists.osgeo.org/mailman/listinfo/qgis-it-user)


QGIS-it-user mailing list
QGIS-it-user@lists.osgeo.org
https://lists.osgeo.org/mailman/listinfo/qgis-it-user

<esempio.pdf>_______________________________________________
QGIS-it-user mailing list
QGIS-it-user@lists.osgeo.org
https://lists.osgeo.org/mailman/listinfo/qgis-it-user