[GeoNetwork-users-fr] comment distinguer la provenance des métadonnées moissonnées ?

Bonjour,

Dans le cadre du projet de recherche GEOBS (http://www-iuem.univ-brest.fr/pops/projects/geobs), l'un de nos chantiers est consacré à l'étude du contenu des géocatalogues régionaux et nationaux.

Après avoir testé nos analyses des couvertures thématiques, organisationnelles, temporelles et spatiales des métadonnées sur 3 géocatalogues régionaux, nous essayons désormais d'automatiser la démarche pour sortir des indicateurs sur l'ensemble des 45 infrastructures nationales et régionales qui constituent notre corpus initial. Pour ce faire, nous nous appuyons sur les services web CSW pour récupérer les balises qui nous intéressent. Le problème c'est que lorsqu'on attaque les géocatalogues par les CSW, on récupère toutes les métadonnées (c'est-à-dire celles du catalogue et celles que le catalogue moissonne). Par exemple, dans le cas de PEIGEO (La Réunion), nous récupérons ainsi près de 57255 fiches car en plus de leur 87 fiches il moissonne TOUT le géocatalogue !

J'ai trouvé dans certaines fiches de métadonnées la suite de balises ci-dessous qui permet d'identifier clairement de quel catalogue provient la métadonnée (ici une fiche d'Atlasanté moissonné par GeoGuyane) :

/<gmd:contentInfo xmlns:srv="http://www.isotc211.org/2005/srv&quot; xmlns:date="http://exslt.org/dates-and-times&quot;&gt;//
// <gmd:MD_FeatureCatalogueDescription>//
// <gmd:includedWithDataset />//
// <gmd:featureCatalogueCitation uuidref="c1ca910a-7afa-4adf-adbe-573de6b5f290" xlink:href="http://www.atlasante.fr/geonetwork/srv/fre/csw?service=CSW&amp;request=GetRecordById&amp;version=2.0.2&amp;outputSchema=http://www.isotc211.org/2005/gmd&amp;elementSetName=full&amp;id=c1ca910a-7afa-4adf-adbe-573de6b5f290&quot; />//
// </gmd:MD_FeatureCatalogueDescription>//
//</gmd:contentInfo>/

Mais malheureusement cette suite de balise est absente de la plupart des fiches de métadonnées.... Du coup je ne vois pas comment repérer l'information sur leur provenance. Auriez-vous une idée ?

Merci d'avance.

--
Matthieu NOUCHER
Chargé de recherche au CNRS
Laboratoire ADESS (UMR 5185)

Maison des Suds
12 esplanade des Antilles
F-33607 Pessac Cedex

Tél : 00.33 (0)5.56.84.82.06
Mail : matthieu.noucher@anonymised.com
Web (labo) : http://www.ades.cnrs.fr
Web (perso) : http://www.ades.cnrs.fr/spip.php?article803

Bonjour,

Le 16 novembre 2015 à 22:32, Matthieu Noucher <matthieu.noucher@anonymised.com...> a
écrit :

Bonjour,

Dans le cadre du projet de recherche GEOBS
(http://www-iuem.univ-brest.fr/pops/projects/geobs), l'un de nos
chantiers est consacré à l'étude du contenu des géocatalogues régionaux
et nationaux.

Après avoir testé nos analyses des couvertures thématiques,
organisationnelles, temporelles et spatiales des métadonnées sur 3
géocatalogues régionaux, nous essayons désormais d'automatiser la
démarche pour sortir des indicateurs sur l'ensemble des 45
infrastructures nationales et régionales qui constituent notre corpus
initial. Pour ce faire, nous nous appuyons sur les services web CSW pour
récupérer les balises qui nous intéressent. Le problème c'est que
lorsqu'on attaque les géocatalogues par les CSW, on récupère toutes les
métadonnées (c'est-à-dire celles du catalogue et celles que le catalogue
moissonne). Par exemple, dans le cas de PEIGEO (La Réunion), nous
récupérons ainsi près de 57255 fiches car en plus de leur 87 fiches il
moissonne TOUT le géocatalogue !

J'ai trouvé dans certaines fiches de métadonnées la suite de balises
ci-dessous qui permet d'identifier clairement de quel catalogue provient
la métadonnée (ici une fiche d'Atlasanté moissonné par GeoGuyane) :

/<gmd:contentInfo xmlns:srv="http://www.isotc211.org/2005/srv&quot;
xmlns:date="http://exslt.org/dates-and-times&quot;&gt;//
// <gmd:MD_FeatureCatalogueDescription>//
// <gmd:includedWithDataset />//
// <gmd:featureCatalogueCitation
uuidref="c1ca910a-7afa-4adf-adbe-573de6b5f290"
xlink:href="

http://www.atlasante.fr/geonetwork/srv/fre/csw?service=CSW&amp;request=GetRecordById&amp;version=2.0.2&amp;outputSchema=http://www.isotc211.org/2005/gmd&amp;elementSetName=full&amp;id=c1ca910a-7afa-4adf-adbe-573de6b5f290
"

/>//
// </gmd:MD_FeatureCatalogueDescription>//
//</gmd:contentInfo>/

Mais malheureusement cette suite de balise est absente de la plupart des
fiches de métadonnées.... Du coup je ne vois pas comment repérer
l'information sur leur provenance. Auriez-vous une idée ?

Le CSW ne fournit pas d'information sur le catalogue d'origine de la fiche.
Vous pourriez utiliser le protocol GeoNetwork qui ajoute cette information
dans le ZIP échangé lors du moissonnage. En CSW, le moins pire est sans
doute d'utiliser l'information sur l'auteur de la fiche, mais ce ne sera
pas forcément correct.

La prochaine version de l'ISO19115-3 ajoute cette notion avec un élément
permettant de créer un lien vers la fiche dans son catalogue d'origine
(metadataLinkage également appelé pointOfTruthUrl dans certains profiles).

Salutations.

Francois

Merci d'avance.

--
Matthieu NOUCHER
Chargé de recherche au CNRS
Laboratoire ADESS (UMR 5185)

Maison des Suds
12 esplanade des Antilles
F-33607 Pessac Cedex

Tél : 00.33 (0)5.56.84.82.06
Mail : matthieu.noucher@anonymised.com
Web (labo) : http://www.ades.cnrs.fr
Web (perso) : http://www.ades.cnrs.fr/spip.php?article803

------------------------------------------------------------------------------

Presto, an open source distributed SQL query engine for big data,

initially

developed by Facebook, enables you to easily query your data on Hadoop in

a

more interactive manner. Teradata is also now providing full enterprise
support for Presto. Download a free open source copy now.
http://pubads.g.doubleclick.net/gampad/clk?id=250295911&iu=/4140
_______________________________________________
GeoNetwork-users-fr mailing list
GeoNetwork-users-fr@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/geonetwork-users-fr

Bonjour, un complément concernant la notion d'indicateur

Le 16 novembre 2015 à 22:32, Matthieu Noucher <matthieu.noucher@anonymised.com...> a
écrit :

Bonjour,

Dans le cadre du projet de recherche GEOBS
(http://www-iuem.univ-brest.fr/pops/projects/geobs), l'un de nos
chantiers est consacré à l'étude du contenu des géocatalogues régionaux
et nationaux.

Après avoir testé nos analyses des couvertures thématiques,
organisationnelles, temporelles et spatiales des métadonnées sur 3
géocatalogues régionaux, nous essayons désormais d'automatiser la
démarche pour sortir des indicateurs sur l'ensemble des 45
infrastructures nationales et régionales qui constituent notre corpus

Vous pourriez être intéressé par cet outil pour le calcul et le rendu
d'indicateurs.
https://github.com/INSPIRE-MIF/daobs

Site de démo
http://apps.titellus.net/dashboard/#/

Salutations.

Francois

initial. Pour ce faire, nous nous appuyons sur les services web CSW pour
récupérer les balises qui nous intéressent. Le problème c'est que
lorsqu'on attaque les géocatalogues par les CSW, on récupère toutes les
métadonnées (c'est-à-dire celles du catalogue et celles que le catalogue
moissonne). Par exemple, dans le cas de PEIGEO (La Réunion), nous
récupérons ainsi près de 57255 fiches car en plus de leur 87 fiches il
moissonne TOUT le géocatalogue !

J'ai trouvé dans certaines fiches de métadonnées la suite de balises
ci-dessous qui permet d'identifier clairement de quel catalogue provient
la métadonnée (ici une fiche d'Atlasanté moissonné par GeoGuyane) :

/<gmd:contentInfo xmlns:srv="http://www.isotc211.org/2005/srv&quot;
xmlns:date="http://exslt.org/dates-and-times&quot;&gt;//
// <gmd:MD_FeatureCatalogueDescription>//
// <gmd:includedWithDataset />//
// <gmd:featureCatalogueCitation
uuidref="c1ca910a-7afa-4adf-adbe-573de6b5f290"
xlink:href="
http://www.atlasante.fr/geonetwork/srv/fre/csw?service=CSW&amp;request=GetRecordById&amp;version=2.0.2&amp;outputSchema=http://www.isotc211.org/2005/gmd&amp;elementSetName=full&amp;id=c1ca910a-7afa-4adf-adbe-573de6b5f290
"
/>//
// </gmd:MD_FeatureCatalogueDescription>//
//</gmd:contentInfo>/

Mais malheureusement cette suite de balise est absente de la plupart des
fiches de métadonnées.... Du coup je ne vois pas comment repérer
l'information sur leur provenance. Auriez-vous une idée ?

Merci d'avance.

--
Matthieu NOUCHER
Chargé de recherche au CNRS
Laboratoire ADESS (UMR 5185)

Maison des Suds
12 esplanade des Antilles
F-33607 Pessac Cedex

Tél : 00.33 (0)5.56.84.82.06
Mail : matthieu.noucher@anonymised.com
Web (labo) : http://www.ades.cnrs.fr
Web (perso) : http://www.ades.cnrs.fr/spip.php?article803

------------------------------------------------------------------------------
Presto, an open source distributed SQL query engine for big data, initially
developed by Facebook, enables you to easily query your data on Hadoop in a
more interactive manner. Teradata is also now providing full enterprise
support for Presto. Download a free open source copy now.
http://pubads.g.doubleclick.net/gampad/clk?id=250295911&iu=/4140
_______________________________________________
GeoNetwork-users-fr mailing list
GeoNetwork-users-fr@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/geonetwork-users-fr