Qualité des données

La démarche Qualité des données

 
L'objectif premier d’ORACLE est de mettre à la disposition des scientifiques et des opérationnels l'ensemble des données de base recueillies sur la totalité de la période d'observation. Ces données exigent la mise en place d'une procédure qualité. Ce travail s'inscrit dans la politique qualité d'Irstea, mise en place sur l'ensemble de ses sites d'Observation, et s'appuie sur deux réseaux, "Mesure et Instrumentation" et "Base de données". La démarche qualité porte sur i) l'aspect métrologique (établissement de protocoles rigoureux d’installation des appareils, systématisation des procédures d’utilisation, maintenance rigoureuse et régulière), ii) le traitement des données (rapatriement fréquent de la donnée, vérification de la cohérence de la série, vérification de la cohérence des variables et des paramètres les uns par rapport aux autres) et iii) sur la question de la reconstitution de données. L'objectif est de mettre en œuvre un certain nombre de dispositions au niveau de la gestion et au niveau technique pour aboutir à des résultats fiables et être en mesure de prouver cette fiabilité (notion de confiance). Ce travail s'appuie notamment sur des recommandations pour la qualité en recherche, tel que le document AFNOR, FDX50-551.
 

i) Maintenance et métrologie des équipements d’ORACLE :

La première étape de notre démarche qualité a été de mettre en place une base de données concernant l'ensemble du parc métrologique d’ORACLE avec la mise en place d'un logiciel de maintenance d'équipement de mesure (SPLIT4®). Les données techniques de chaque appareil, leur localisation précise sur ORACLE, la date de chaque étalonnage et des événements de maintenance sont pris en compte par le logiciel. Ceci nous permet une meilleure traçabilité des équipements et de leur maintenance, une maîtrise des non-conformités et une amélioration des performances des moyens de mesure.
 

ii) Traitement des données et iii) reconstitution des données :

Les données pluviométriques sont télétransmises directement sur une base de données interne, de manière automatisée, au pas de temps d'une heure. Les données limnimétriques sont rapatriées après validation sur la banque HYDRO gérée par le MEEDDAT. L'ensemble des autres données sont rapatriées à fréquence régulière sur des bases de données internes (tous les deux mois en moyenne).
Les données ainsi rapatriées sont validées par l'Ingénieur de recherche, gestionnaire de l'Observatoire. Des routines de validation semi-automatisées ont été mises en place pour permettre une validation plus rapide des 34 000 données mensuelles d’ORACLE, mais aussi une certaine répétabilité de la validation. L'utilisation des outils statistiques (e.g., moyenne, quartiles…) permet i) d'effectuer une inter-comparaison sur l'ensemble de la série de données sur toute la période d'Observation et ii) de vérifier la cohérence de la série, des variables et des paramètres les uns par rapport aux autres. Les outils et méthodes de validation, mais également la reconstitution des données, s'appuient sur l'expérience et l'expertise du Cemagref, développée depuis près de 50 ans sur la gestion des données. Dans chaque fichier validé sont étiquetées les données validées et les données reconstituées.