Exploiter des données météorologiques pour aborder l’intérêt des métadonnées

Notre société devient une société de plus en plus connectée, où l’informatique et le numérique prennent une place toujours plus importante dans les transports, la santé, la surveillance de l’environnement ou la médecine.

Ce monde connecté est basé sur l’accumulation d’un nombre presque infini de données, stockées sur des serveurs ou des clouds: il s’agit de données privées, de données publiques, de données d’entreprises, de commerce …

Les données prennent toutes les formes possibles: elles peuvent être des photos, des codes, des chiffres, des historiques, des documents, des messages …
Une nouvelle notion commence à sortir dans les médias et dans les programmes d’enseignement; il s’agit de la notion de “méta-donnée“.
En effet,  les données seules ne suffisent pas à leur interprétation, cette dernière nécessite l’aide des “méta-données” pour pouvoir être analysées et interprétées correctement.

Que sont donc les méta-données ?
Comment les étudier avec nos élèves ?
Comment montrer aux élèves des exemples de méta-données ?
Quelle base de données utiliser avec nos élèves pour illustrer cette nuance entre données et métadonnées ? 

C’est ce à quoi cet article propose de répondre, en prenant pour exemple la base de données du site EduMed Obs, l’Observatoire Méditerranéen à but éducatif de l’Université Côte d’Azur.

Pour visualiser la différence entre les données et les métadonnées, les données MÉTÉO sont de bonnes candidates. 


1ère étape : Se connecter sur le site EduMed Obs : http://edumed.unice.fr/fr 
2ième étape : Aller sur l’onglet DATA CENTER, puis choisir les data “MÉTÉO” 
 3ième étape : Aller sur les Dérouleurs Journaliers , et choisir la station météo connectée de votre choix.
Vous pouvez sélectionner une station Education ou une station Recherche (réseau MétéoFrance ….)
On peut choisir par exemple la station météo connectée du collège du Luc en Provence, et voici les graphiques obtenus: 

Capteur connecté 1: Pluviomètre (bleur clair)
Capteur connecté 2: Thermomètre (en rouge)
Capteur connecté 3: Baromètre (en vert)
Capteur connecté 4: Hygromètre (en bleu foncé)

Ces 4 graphiques sont faciles d’interprétation, mais ne reflètent pas les “données et métadonnées” telles qu’elles sont enregistrées par les capteurs de la station météo connectée. En effet, ces graphiques montrent déjà un prétraitement , mais ne sont pas les données brutes générées par les capteurs.

Il faut donc aller chercher les données brutes, en interrogeant directement les capteurs !

4ième étape: Effectuons une requête auprès du serveur EduMed pour accéder aux  données brutes enregistrées et stockées par les capteurs météo.
Pour cela,  aller dans DONNÉES MÉTÉO, puis sélectionner la PLAGE TEMPORELLE DE DONNÉESqui vous intérésse, par exemple du 25 Avril au 30 Avril 2020.
Puis, télécharger l’archive ZIP.
Ouvrez ensuite le fichier Zip, qui est au format .csv, qui se lit avec n’importe quel tableur (libre office Calc, ou Excel ou Numbers).

Une fois le fichier ouvert avec un tableur, les données chiffrées enregistrées par les différents capteurs apparaissent à partir de la ligne la ligne 22.
Il s’agit de données “brutes”; c’est à dire seulement des chiffres !
Mais si on ne dispose que de chiffres, il nous manque d’autres informations cruciales pour les intérpréter , non ?!
Par exemple, il nous manque les unités de chaque grandeur météo enregistrée, le temps entre chaque mesure.
Il nous manque aussi l’endroit exact (au centimètre près !) de la station météo, car la simple ville ne suffit pas pour savoir où est positionnée la station. Il nous faut donc les coordonnées GPS.

Toutes ces données qui entourent les données brutes, sont appelées les “métadonnées”.
Les métadonnées sont donc des compléments d’informations qui permettent d’analyser le jeu de données brutes, chiffrées, générées par les capteurs.
Les métadonnées sont donc essentielles pour comprendre les jeux de données brutes (numériques) dont les météorologues disposent pour pouvoir effectuer leurs recherches.

Voici où se situent les métadonnées dans ce fichier csv, entre la ligne 1 et la ligne 22 :  

Vous pouvez faire vous même vos propres requêtes , analyser vos données, en météo, mais aussi en sismologie, en hydrologie et en océanographie en vous rendant sur le site EduMed.

Cette activité, ainsi que d’autres exemples de données et de métadonnées ,  vous sont présentées étapes par étapes dans cette vidéo (ou directement en cliquant ici):