TP2 - Analyse de données
🎯 Objectifs pédagogiques
À la fin de ce travail, vous serez capable de :
- Lire et traiter des fichiers CSV avec Pandas et Numpy
- Créer des visualisations de données avec Matplotlib et Seaborn
- Appliquer des concepts statistiques de base avec Scikit-Learn
- Interpréter des données scientifiques réelles
2 points Répertoire Git
- Au moins 5 commits de tailles comparables (il n'y a pas un commit avec tout dedans et les autres vides)
- Au moins 1 commit par semaine
- Les commits décrivent l'avancement du projet dans un français sans faute (voir instructions)
📝 Choix de projet
Pour faire ce TP, vous devez créer un projet PyCharm dans le répertoire GitHub Classroom créé pour vous par le prof.
Vous devez choisir un projet parmi ceux proposés ci-dessous.
TODO : les projets présentés sont des exemples et vont probablement changer...
- Bioinformatique
- Physique
- Chimie
- Géologie
Projet : Analyse de la qualité de l'eau potable
Description : Examiner les concentrations de différents contaminants dans l'eau potable de diverses municipalités. Comparer les résultats aux normes établies.
Source de données : Données Québec – Qualité de l'eau
Projet : Étude des anomalies géophysiques
Description : Analyser les anomalies géophysiques détectées dans différentes régions du Québec pour identifier des zones d'intérêt géologique.
Source de données : Données Québec – Anomalies géophysiques
📂 Structure du dépôt Git
tp2/
├── README.md
├── analyse.py
├── visualisation.py
├── data/
│ └── donnees.csv
└── figures/
└── graphique.png