Aller au contenu principal

🐼 Pandas

Pandas permet de manipuler facilement des tableaux de données (semblables à des feuilles Excel) en Python.

🔹 Importation

import pandas as pd

🔹 Créer un DataFrame

import pandas as pd

d = {
"Nom": ["Alice", "Bob", "Charlie"],
"Âge": [25, 30, 35]
}

df = pd.DataFrame(d)
print(df)

🔹 Lire et écrire des fichiers

df = pd.read_csv("donnees.csv")
df.to_csv("resultats.csv", index=False)

Autres formats possibles : .xlsx, .json, .html, etc.


🔹 Aperçu rapide

df.head()      # premières lignes
df.tail() # dernières lignes
df.info() # résumé des colonnes
df.describe() # stats descriptives

🔹 Accès aux données

df["Nom"]         # colonne "Nom"
df.iloc[0] # première ligne (par position)
df.loc[0, "Nom"] # valeur ligne 0, colonne "Nom"

🔹 Filtrer les données

df[df["Âge"] > 30]  # lignes où l'âge > 30

🔹 Opérations fréquentes

df["Âge"].mean()       # moyenne
df["Nom"].unique() # valeurs uniques
df.sort_values("Âge") # tri par âge
df["Âge"] += 1 # ajouter 1 à toute la colonne

🔹 Ajouter ou supprimer

df["Ville"] = ["Paris", "Montréal", "Bruxelles"]  # ajouter colonne
df.drop("Âge", axis=1, inplace=True) # supprimer colonne

🔹 Fusionner des DataFrames

df1 = pd.DataFrame({"id": [1, 2], "Nom": ["Alice", "Bob"]})
df2 = pd.DataFrame({"id": [1, 2], "Âge": [25, 30]})

df_merged = pd.merge(df1, df2, on="id")

💡 Pandas est très utile pour explorer, nettoyer et transformer des jeux de données.

Documentation complète : https://pandas.pydata.org/docs/