Aller au contenu principal

🤖 Scikit-learn

Scikit-learn est la bibliothèque de référence pour l'apprentissage automatique en Python.

🔹 Importation

from sklearn import datasets, model_selection, linear_model, metrics

🔹 Jeu de données d'exemple

X, y = datasets.load_iris(return_X_y=True)

🔹 Découper en train/test

X_train, X_test, y_train, y_test = model_selection.train_test_split(
X, y, test_size=0.2, random_state=42
)

🔹 Régression linéaire

model = linear_model.LinearRegression()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

🔹 Classification — Exemple avec une régression logistique

from sklearn.linear_model import LogisticRegression

model = LogisticRegression()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

🔹 Évaluer le modèle

print(metrics.accuracy_score(y_test, y_pred))  # Pour classification
print(metrics.mean_squared_error(y_test, y_pred)) # Pour régression

🔹 Pipelines et normalisation

from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler

model = make_pipeline(StandardScaler(), LogisticRegression())
model.fit(X_train, y_train)

🔹 Autres modèles populaires

  • ✅ Arbres de décision : sklearn.tree.DecisionTreeClassifier
  • ✅ Forêts aléatoires : sklearn.ensemble.RandomForestClassifier
  • ✅ SVM : sklearn.svm.SVC
  • ✅ K-plus proches voisins : sklearn.neighbors.KNeighborsClassifier
  • ✅ Régression logistique : sklearn.linear_model.LogisticRegression

💡 Scikit-learn propose des dizaines d'algorithmes et outils pour le machine learning supervisé et non supervisé.

Documentation complète : https://scikit-learn.org/stable/