Comment calculer les indicateurs statistiques d'un échantillon en Python ?
En chargeant un fichier csv via pandas.read_csv puis en utilisant describe, head, shape, sort_values sur le DataFrame
L'objectif
Charger un fichier csv, visualiser les premières lignes, calculer un résumé statistique et trier les données avec pandas.
Le principe
pandas.read_csv renvoie un DataFrame ; df.shape donne (n, p), df.head() affiche les premières lignes, df.describe() renvoie pour chaque colonne numérique , et df.sort_values(by=...) trie selon une colonne.
La méthode
- 1J'importe pandas :
import pandas as pd. - 2Je charge le fichier :
df = pd.read_csv('fichier.csv'). - 3J'explore :
df.shape(taille),df.head()(5 premières lignes),df.columns(noms). - 4J'applique
df.describe()pour le résumé statistique etdf.sort_values(by='col')pour trier.
Exemple corrigé
Difficulté croissante de 1 à 3
Exercices aujourd'hui0 / 3
Prêt à t'entraîner ?
Génère un exercice personnalisé sur cette méthode et entraîne-toi avec la correction IA.