Statistiques pour les sciences sociales

Sciences Po — Printemps 2025

1. La construction du chiffre

Nous retracerons l'émergence des pratiques statistiques modernes et leur rôle dans la formation de l'État et des politiques publiques. Comment les recensements, enquêtes et sondages ont-ils progressivement construit la notion même de « population » comme objet de gouvernement ? En quoi les catégories statistiques (CSP, chômage, pauvreté) cristallisent-elles des visions particulières du monde social ? Quelles conséquences l'actuelle massification des données a-t-elle sur notre rapport aux chiffres ?

2. Décrire et comparer : les fondamentaux de l'analyse statistique

Toute analyse quantitative repose sur une réduction du réel à des indicateurs synthétiques. Nous explorerons les outils fondamentaux des statistiques descriptives (moyennes, quantiles, écarts-types) et leurs implications analytiques. Pourquoi le choix d'un indicateur plutôt qu'un autre peut-il conduire à des interprétations radicalement différentes d'une même réalité ? Comment le choix d'une échelle ou d'une représentation graphique oriente-t-il la lecture des données ? En quoi la distribution normale s'est-elle imposée comme référence implicite de nombreuses analyses, avec quels effets sur notre perception des écarts à la moyenne ?

3. Corrélation et causalité : les défis de l'explication

Établir des relations causales à partir de données observationnelles constitue l'un des défis majeurs de la médecine, de la psychologie, des sciences sociales... Nous examinerons les méthodes élaborées pour dépasser la simple corrélation et leurs présupposés épistémologiques. Comment distinguer une association statistique d'une véritable relation causale ? Quels sont les atouts et les limites des essais randomisés contrôlés, souvent présentés comme l'étalon-or de la causalité ? La perspective historique sur l'évolution de ces méthodes, des premières analyses de corrélation aux techniques d'appariement contemporaines, nous permettra d'en saisir les enjeux scientifiques et éthiques.

4. Sources et catégories : la fabrique des données

Les données ne sont jamais simplement « données » mais toujours construites en suivant des choix méthodologiques qui méritent examen. Nous analyserons les différentes sources statistiques (recensements, enquêtes, registres administratifs, traces historiques) et leurs spécificités. Comment la formulation d'une question influence-t-elle les réponses obtenues ? Quels biais affectent les différentes méthodes d'échantillonnage ? Le débat sur les statistiques ethniques illustre particulièrement les enjeux politiques de la catégorisation statistique. Nous verrons également comment certaines réalités sociales résistent à la quantification et quelles conséquences cela peut avoir sur leur prise en compte politique.

5. Inférence et preuve : la question de la généralisation

L'ambition des sciences quantitatives est souvent de tirer des conclusions générales à partir d'observations limitées. Comment déterminer si un écart observé est « significatif » ou simplement dû au hasard de l'échantillonnage ? Que nous dit véritablement un intervalle de confiance à 95% ? La p-valeur, devenue un critère central de validation scientifique, fait aujourd'hui l'objet de critiques substantielles que nous examinerons.

6. Modéliser et prédire : régression et au-delà

Les modèles statistiques constituent un outil privilégié pour comprendre les relations entre variables et formuler des prédictions. Nous explorerons les principes de la régression linéaire et ses extensions, ainsi que leur utilisation en sciences sociales. Comment interpréter des coefficients de régression ? Quelles hypothèses implicites ces modèles comportent-ils ? Nous examinerons également les enjeux éthiques des modèles prédictifs dans des domaines comme la justice pénale, l'éducation ou la santé.

7. Visualiser et communiquer : la rhétorique des données

La présentation des données statistiques constitue une forme de rhétorique visuelle qui n'est jamais neutre. Quels mécanismes cognitifs guident notre perception des représentations statistiques ? Comment équilibrer impact visuel et honnêteté intellectuelle ?

8. Statistiques et décision publique

Les statistiques occupent une place centrale dans l'élaboration et l'évaluation des politiques publiques. Nous examinerons leur rôle dans la gouvernance contemporaine et les tensions qui en résultent. Comment les indicateurs statistiques (taux de chômage, PIB, scores PISA) orientent-ils l'action publique ? En quoi les modes de scrutin et les sondages façonnent-ils notre vie démocratique ? La quantification des performances (benchmarking, indicateurs de gestion) transforme-t-elle en profondeur le fonctionnement des organisations publiques ? Nous étudierons également l'émergence d'initiatives citoyennes visant à réapproprier la production et l'interprétation des statistiques face à leur monopolisation institutionnelle.

9. Pour une approche réflexive des méthodes quantitatives

En guise de conclusion, nous explorerons les perspectives ouvertes par Maurice Halbwachs pour développer un rapport plus réflexif à la quantification. Comment maintenir une tension féconde entre l'abstraction statistique et la complexité du réel ? À travers des exemples concrets d'usages critiques et créatifs des méthodes quantitatives, nous réfléchirons aux conditions d'une pratique statistique consciente de ses présupposés et de ses effets, moins susceptible de réifier le social.