Ce que l’on nomme le paradoxe de Simpson est un biais statistique, qui permet d’observer une tendance dans un groupe donné, lors que l’on observe la tendance inverse si on le subdivise en plusieurs sous-groupes.
Voici un exemple (imaginaire). Ci-dessous, la proportion de chômage dans la population totale, mais également en la répartissant en deux sous-groupes : “population diplômée” et “population non diplômée”.
Proportion de chômage dans… | 1982 | 2009 |
---|---|---|
Population diplomée | 8.6% | 8.9% |
Population non diplômée | 13.6% | 13.9% |
Population totale | 12.35% | 11.9% |
Le taux de chômage augmente dans chaque sous-groupe, alors qu’il diminue dans la population totale. Aucune erreur, un calcul (disponible dans la source ci-dessous) permet de mettre en évidence ce que l’on appelle le facteur de confusion : la proportion des sous-groupes évolue entre 1982 et 2009 (respectivement 25% de diplômés, puis 56%). Ce facteur de confusion (donnée cachée dans les chiffres, mais pourtant bien présente) permet ainsi de donner l’illusion de tendances inversées.
Crédits
- Image par Artem Podrez
- Source : Nathalie W.
- Bibliographie : Ekhorizon
Soyez le premier à commenter