Corrélation statistique et lien de causalité

Il apparaîtrait évident qu'un gène (ou plus généralement un comportement ou la présence d'une cause potentielle) statistiquement plus présent chez des individus présentant une pathologie que dans le reste de la population soit effectivement responsable de la dite pathologie. Toute survenue d'un état inhabituel doit être la conséquence d'un élément prédisposant ou directement causal, voudrait le bon sens commun. Ainsi la proximité d'un centre de retraitement de déchets nucléaires devrait expliquer un excès statistique de leucémies. Qu'un gène soit statistiquement plus présent chez des individus homosexuels (Dean Hamer, Science, 261, 291 et 321, 1993) pourrait corroborer l'hypothèse (ou le fantasme) du déterminisme génétique concernant l'orientation sexuelle (voir l'article Guerre de religion). Que les bébés habitués à dormir la lumière allumée développent statistiquement plus de myopie que les autres (G.E. Quinn et al., Nature, 399, 113, 1999) pourrait laisser à penser que l'éclairage nocturne est très néfaste pour la vue et qu'il faille donc changer de comportement.

Il y a statistiquement plus de cyclistes dopés dans le Tour de France que dans les autres courses nous révèlent apparemment les observations, faut-il en conclure que ce sont les organisateurs du Tour qui obligent les coureurs à ce doper ?!!!

Mascotte CyberZoïdale

De telles conclusions aussi hâtives seraient lourdes de conséquences. La radioactivité naturelle, le régime alimentaire, les mœurs liés à l'époque, l'environnement familial, le caractère héréditaire avéré de la myopie et bien d'autres encore militent pour une multiplicité des causes. Tout comme la performance sportive dépend du métabolisme (déjà tout un programme), du régime alimentaire, des conditions psychiques, des pressions environnementales, etc. chaque état ou pathologie n'est pas le fruit d'une unique cause. Aristote considérait que tout phénomène est divisible en deux parties qui se trouvent, l'une par rapport à l'autre, dans un rapport de cause à effet. Mais le nombre de chaînes causales est infini. La diversité et la disparité des effets et de leurs éventuelles causes rend très difficile et dangereuse l'interprétation des états inhabituels. Enfin, nos moyens de mesure et d'observation ne nous permettent pas de saisir la totalité de l'information. La valeur quantitative ne renseigne en rien sur la porté qualitative.

Une corrélation statistique ne sera jamais la preuve d'un lien direct de causalité.