Méthodes d’analyse de données adaptées à la configuration de la PNIN (2/3)

2. Les données d’enquêtes basées sur la population ou les données de routine ne permettent pas une analyse solide des liens de causalité ou une évaluation d’impact
Les décideurs politiques sont, de manière compréhensible, intéressés par les grandes questions, par exemple : « Les investissements dans ce programme ont-ils réduit les taux d’anémie ? » Afin de pouvoir tirer une conclusion définitive et invoquer un lien de causalité, un certain nombre de conditions doivent être remplies par l’analyse de données :
- il existe une association statistiquement significative entre la mise en œuvre du programme pour la nutrition et la réduction des taux d’anémie ;
- les investissements dans le programme concerné ont eu lieu avant la réduction mesurée de l’anémie (temporalité).
Cela n’est cependant pas suffisant pour conclure à l’existence d’un lien de causalité.
Par exemple, une personne qui boit du café tous les matins avant le lever du soleil peut conclure que boire du café fait lever le soleil. Il existe une association parfaite et la consommation de café précède le lever du soleil. Pourtant, personne ne tirerait cette conclusion !
(Exemple donné par J. Leroy, IFPRI. Regarder la vidéo de sa présentation lors du premier rassemblement international des PNIN, à Paris, en juillet 2018)
(Exemple donné par J. Leroy, IFPRI. Regarder la vidéo de sa présentation lors du premier rassemblement international des PNIN, à Paris, en juillet 2018)
D’autres facteurs doivent être pris en compte, comme :
- la plausibilité : l’interprétation causale de l’association observée doit être cohérente avec les connaissances existantes. Connaissant les lois de l’univers, cela n’a pas de sens d’interpréter l’association entre boire du café et le lever du soleil comme étant causale ;
- des facteurs de confusion (voir ci-dessous) pourraient fournir une explication alternative pour l’association observée et ceci doit être vérifié ;
- d’autres critères permettant de suggérer une causalité ont été décrits ici : Hill and Bradford (1965) : The Environment and Disease : Association or Causation ?. Proceedings of the Royal Society of Medicine, 58 (5) : 295-300 (voir ci-dessous).
L’utilisation de données d’enquêtes basées sur la population ou de données de routine pour effectuer une analyse de causalité peut être erronée et est sujette à critique
L’exemple ci-dessous fournit une illustration concrète. De nombreuses études scientifiques utilisent des méthodes de modélisation par régression pour effectuer une analyse de causalité en matière de nutrition à l’aide d’enquêtes basées sur la population (Source : FEWSNET).
Cependant ces études :
L’exemple ci-dessous fournit une illustration concrète. De nombreuses études scientifiques utilisent des méthodes de modélisation par régression pour effectuer une analyse de causalité en matière de nutrition à l’aide d’enquêtes basées sur la population (Source : FEWSNET).
Cependant ces études :
- peuvent être erronées et sujettes à critique, car elles ne contrôlent pas tous les facteurs de confusion ;
- peuvent avoir une incidence de colinéarité élevée (lorsque les causes sont co-associées) ;
- expliquent rarement plus de 20 % de la variabilité observée ;
- fournissent rarement de nouvelles informations ;
- fournissent rarement des recommandations traduisibles en actions ou en décisions.
*****
The Environment and Disease : Association or Causation ? Bradford & Hill, 1965