L’acupuncture contre les nausées de la grossesse

Récemment, j’ai partagé sur mon fil twitter ainsi que sur ma page facebook un article du blog Science-Based Medicine intitulé « False Claims for Acupuncture« . En deux mots cet article décrit les conclusions essentiellement négatives concernant l’efficacité de l’acupuncture pour n’importe quelle condition. Sur le partage facebook, une lectrice pose une question intéressante : « Et donc pourquoi la HAS recommande l’acu pour le traitement des nausées gravidiques ? ».

C’est effectivement une très bonne question. J’ai moi-même tendance, lorsque je ne suis pas expert sur un sujet à aligner mon opinion sur le consensus scientifique, s’il existe, et j’utilise en général la position des agences de santé comme un proxy pour un tel consensus. À peu près la totalité des mes lectures sur l’acupuncture, à partir de sources que je juge habituellement très fiables, comme le blog Science-Based Medicine, m’a conduit à l’opinion que l’acupuncture ne fonctionne pour rien. La question de mon interlocutrice vient donc me faire douter. Pourquoi, en effet, la Haute autorité de la Santé, un organisme pas vraiment connu pour ses extravagances ou positions folles, et au contraire plutôt connu pour des prises de position basées sur la science, recommande-t-elle l’acupuncture pour les nausées de grossesse ?

J’ai donc décidé de creuser un peu la question, et comme elle n’est pas simple, j’ai trouvé plus utile d’en faire un billet de blog plutôt que de répondre directement dans le fil Facebook.

J’ai commencé par chercher sur le site de la HAS les documents où il était question de recommandations de l’acupuncture pour les nausées de grossesse ; j’ai trouvé ceci. On peut y lire (page 20) :

Seuls le gingembre et l’acupuncture sont efficaces pour les nausées (grade A).

Et un peu plus loin (page 23) à propos des mesures qui « peuvent s’avérer efficaces » pour réduire les symptômes de nausées et vomissements en début de grossesse :

méthodes naturelles : gingembre en gélule ; stimulation du point d’acupuncture P6 ou point de Neiguan (point situé à la face interne de l’avant-bras, trois doigts au-dessus du poignet) (grade A)

Sur quoi se base la HAS pour affirmer cela ? Réponse en début de document (page 10) :

Ce travail s’appuie sur une traduction en français des recommandations du National Institute for Clinical Excellence (NICE) « Antenatal care : routine care for the healthy pregnant woman » publiées en octobre 2003.

D’emblée, je prends note de deux choses ici : d’une part il s’agit d’une traduction, il faut donc que j’aille lire l’original, et d’autre part le document date déjà de 2003, et il est fort probable que d’autres éléments de preuve aient vu le jour depuis.

Notons au passage que le « grade A » désigne un niveau de preuve sur une échelle de trois grades (A, B et C) ainsi décrite :

une recommandation de grade A est fondée sur des études scientifiques de fort niveau de preuve ; une recommandation de grade B est fondée sur des présomptions scientifiques fournies par des études de niveau de preuve intermédiaire ; une recommandation de grade C est fondée sur des études de faible niveau de preuve.

Le document de la HAS n’en dit pas plus et ne cite pas les références de NICE. Je décide donc de m’attaquer au document original que l’on trouvera ici. Il s’agit d’un document beaucoup plus fourni, et la discussion concernant les nausées commence en section 6.1, page 130 sur un total de 454. On y apprend qu’ils se sont basés sur trois revues systématiques d’essais cliniques randomisés contrôlés (RCT en anglais, pour Randomized Clinical Trial). A priori, il s’agit du plus haut niveau de preuve en sciences. J’ajouterai cependant que les revues systématiques ne sont pas immunisées contre l’erreur. Elles souffrent en particulier de ce que nos amis anglophones ont surnommé GIGO : Garbage In, Garbage Out. Autrement dit, une revue systématique qui n’incorpore que des données douteuses ne pourra sortir qu’une conclusion douteuse.

Ces trois revues systématiques incluaient alors 7 RCTs testant l’efficacité sur les nausées de l’acupression du point P6, situé sur la face antérieur de l’avant-bras à approximativement trois doigts du poignet. Six RCT montraient un effet positif et le 7e ne montrait pas d’effet supérieur au groupe avec traitement simulé ou au groupe contrôle (non traité). D’autres études sur le port de bracelets d’acupression sont également mentionnées.

Notons ici qu’il ne s’agit donc pas de véritable acupuncture. Cela fait partie des « tactiques » habituelles, quoique probablement inconscientes, des promoteurs de l’acupuncture : modifier la définition et la rendre suffisamment vague dans l’espoir de faire ressortir quelque chose de positif. Le terme acupuncture est utilisé dans la littérature indifféremment pour décrire diverses choses : planter des aiguilles dans des points spécifiques décrits par la MTC (Médecine Traditionnelle Chinoise), planter des aiguilles n’importe où, faire pression sur un point d’acupuncture, faire pression n’importe où, mettre des aiguilles et faire passer un courant électrique.

Mais ne jugeons pas trop vite. À ce stade, il faut maintenant se tourner vers les trois revues systématiques citées. Voici les références :

  • Jewell D, Young G. Interventions for nausea and vomiting in early pregnancy. Cochrane Database of Systematic Reviews. 2001;(2)
  • Murphy PA. Alternative therapies for nausea and vomiting of pregnancy. Obstetrics and Gynecology. 1998;91:149–55
  • Vickers AJ. Can acupuncture have specific effects on health? A systematic review of acupuncture antiemesis trials. Journal of the Royal Society of Medicine. 1996;89:303–11

Évidemment, ça commence à dater. Plus de 20 ans se sont écoulés depuis la dernière référence, ce qui est énorme dans le monde de la recherche. Jetons un oeil à la première référence. En la cherchant, on tombe d’abord là-dessus, où on peut lire (traduction personnelle) :

Cette revue a été retirée des publications car elle a été remplacée par une nouvelle revue (Matthew 2010)

Il sera intéressant d’aller voir cette nouvelle revue, mais pour l’instant, cherchons l’original de 2003. Avec quelques outils adéquats, on peut retrouver le texte sans trop de peine. Citons les conclusions des auteurs (traduction personnelle) :

Les preuves concernant l’acupuncture ou l’acupression de P6 sont limitées. Elles n’ont pas permis de montrer une meilleure efficacité qu’une acupuncture ou acupression simulée ou qu’une approche standard centrée sur l’alimentation et le style de vie.

Pas un très bon début. Et que dit la version mise à jour de 2010 ? À peu près la même chose :

Les preuves concernant l’efficacité de l’acupression de P6 (y compris l’acustimulation) sont limitées. Quelques données sont en faveur de l’acupression auriculaire, mais de plus grandes études sont nécessaires pour confirmer ces résultats. L’acupuncture (P6 ou traditionnelle) n’a pas montré de bénéfice significatif chez les femmes victimes de nausées ou vomissements en début de grossesse.

Les plus courageux pourront aller se plonger dans le reste du texte. On y apprend des choses intéressantes sur les problèmes méthodologiques notamment sur la nécessité d’un bon aveugle dans les études. Les études en acupuncture sont réputées pour être difficiles à aveugler ; il ne suffit pas donc de trouver un mécanisme d’aveugle à la fois pour les patientes et les praticiens, mais il faut en plus vérifier post hoc que l’aveugle a bien fonctionné. Si les patientes ont pu deviner dans quel groupe elles appartenaient, cela remet en cause les résultats. C’est effectivement une critique qui revient dans le papier. On y apprend aussi l’importance de rapporter tout traitement concomitant. Certaines études ne spécifiaient pas si de telles données avaient été collectées. C’est évidemment crucial : si le groupe expérimental est aussi plus friand d’anti-émétiques, cela peut fausser les résultats. Un tas d’autres considérations sont également discutées.

Passons à la seconde référence. Je n’ai malheureusement pas pu trouver un texte complet, mais l’abstract est disponible ici. Dans la section des résultats on lit :

Des preuves d’effets bénéfiques ont été trouvées pour ces trois interventions [acupression, gingembre et pyridoxine], bien que les données concernant l’acupression sont équivoques.

Cette précaution veut dire qu’il faudrait plus de données, plus d’études pour avoir une idée plus claire de ces effets bénéfiques. Manifestement, 10 années de plus de recherches (Matthews 2010) ont répondu à la question : il n’y a pas d’effet.

La troisième référence, la plus ancienne donc probablement la moins intéressante pour nous à ce stade, peut être trouvée ici. L’abstract vaut la peine d’être cité extensivement :

Trente-trois essais cliniques ont été publiés dans le monde, dans lesquels le point d’acupuncture P6 était stimulé pour le traitement des nausées et/ou vomissements associés à la chimiothérapie, la grossesse ou la chirurgie.

L’acupuncture de P6 était égale ou inférieure au groupe contrôle dans 4 essais lors desquels elle était administrée sous anesthésie ; dans 27 des 29 essais restants, l’acupuncture était statistiquement supérieure. Une seconde analyse a été faite sur les 12 études de plus haute qualité, randomisées et contrôlées contre placebo, dans lesquelles la stimulation du point d’acupuncture P6 n’était pas administrée sous anesthésie. Onze de ces études, incluant près de 2000 patients, montraient un effet de P6. Les articles revus montraient des résultats cohérents à travers les investigateurs, les différents groupes de patients, et les différente formes de stimulation du point d’acupuncture.

En-dehors des conditions d’anesthésie, la stimulation du point d’acupuncture P6 semble être une technique antiémétique efficace. Les chercheurs font maintenant face à un choix entre accepter que l’acupuncture a réellement des effets spécifiques et passer de « L’acupuncture fonctionne-t-elle ? » à une série de questions plus pratiques ; ou bien décider que les preuves de l’effet antiémétique de P6 sont trop limitées et spécifier ce qui serait considéré comme des preuves acceptables.

Pour ceux qui n’ont pas l’habitude de la littérature scientifique, le langage est assez inhabituel.

Comme pour les autres articles, la lecture du texte regorge d’informations intéressantes. Les scientifiques ont l’habitude de penser systématiquement à tout ce qui pourrait fausser leurs résultats et ils citent une série de facteurs qui pourraient expliquer de faux positifs ou faux négatifs. On trouve de nouveau une discussion sur l’aveugle dans ce papier, un point particulièrement crucial dans les études d’acupuncture. On y lit que l’article mélange des études aveuglées et non aveuglées ; lorsque l’analyse est restreinte au sous-groupe des études aveuglées, l’effet devient seulement « marginalement supérieur » au groupe contrôle. La présence de stimulation électrique pose également problème, notamment pour la difficulté d’aveugler la sensation du courant électrique mais également parce qu’une stimulation électrique est fort différente d’une acupuncture véritable, et il n’est pas impossible que l’acupuncture soit sans effet mais la stimulation électrique en ait un. Il faut enfin souligner l’honnêteté de l’auteur qui décrit sa méthode d’évaluation de la qualité des études incluses comme « inhabituelle » et pouvant « potentiellement diminuer la réplicabilité de cette revue ».

La lecture de ces discussions est vraiment intéressante. Alors qu’on peut trouver des conclusions parfois relativement tranchées dans les abstracts, la section Discussion est remplie de précautions diverses. C’est le scepticisme par défaut propre à la méthode scientifique, une approche hautement plus subtil, mais sans doute moins satisfaisante que les formules péremptoires et absolues qu’on peut trouver dans les médias traditionnels qui rapportent la science.

Bref, après s’être plongé plus ou moins profondément dans les preuves disponibles, la question n’est toujours pas vraiment répondue. Certes, la HAS reprend sans broncher les résultats de NICE, mais cela ne dit pas pourquoi NICE se montre si enthousiaste vis-à-vis de l’acupuncture lorsque 2 des 3 références sont essentiellement négatives et par ailleurs de plus grande importance étant donné qu’elles sont plus récentes.

Mon avis personnel, qui n’engage que moi, est sans doute que l’approche et l’objectif sont différents. Les revues systématiques tentent d’établir un fait de notre monde : l’acupuncture est-elle efficace dans le traitement des nausées de la grossesse ? La réponse est : probablement non. Les recommandations de NICE et de la HAS sont des recommandations : des guides pour les médecins sur ce qu’ils peuvent potentiellement recommander à leurs patientes pour traiter un symptôme désagréable (et parfois dangereux). Certains argumenteront que les critères de scientificité et de véracité peuvent être amoindris dans un tel scénario. Peut-être l’acupuncture n’a pas d’effet, mais certaines études en montrent un quand même, et si ça ne fait pas de mal, alors pour ne pas essayer ? C’était peut-être l’état d’esprit des auteurs du rapport NICE, que je ne partage pas, mais qui peut certainement être débattu.

Je n’ai en tout cas pas trouvé de raisons convaincantes de changer d’avis sur l’acupuncture. Pour être honnête, je pars d’un a priori négatif, non pas en raisons de convictions personnelles, mais à partir de nombreuses lectures fiables. Ce que je conclurai personnellement de ces quelques recherches, c’est qu’il n’y a rien qui remplace la lecture de la littérature scientifique, pas même l’avis d’une agence scientifique. Je ne serais cependant pas étonné si la HAS arrêtait de recommander l’acupuncture dans une mise à jour de leurs recommandations.

Publicités

Le problème de la reproductibilité (Steven Novella)

Traduit de « The Reproducibility Problem », publié par Steven Novella le 31/08/2015 sur son blog NeuroLogica.


Une récente et gigantesque étude tentant de répliquer 100 études publiées en psychologie a reçu beaucoup d’attention dernièrement, non sans raison. La couverture médiatique a été généralement bonne, à vrai dire – probablement parce que les résultats sont plutôt bancals. Beaucoup se sont empressés de mettre en avant que « la science n’est pas cassée » tandis que d’autres se demandaient « la science est-elle cassée? »

Alors qu’ils étaient nombreux à être surpris par les résultats de l’étude, les auteurs en premier, je n’étais personnellement pas surpris du tout. Les résultats vont dans le sens de ce que je raconte depuis des années sur ce blog et sur SBM [NdT: Science-Based Medicine, un blog auquel contribue Steven Novella] – nous devons prendre beaucoup plus au sérieux la réplication.

Voici les résultats de l’étude: Lire la suite

La méthode scientifique: erreurs statistiques (Regina Nuzzo)

Dans la catégorie des critiques sur la recherche scientifique, la méthodologie, le processus de publication… voici un article de Regina Nuzzo, chargée de cours en statistiques à l’Université Gallaudet de Washington DC, qui traite de l’utilisation abusive des p-values.

Article original: « Scientific method: Statistical errors » publié le 12 février 2014 sur Nature.


DALE EDWIN MURRAY

DALE EDWIN MURRAY

Pendant un bref instant en 2010, Matt Motyl était à deux doigts d’une gloire scientifique: il avait découvert que les extrémistes voient littéralement le monde en noir et blanc.

Les résultats étaient clairs comme de l’eau de roche, se rappelle Motyl, un thésard en psychologie à l’Université de Virginia à Charlottesville. Les données d’une étude portant sur près de 2000 personnes montraient que les personnes politiquement modérées voyaient les nuances de gris avec plus d’acuité que les extrémistes de gauche ou de droite. « L’hypothèse était sexy, dit-il, et les données la soutenaient clairement. » La p-value, une valeur courante pour représenter la robustesse d’un résultat, était de 0.01 – habituellement interprété comme un résultat très significatif. La publication dans un journal à haut impact était à portée de main pour Motyl.

Puis intervint la réalité. Lire la suite

Des vérités individuelles (NY Times)

La recherche scientifique est une des plus nobles et passionnantes activités humaines. Mais les hommes de science sont des hommes avant tout, et, malgré des succès indéniables – et impensables dans n’importe quelle autre activité –, la recherche souffre aussi de problèmes internes.

Il y a quelques temps, le sujet du biais de publication avait déjà été abordé sur ce blog, avec une proposition d’un chercheur pour changer le processus de publication afin de réduire ce biais. Aujourd’hui, on s’interroge sur le problème des recherches non reproductibles, ou non réplicables, avec un article de George Johnson, publié dans la section Science du New York Times le 20 janvier 2014 et sous le titre « New Truths That Only One Can See« .


Carl WiensDepuis 1955, le Journal of Irreproducible Results [Journal des résultats non reproductibles] nous a offert « des caricatures, des parodies, des fantaisies, du burlesque, du ridicule, des satires » à propos de la vie au laboratoire. Parmi ses plus grands titres: « Oscillations acoustiques dans la gelée, avec et sans fruit, soumise à divers niveaux de stress » et « Utiliser des boucles infinies pour calculer une valeur approximative de l’infini. » Ces plaisanteries bon enfant sont une célébration détournée de la science. Ce qui se déroule réellement au laboratoire est d’une nature plus noble et plus sérieuse.

Ce fut déconcertant d’apprendre, ces dernières années, Lire la suite

Un nouveau genre de peer-review? (Neuroskeptic)

Article original: « A New Kind of Peer Review?« , publié le 13 juillet 2013 par Neuroskeptic.

La critique des pseudosciences, des médecines alternatives, du journalisme approximatif, c’est bien, mais il faut parfois aussi balayer devant sa propre porte et critiquer la science elle-même. Ou plutôt le processus de la recherche scientifique. Pour ceux qui ne connaissent pas beaucoup le domaine, le processus en question est centré sur la publication scientifique. Les scientifiques font des recherches, écrivent un article qui décrit la recherche qu’ils ont faite, puis soumettent leur article à un journal scientifique en espérant qu’il soit accepté pour publication. L’article suit presque toujours la même structure:

  • une introduction: elle sert souvent à placer le contexte de la recherche et à faire l’état de la littérature existante sur le sujet
  • « Materials and methods »: un chapitre consacré à la description de la méthodologie, des appareils et programmes informatiques utilisés, des statistiques calculées… avec suffisamment de détails pour permettre non seulement à d’autres scientifiques d’éventuellement tenter une réplication de l’expérience, mais plus fondamentalement pour que l’expérience puisse être critiquable.
  • « Results »: qui présente les résultats bruts
  • « Discussion »/ »Conclusion »: un chapitre qui permet de commenter les résultats trouvés, les limites de la méthode employée, des pistes à explorer ensuite, etc.
  • (N’oublions pas l’abstract, placé en tout début de l’article, et qui en contient un résumé bien condensé)

Une fois l’article reçu par l’éditeur, celui-ci va le transmettre à quelques experts dans le domaine, lesquels vont faire des commentaires qui vont servir à l’éditeur pour prendre une décision: refuser l’article, demander aux auteurs de faire quelques modifications et de soumettre à nouveau, ou directement accepter l’article tel quel. Ceci n’est vrai que pour les journaux dits à « peer-review » (littéralement: revue par les pairs); il existe des journaux qui ne font pas de peer-review et publient directement l’article sans poser plus de questions, mais les scientifiques évitent de soumettre leur article dans ce genre de journaux parce qu’ils sont de moins bonne qualité scientifique. Le processus du peer-review existe pour garantir une meilleure crédibilité et une meilleure qualité aux publications qui forment les briques du savoir scientifique.

Aussi bien ficelé que puisse paraître le processus du peer-review, il n’est pas infaillible (voir l’étude OGM de Séralini, sur laquelle j’ai fait un post et ce ne sera probablement pas le dernier). Un problème récurrent, qui n’est pas uniquement propre au peer-review, est le biais de publication: les résultats positifs ont plus souvent tendance à être publiés que les résultats négatifs. C’est un problème bien connu mais qui a pourtant du mal à être éradiqué. C’est aussi un problème d’une importance critique en sciences: les résultats négatifs sont au moins aussi importants que les résultats positifs. Ils le sont peut-être même plus! Si on se range à l’avis de Karl Popper et de son critère de réfutabilité pour définir ce qui est de la science et ce qui n’en est pas, un résultat négatif est fondamental. L’idée de ce critère de réfutabilité vient d’un problème plus fondamental encore en épistémologie et qui concerne la non-validité de l’induction. Pour reprendre un exemple souvent utilisé: on ne peut pas pas dire avec une certitude absolue que tous les corbeaux sont noirs, même si tous ceux qu’on a pu voir jusqu’à présent sont effectivement noirs; il suffit de trouver un seul corbeau blanc pour réfuter cette affirmation. Il est donc difficile, peut-être même impossible, de prouver que quelque chose est vrai, mais il est bien plus facile de prouver que quelque chose est faux. Une proposition qui se veut scientifique doit être formulée de façon à pouvoir être réfutée, c’est-à-dire qu’on doit pouvoir trouver un moyen, ne fut-ce qu’en principe, de prouver qu’elle est fausse; si ce n’est pas le cas, on n’est pas dans le domaine de la scienceA. Formuler les questions de sorte qu’elles puissent être réfutées, parce qu’on peut « prouver faux » mais pas « prouver vrai », c’est ça le critère de réfutabilité, et son importance explique en quoi un résultat négatif ne devrait jamais être ignoré en sciences.

Pourtant, les résultats négatifs sont beaucoup trop souvent ignorés, c’est ce fameux biais de publication. Les raisons de son existence sont multiples et trop complexes pour que je puisse en parler dans ce post. Par contre, on peut imaginer de nouveaux processus de recherche, des améliorations au système du peer-review, qui permettraient de diminuer ce biais, et c’est le sujet de cette traduction de l’article de Neuroskeptic, ci-dessous.

__________________________________________________

Dans une publication du Journal of Clinical Epidemiology, Dr Yvo Smulders des Pays-Bas fait une proposition: A two-step manuscript submission process can reduce publication bias1

L’idée de Smulders est que les manuscrits scientifiques devraient être soumis au peer-review en omettant les résultats et la discussion. Les reviewers2 donneraient leur avis uniquement sur base de la robustesse de la méthode et de l’introduction. S’ils sont en faveur de la publication, les auteurs enverraient alors l’article complet.

Les reviewers auraient alors l’occasion de changer d’avis et de le rejeter, ou bien de demander de faire des expériences supplémentaires, mais les critères pour pouvoir le faire devraient être très stricts.

Ainsi, la portée du biais de publication par les reviewers, leur tendance à favoriser les résultats « positifs », serait réduite. Les reviewers devraient prendre une décision sur base du protocole même de l’expérience, peu importe que les résultats s’avèrent positifs ou non. D’après Smulders, cela allégerait aussi le travail des reviewers par rapport à la quantité de papiers qu’ils doivent digérer.

C’est un concept intelligent (et comme le souligne Smulders, il n’est pas neuf; il date des années ’70 mais n’a jamais décollé.)

La proposition me rappelle le modèle de préenregistrement avec peer-review que j’ai prôné. La différence dans ce dernier, c’est que les auteurs soumettent l’introduction et les méthodes avant de poursuivre les expériences, tandis que dans la soumission en deux étapes, les résultats sont déjà là, mais révélés plus tard dans le processus.

Trois systèmes de peer-review comparés

La différence, contrairement au préenregistrement, c’est que le peer-review en 2 étapes n’empêcherait pas le biais de publication (ou d’autres pratiques douteuses) de la part de l’auteur. Le deux-étapes permettrait cependant de diminuer la tendance d’un tel biais – pourquoi se donner tant de mal à obtenir des résultats positifs si on sait que notre recherche serait publiée dans un bon journal tant que la méthodologie est solide?

Cette proposition serait certainement un pas dans la bonne direction, et pourrait même servir de pierre d’achoppement pour le système de préenregistrement.

__________________________________________________

A C’est d’ailleurs ce qui a permis à Popper de classer la psychanalyse dans les non-sciences: aucune critique ne permet de réfuter les hypothèses psychanalytiques, elles sont mêmes considérées comme des résistances à la psychanalyse et donc comme des preuves de sa vérité!

1 « Un processus de soumission de manuscrit en deux étapes peut réduire le biais de publication »

2 Au lieu de « relecteur », je garde le terme anglais « reviewer » qui est de toute façon plus souvent utilisé, même dans la recherche francophone.