La Banquise et la régression vers la moyenne

12 septembre 2013 — 16 Commentaires

Contrepoints a publié aujourd’hui une image bien scientifique montrant que la couverture glacière de l’Arctique était très largement supérieure en Août 2013 qu’un an auparavant. La preuve est à nouveau faite, le réchauffement climatique est en pause ! Et les commentateurs enthousiastes de s’interroger sur quelle galipette les promoteurs de la théorie du réchauffement climatique vont bien pouvoir réaliser pour retomber sur leur pattes.

Image publiée par Contrepoints

Image publiée par Contrepoints

Comme j’ai trouvé l’article indigent, je m’y colle. Connaissez-vous ce phénomène qu’on appelle la régression vers la moyenne ?

Imaginons par exemple le jeu suivant. J’effectue une répétition de lancers d’un dé à 6 faces et j’en note les scores. Avant chaque nouveau lancer, j’ajoute 1 à chaque face du dès. Ainsi le premier lancer est fait avec un dé dont les faces vont de 1 à 6, le second avec un dé allant de 2 à 7, et ainsi de suite… Tout le monde est d’accord pour dire qu’un tel processus est caractérisé par une tendance haussière.

Mais imaginez qu’au lancer numéro 4 (mon dé va alors de 4 à 9) j’obtienne un score de 9. Quelle est la probabilité que j’obtienne un score inférieur au coup d’après ? J’aurais alors un dé allant de 5 à 10, et la probabilité de faire un score inférieur sera de 4/6, c’est-à-dire d’obtenir 5, 6, 7, ou 8. Et ce bien que j’ai lancé un dé dont les faces sont supérieures à celles du dé précédent. Autrement dit, la personne qui, observant que j’ai obtenu 9 au lancer #4 et 7 au lancer #5, en conclurait que les faces du lancer #5 ont des plus petites valeurs commettrait une grossière erreur d’interprétation. Ou, si l’erreur est volontaire, un sophisme.

Ce phénomène s’appelle « regression toward the mean » et décrit le fait que lorsqu’une variable obtient un score très élevé (respectivement très faible), la probabilité conditionnelle d’une décroissance (respectivement croissance) à l’observation suivante s’élève. Mathématiquement, ce phénomène est entièrement imputable à la partie aléatoire du processus étudié, et non à une éventuelle tendance.

Ce phénomène statistique est très trompeur. Il nous fait par exemple croire que punir est plus efficace que récompenser. Par exemple, la note d’un enfant à l’école dépend à la fois de son travail et d’un facteur chance. La mère qui punit les mauvaises notes et récompense les bonnes notes aura le sentiment que les punitions sont plus efficaces, car elles sont statistiquement suivies d’une amélioration alors que les récompenses sont statistiquement suivies d’une dégradation. Mais le lien de causalité n’existe sans doute pas et la mère est peut-être trompée par la régression vers la moyenne du facteur chance. Autrement dit, le fait que la performance de son enfant s’améliore après une mauvaise note vient pour partie de la probabilité que cette mauvaise note était un accident. Et symétriquement qu’une bonne note était un coup de chance.

Revenons-en à la belle image publiée par Contrepoints. Indépendamment de toute tendance au réchauffement  ou au refroidissement, si la banquise était particulièrement peu étendue en 2012, il est logique qu’elle se retrouve plus étendue en 2013. Cette variation ne vient pas d’une tendance, mais du retour vers la moyenne de la partie aléatoire du climat.

Comme l’article de Contrepoints citait la NASA en argument d’autorité, j’y reprends ce graphique issu du NSCID qui confirme totalement mon interprétation. L’année 2012 constituait une année extrême au regard de la moyenne historique. Le fait que l’année 2013 offre une banquise plus étendue est donc une prévision logique de la régression vers la moyenne. En revanche, le graphique montre que l’étendue de la banquise en 2013, fusse-t-elle bien plus grande qu’en 2012, est bien en-dessous de la moyenne des 30 dernières années.

Source : NASA

Source : NSIDC (lien)

Je ne me lance pas dans le débat sur le réchauffement, je tenais juste à montrer que la démonstration offerte par l’article de Contrepoints n’avait pas la moindre valeur scientifique. Elle n’est qu’un sophisme statistique connu depuis Francis Galton, un scientifique du XIXème siècle.

16 responses to La Banquise et la régression vers la moyenne

  1. 

    Mon cher Acrithène. Je connais assez bien le sujet que vous abordez ici, pour l’avoir moi-même enseigné pendant des années à l’université. Je ne peux que vous approuver.

    La remontée brutale du minimum Arctique ne démontre en effet rien, en elle-même.

    Mais elle s’ajoute à d’autres (stagnation des températures depuis 17 ans, tendance récente à la baisse), alors que personne ne conteste que les émissions de CO2, elles, montent sans désemparer..

    En tant que statisticien, vous ne pouvez pas nier que ces éléments affaiblissent progressivement la thèse de ceux qui ont voulu présenter le CO2 comme LE facteur déterminant dans les variations climatiques.

    A quel point d’affaiblissement devra-t-on se référer pour déclarer que la théorie est moribonde, puis décédée, est une affaire d’apriori, car il n’existe AUCUN moyen de trancher ce différend.

    Pour ma part, ma "religion" est faite, le Changement Climatique Anthropique Catastrophique (en anglais CACA !) est mort de sa belle mort.

    • 

      Si l’on prend non pas l’écart entre 2012 et 2013, mais simplement 2012 & 2013 versus les décennies précédentes, il ne me semble pas du tout que ces deux observations aillent contre le modèle.

      Les 17 années de stagnation sont plus susceptibles de me convaincre. Elles affaiblissent la théorie, mais ne la réfute pas.

    • 

      Vous pouvez citer des sources pour les 17 ans de stagnation de la température? Ca pourrait en effet être une donnée convaincante, encore faut-il qu’elle soit vraie.

      Hors d’après le site de la NASA, qui semble être la source du sujet et donc que je vais reprendre ici, la température à augmenter d’1°F (merci les unités américaines…) entre 1980 et 2010. Et aucune trace 17 ans de stagnation, au grand max 5. Mais vu qu’en regardant l’évolution de long terme, la température est globalement à la hausse !

      http://climate.nasa.gov/climate_resource_center/22

      • 

        Il s’agissait des données par le MET Office. L’image de la NASA ne fait pas apparaître cette tendance, peut-être parce qu’elle est une moyenne mobile. La moyenne mobile tend à ralentir une série croissante, donc sur l’image de la NASA le point de 1997 est peut-être sous estimé car il est une moyenne de 1992-1997. Avec un point plus haut en 1997 (la température de 1997 seulement), on observerait peut-être une stabilité 1997-2013.

        J’avais discuté la question dans cet article : http://www.contrepoints.org/2013/02/27/116355-rechauffement-decryptage-dune-image-de-climato-sceptiques

        Je trouvais que les données, même si elles ne sont clairement pas favorables à la thèse réchauffiste, n’étaient pas non plus convaincantes d’un arrêt du réchauffement.

    • 

      Cher Jacques Corbin,

      merci tout d’abord pour l’élégante subtilité de votre dernière remarque.

      Je m’étonne, étant donné votre qualité de professeur de statisitiques, que vous puissiez parler de tendance à la baisse récente. Vous n’êtes pas sans ignorer que le mot "tendance", ce n’est pas seulement un bout de droite tracée à la latte sur un bout de graphe dont l’origine a été arbitrairement choisie. Non, c’est surtout le résultat d’analyse de données antérieures, analyse qui ne dit rien d’autre que la tendance actuellement est significativement à la hausse. Si, comme je l’espère, vous avez fait votre analyse de tendance sur base des données du NOAA, du Hadley ou de la NASA, sur les 17 années, la seule et unique conclusion que vous puissiez tirer après analyse, c’est que cette tendance n’est pas significative.

  2. 

    Les 17 ans de stagnation ont été actées par tout le monde, CRU et GIEC compris (voir relation d’une interview de Pachauri http://bit.ly/17tVcq0).. La seule chose qui soit en débat est son interprétation.

  3. 

    @Acrithène
    D’affaiblissements en affaiblissements, le malade est maintenant moribond. Le dernier soupir est normalement proche, mais l’acharnement thérapeutique découlant de l’extraordinaire collusion d’intérêts politico-financiers dont il est l’objet peut encore le garder en vie de façon artificielle quelque temps.

  4. 

    Votre démonstration comporte un défaut de taille, elle déplace à l’infini la moyenne vers la hausse. Et votre moyenne ne veut donc plus rien dire.
    Si vous prenez un dé à mille faces, quoi qu’il arrive, in fine, la moyenne sera toujours 500. Mais avec un peu de mal/chance, les 34 premiers tirages peuvent être des nombres au dessus de 500 et vous aurez l’impression que la moyenne est plus élevé qu’en réalité parce que le nombre de tirages ou "observations" ne sera pas représentatif pour votre démo.
    34 est justement le nombre d’observations valables de l’étendue de banquise arctique dont nous avons connaissance depuis des dizaines de milliers d’années que nous pensons collectivement que cette banquise existe. Avant 1979, il n’y a rien, nada, que dalle… C’est un peu léger pour en tirer quelque conclusion que ce soit.
    Ce qui est important quand on fait des statistiques, ce n’est pas la moyenne. Parce qu’avec notre fameux dé à mille face, il n’y a qu’une chance sur mille à chaque tirage de tomber dessus (cad 500) et donc la probabilité d’être dans la moyenne est extrêmement faible. L’important c’est l’écart type. Et dans le cas qui nous occupe, 2013 est dans l’écart type des 34 ans. 2012 faisant partie des cas exceptionnels. Mais répétons-le, nous manquons encore d’observations pour être affirmatif.
    Vous connaissez l’histoire des voyageurs anglais ? Ils sont trois dans un compartiment de train en chemin pour l’Ecosse. Juste après la "frontière", le journaliste voit une vache brouter parallèlement aux rails et dit "Tiens, ici les vaches sont marrons". Le philosophe le reprend : "Ici, il y a au moins une vache et elle est marron". Enfin le mathématicien : "On peut dire qu’ici, il y a au moins une vache et que d’un côté, elle est marron".
    Acrithène, je ne pense pas que vous soyez mathématicien.

    • 

      Dans une processus y(t)=a.t +e(t) vous avez une partie aléatoire e(t) qui peut avoir une moyenne stationnaire. Cette partie créée une régression vers la moyenne que a soit positif (réchauffement) ou négatif (refroidissement).

  5. 

    Rappeler le phénomène de régression vers la moyenne et certains de ses effets est toujours utile et rigolo, malheureusement il est ici hors sujet.
    La régression vers la moyenne s’observe, par définition, quand le résultat précédent est plus bas (ou plus haut) que la moyenne.
    Pour expliquer la hausse de la valeur V(n+1) par rapport à n par une régression vers la moyenne m, vous devez supposer que V(n)<m. Or toute la thèse réchauffiste c'est que V(2012) est représentatif de la moyenne, voire au dessus (glace libre au pôle, c'est à dire m = 0, à 2016 +/-3 ans).
    donc, de deux choses l'une :
    ou bien la thèse réchauffiste est correcte, et l'explication par la régression vers la moyenne ne fonctionne pas. vous ne pouvez pas l'invoquer comme explication.
    Ou bien elle est fausse. il y a bien, et il n'y a bien QUE, une régression vers la moyenne, la baisse de la surface de banquise en 2012 était un aléa dont il n'y avait aucune conclusion à tirer.
    En aucun cas vous ne pouvez user de l'argument "régression vers la moyenne" pour affaiblir l'attaque contre la thèse réchauffiste (ce qui n'exclut pas qu'une autre attaque aurait pu porter ; mais pas celle-là).
    Vous pouvez le tourner comme vous voulez : une thèse qui soutient l'existence d'une tendance baissière (resp : haussière) permanente est affaiblie par un événement de hausse (resp : de baisse). Pour une mathématisation rigoureuse, voyez Bayes.

    • 

      Non P, j’ai déjà répondu à cette objection juste au dessus. Rien n’oblige la moyenne à être fixe, exactement comme dans l’exemple du dès dont les faces changent.

      Dans le cas du dès, vous avez une série qui suit le processus suivant :

      D(t)=t-1+e(t) où e(t) suit une loi uniforme discrète entre 1 et 6.

      même si cette série n’a pas de moyenne fixe, E[D|t]=t-1+E[e], vous avez une régression vers la moyenne lorsque e prend une valeur proche de 6 ou de 1.

      La thèse réchauffiste n’est pas que V(2012) est représentatif de la moyenne. En revanche V(2012) et V(2013) sont des indications allant dans le sens de E[V(2012&13)]<<E[V(198...)]. Ce qui n'empêche V(2012)<<E[V(2012)]

      • 

        M’enfin…
        V(2012)<<E[V(2012)] c'est une représentation confuse que je crois décoder, mais qui augure mal. Parce que une fois le tirage effectué, la réalité a parlé, il faut l'écouter, et donc pour n V(2012) [renormalisés des éléments dont on croit connaitre l'effet précis, typiquement en soustrayant des effet genre el nino /la nina] implique que E (2013) > E(2012), ce qui réfute la thèse RCA.

        Bref, je répète : parler de régression vers la moyenne, c’est ni plus ni moins que tenir un discours sceptique, pas du tout argumenter contre ce genre de discours.

  6. 

    Dites, vous vous foutez du monde exprès, ou bien vous n’avez aucun contact avec la société?

    Le coup de l’aléatoire, ça va dans les deux sens! Mais quand une année la banquise fait un tirage hors norme, TOUS LES RECHAUFFISTES SAUTENT DESSUS POUR PROUVER QUE C’EST GRAVISSIME. Et j’utilise le terme "réchauffistes" exprès et pour distinguer des gens sérieux qui travaillent sérieusement sur le climat.

    En résumé : Pour que les années relativement froides ne soient plus utilisées comme preuve de l’absence de réchauffement, il faut déjà que chaque années un peu plus chaude ne soit plus utilisée comme preuve du réchauffement.

    Ce sont ceux qui affirment qu’il y a un problème qui ont besoin de crédibilité, et qui peuvent la perdre. Ceux qui disent le contraire n’en ont pas autant besoin.

    En ce moment, ceux qui affirment qu’il y a un problème perdent de leur crédit; et ce n’est rien encore. Il y a une perte future quand les gens s’apercevront qu’on s’est moqué d’eux avec des certitudes de scientifiques qui ne savent pas grand chose.

    Attention, le discrédit va être aussi violent et définitif que celui des vaccinalistes en France. Trop de bouffons!

  7. 

    Si je suis d’accord pour trouver l’article de Contrepoints grossier, il faut effectivement souligner qu’il n’a pour but que de s’opposer à certaines propositions alarmistes abondamment reprises par les médias classiques sur une fonte de la banquise s’accélérant dès qu’une année est en-dessous de la droite moyenne de diminution de la banquise arctique… (pareil pour la hausse du niveau de mer qui oscille de manière spectaculairement régulière autour de sa valeur séculaire)

Trackbacks and Pingbacks:

  1. La banquise et la régression vers la moyenne | Contrepoints - septembre 14, 2013

    […] Sur le web […]

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s