Le théorème central limite
Les physiciens ont la relativité générale et les élégantes équations de Maxwell.
Les chimistes ont le tableau périodique des éléments.
Les biologistes ont l'évolution, ou encore la fascinante molécule d'ADN.
Et les statisticiens ont le théorème central limite.
Le théorème central limite, mon chat Albert n'en a jamais entendu parler.
Mais les statisticiens, eux, lui vouent un véritable culte !
Sans le théorème central limite, la statistique ne serait que l'ombre de ce qu'elle est aujourd'hui.
Il est donc grand temps, je crois, d'expliquer à Albert de quoi il s'agit.
<3 Sous-titres réalisés avec amour par Posey 1235. Merci à lui ! <3
Au quotidien, le statisticien travaille avec ce qu'il appelle des variables aléatoires.
Albert, tu as encore oublié ce qu'était une variable ?
Bon, je te le rappelle, mais c'est la dernière fois !
Une variable aléatoire, c'est comme une boite magique qui a pour particularité qu'à chaque ouverture,
une valeur en sort sans que l'on puisse dire ce que sera cette valeur à l'avance.
Cela n'a toutefois pas empêché les statisticiens d'analyser un grand nombre de ces boites
et de conclure que, peu importe la boite,
il y a toujours ce qu'ils nomment une distribution de probabilité derrière.
Connaître la distribution de probabilité d'une variable est très important Albert,
car cela signifie avoir tout en main pour répondre à des questions du genre :
Quelles sont les chances qu'une valeur entre -2 et 6,5 sorte ?
Ou encore,
Quelle est la probabilité qu'une valeur plus petite que 60 ou plus grande que 142 soit obtenue ?
Une distribution de probabilité très connue, c'est la fameuse courbe en cloche, ou distribution normale.
Mais il y en a beaucoup d'autres ;
par exemple :
la distribution uniforme continue,
la distribution triangulaire,
la distribution uniforme discrète,
la distribution exponentielle,
etc.
Lorsque deux variables A et B ont exactement la même distribution de probabilité, les statisticiens disent que ces variables sont identiquement distribuées.
Pour que tu comprennes bien ce que cela signifie Albert, imagine toi avoir un clone qui vit quelques pâtés de maisons plus loin.
Il est en tout point identique à toi : le pelage est le même, la taille aussi,
la tendance à rendre son maître fou furieux en dormant dans le panier à linge propre également.
Vous êtes comme deux variables A et B qui seraient identiquement distribuées.
Mais ce chat et toi êtes des êtres distincts.
Ce n'est pas parce que ton clone est dans les bras de Morphée en ce moment que tu dois l'être toi aussi.
Ce n'est pas parce que ton clone partira peut-être jouer à l'extérieur plus tard que tu en feras autant.
Vous avez chacun votre propre vie.
Bon.
Passons aux choses sérieuses.
Lorsqu'il n'est pas occupé à vous présenter un graphique,
l'une des occupations favorites du statisticien consiste à assembler des variables aléatoires pour en créer des nouvelles.
Si je multiplie deux variables G et H, qui ne sont pas forcément identiquement distribuées même si c'est souvent le cas,
Le résultat est une nouvelle variable aléatoire.
Si je soustrais à G 5 fois la racine carrée de H,
là aussi, j'obtiens une nouvelle variable aléatoire.
Il n'y a pas vraiment de limite à ce que l'on peut faire,
mais le problème en bout de ligne sera toujours le même :
lorsqu'on assemble deux ou davantage de variables,
quelle sera la distribution de probabilité de la nouvelle variable ?
C'est ici que les statisticiens ont découvert quelque chose qui, aujourd'hui encore, me fascine.
Plus on assemble un grand nombre de variables aléatoires identiquement distribuées par addition,
plus la distribution de probabilité de la nouvelle variable sera proche d'une distribution normale.
C'est ça le théorème central limite.
Prenons deux boites ayant une distribution exponentielle.
Comme on peut le voir à l'écran, l'addition de ces deux variables ne donne pas une variable ayant une distribution normale.
Mais à mesure que l'on va additionner toujours plus de variables ayant une distribution exponentielle,
la distribution de la variable finale converge lentement mais sûrement vers une distribution normale.
Et ceci fonctionne pour n'importe quelle distribution de départ.
Prenons deux variables ayant cette fois une distribution de probabilité uniforme discrète.
Leur addition donne le résultat à l'écran, qui n'est clairement pas une distribution normale.
Mais à mesure que je vais additionner un nombre toujours plus grand de variables, chacune caractérisée par une distribution uniforme discrète,
on voit que la distribution de la nouvelle variable converge de façon flagrante vers une distribution normale.
N'est-ce pas là un phénomène extraordinaire, Albert ?
Tu ne sembles pas très impressionné.
Concluons donc par un exemple d'application de ce théorème.
Oscar propose à Albert et à Marine un jeu.
Ces deux derniers doivent chacun lancer une dizaine de dés,
et si la somme des vingts chiffres obtenus est de cent ou plus, Oscar leur offre une conserve de thon à partager.
Au pire, Albert et Marine savent qu'ils obtiendront ensemble un total de vingt points et au maximum un total de cent vingt points s'ils réalisent vingt fois six,
ce qui est bien sûr extrêmement peu probable.
Mais Oscar ne leur demande pas de faire cent vingt points, il demande cent points ou plus.
N'ayant rien à perdre, Albert et Marine se lancent et obtiennent ensemble nonante-deux, dommage!
Mais quelles sont les chances de faire cent points ou plus à ce jeu ?
La somme des vingt dés, ce n'est rien d'autre que la somme de vingt variables identiquement distribuées.
D'après le théorème central limite, la distribution de cette somme est donc approximativement une distribution normale,
ce que nous pouvons utiliser pour calculer des probabilités.
Comment réaliser les calculs n'est pas très difficile mais toutefois un peu technique.
Et nous y consacrerons d'ailleurs une vidéo complète dans le futur.
Pour l'heure Albert,
sache que la probabilité de faire cent points ou plus,
calculée sur base de la distribution normale,
vaut 0,000043.
C'est donc assez clair, Oscar n'était pas vraiment inquiet pour sa conserve de thon.
Oh, Albert, ne fais pas cette tête !
Après tout, tu es mon petit chat, et j'aurai toujours une conserve de thon en réserve pour toi ou Marine.
Cette vidéo a été presque entièrement financée par nos fans et par le fond de développement pédagogique de la plus grande université francophone de Belgique : l'UCL.
Laura, Gwenaël et moi-même tenons à remercier du fond du coeur toutes les personnes concernées pour ce coup de pouce.
Merci pour votre attention, et à très bientôt pour une nouvelle vidéo.