×

Utilizziamo i cookies per contribuire a migliorare LingQ. Visitando il sito, acconsenti alla nostra politica dei cookie.

image

La statistique expliquée à mon chat, La variable aléatoire du grenier

La variable aléatoire du grenier

Voici mon chat, Albert.

L'autre jour, tandis qu'il vaquait à ses occupations de chat,

Albert a trouvé une boite dans le grenier.

Une simple boîte ?

Non ! Il s'agit d'une boîte exceptionnelle, magique, incroyable.

Sa particularité ?

Chaque fois qu'Albert l'ouvre, un nombre en sort.

Albert a beau avoir observé ce qui en sortait un grand nombre de fois,

il n'a toutes fois pas pu en percer le secret.

Quel mystère !

Il a alors parlé de sa trouvaille à ses amis chats.

Certains ont voulu jouer à prédire

ce qui allait sortir de la boîte

avant qu'Albert l'ouvre,

parfois ils y arrivaient,

mais, au bout d'un moment, même le meilleur des chats

finissait toujours par commettre une erreur.

Frustré de ne pas comprendre ce qui se cachait derrière cet étrange objet,

Albert a fini par m'appeler à l'aide.

Je lui ai alors expliqué que les gens dans ma profession, la statistique,

travaillent avec ce genre de boîte tous les jours.

Celle qu'il a trouvé dans le grenier

est sans doute le reste d'un ancien projet.

J'ai expliqué à Albert que personne ne pouvait percer le secret de cette boîte.

Comment est-ce possible ?

C'est simple. Elle a été conçue comme ça.

Ce qui en sort est toujours imprévisible.

Albert était un peu déçu de ma réponse.

Mais sa curiosité restait grande,

il voulait savoir comment j'avais construit la boîte qu'il avait trouvé.

Pour créer une boite de statisticien, il y a deux choses importantes à définir.

Premièrement, il faut décider ce qui peut en sortir.

On appelle ça le domaine de la boite.

Par exemple, les nombres 22, 25, 37 et 50.

Bien qu'il ne soit pas possible à l'avance de dire quel nombre va sortir

à chaque fois que la boite est ouverte,

on est sûr que c'est l'un de ces nombres qui sortira

car nous en avons ainsi défini le domaine.

Deuxièmement, il faut personnaliser le poids sur chaque nombre.

Par défaut, chaque nombre a autant de chances de sortir que les autres.

Donc s'il y en a quatre, ça nous donne une chance sur quatre pour chacun d'apparaître.

Si l'on souhaite toutefois voir le nombre 25 sortir de la boîte plus souvent que les autres,

il suffit simplement de réorganiser les poids.

Attention ! Si on augmente le poids quelque part,

Il faut automatiquement en retirer ailleurs.

Si la somme totale des poids n'est plus de une unité,

le plan devient erroné

et la boîte qui se basera sur ces plans

ne pourra pas fonctionner correctement.

Albert pense avoir compris.

Mais quels étaient les plans de la boîte du grenier ?

J'étais bien embêté, je ne m'en souvenais plus.

Heureusement, perdre les plans d'une boîte n'est pas si grave.

Si l'on observe ce qui sort d'une boîte dont on ne sait rien suffisamment longtemps,

il est possible d'en deviner les plans.

Lorsque Albert a montré la boîte à ses amis chats,

voici la totalité des chiffres qui sont sortis.

Bon d'accord, ça en fait un paquet.

Mais on dirait que ce sont toujours les chiffres 0, 1 et 2 qui sortent.

Voilà le domaine de la boîte.

Il nous manque encore toutefois les poids.

Sur les 100 résultats d'Albert, le chiffre 0 est sorti 54 fois,

le chiffre 1, douze fois et le chiffre 2, 34 fois.

Les poids de mon plan devaient donc être de 54/100, 12/100 et 34/100.

Je vois que l'attention d'Albert diminue.

Mais Albert ! Il y a pourtant tellement de choses à raconter sur ces boîtes magiques.

Par exemple, on peut construire des boîtes dont ce qui sort n'est pas des nombres mais autre chose,

comme des couleurs.

Disons rouge, orange, jaune, vert et pourquoi pas bleu.

Le couleur jaune pourrait sortir la moitié du temps

et les autres couleurs 1/8 du temps.

Il y a aussi des boîtes dont le domaine est un segment.

Par exemple, le segment qui va de -5 à 2

N'importe quelle valeur entre -5 et 2,

comme 1,3476 ou encore -4,1 peut en sortir.

Ces boites ont toutefois un comportement très particulier,

qui a amené plusieurs générations de statisticiens à s'arracher les cheveux

avant de réussir à les dompter de façon satisfaisante.

Nous y consacrerons d'ailleurs une vidéo complète dans le futur.

Certaines boites sont particulièrement extrêmes,

avec un domaine comportant des nombres infiniment grands.

Par exemple, une boite de laquelle n'importe quel entier naturel peut sortir,

c'est à dire 0, 1, 2, 3, 4, 5,

mais aussi 1.000, 100.000, 2 millions, 106 milliards, etc.

Assigner un poids à chaque valeur du domaine,

tout en s'assurant que la somme totale de ces poids n'excède pas une unité,

est toutefois très délicat dans le cas d'une boîte de ce genre.

Le problème est d'ailleurs tellement sévère

que les statisticiens préfèrent utiliser des formules

pour les assister dans cette délicate tâche.

La formule de monsieur Poisson est ainsi très populaire.

Dès que le symbole grec lambda dans cette formule est remplacé par une valeur concrète,

un poids pour chaque élément du domaine est facile à calculer.

Les poids générés peuvent être indirectement personnalisés

en changeant la valeur du symbole lambda dans la formule.

Plus lambda est élevé, moins il y aura de poids sur le début du domaine.

Et la force de cette formule est que les poids générés s'additionneront toujours pour donner une valeur de 1 !

C'est monsieur Poisson qui le garantit.

Albert s'est endormi. J'imagine que ce sera tout pour aujourd'hui.

Mais il ne faut pas s'inquiéter :

mon grenier est rempli de merveilles qui n'attendent qu'à être découvertes.

Oh, avant de terminer, une dernière chose.

Nous autres, statisticiens, nous n'aimons pas l'appellation "boîte magique".

Cela ne fait pas très sérieux, vous serez d'accord avec moi.

À la place nous appelons ça une variable aléatoire.

Albert remercie vivement @Lebravex pour avoir réalisé ces sous-titres :-)

Learn languages from TV shows, movies, news, articles and more! Try LingQ for FREE