×

Utilizziamo i cookies per contribuire a migliorare LingQ. Visitando il sito, acconsenti alla nostra politica dei cookie.

image

La statistique expliquée à mon chat, Pâte à tartiner et variable continue

Pâte à tartiner et variable continue

Sous-titres réalisés avec amour par Hanash et Maxime, merci à eux <3

Expliquer ce qu'un statisticien fait dans la vie, ce n'est pas toujours facile.

Prenons un chimiste.

Si ce qui le définit est son intérêt pour l'étude des atomes et molécules,

alors le statisticien est sans aucun doute défini par son intérêt pour l'étude des variables aléatoires.

Et que font la plupart des scientifiques avec les objets qu'ils étudient ?

Ils les classifient.

Pour les variables aléatoires, une possibilité est de mettre d'un coté celles dites non continues,

et de l'autre, celles dites continues.

Quelle est la différence ?

Donnons à Albert et ses amis, Marine, Oscar et Émilie, quelques exemples de variables aléatoires.

Exemple 1, une variable dont le domaine est composé des couleurs bleues, oranges et vertes,

ce qui signifie qu'à chaque observation de la variable, l'une de ces trois couleurs est obtenue.

Exemple 2, le domaine de la variable est l'ensemble des entiers naturels,

c'est à dire 0, 1, 2, 3, ou tout autre entier positif.

Exemple 3, une variable dont le domaine est le segment qui va de 0 à 5,

ce qui signifie qu'à chaque observation de la variable, un nombre entre 0 et 5 sera obtenu.

Cette dernière variable est un exemple de variable dite *continue*.

Toute variable dont le domaine est un segment, une demi-droite ou la droite des réels le sera.

Dans le cas contraire, et c'est le cas des deux variables sur la gauche, on parlera de variable *non continue*.

On dirait que j'ai lancé un grand débat entre Albert et ses amis chats.

Albert qui collectionne les variables aléatoires depuis l'été dernier,

se pose beaucoup de questions à propos de l'une d'entre elles,

dont le domaine est composé du segment allant de -4 à 1,5

mais aussi des éléments 3, 7 et 9.

A chaque observation de cette variable, c'est soit 3, 7 ou 9 qui sort,

soit un nombre entre -4 et 1,5.

Marine et Oscar sont convaincus que cette variable appartient à la classe des variables continues,

tandis qu'Émilie est d'avis qu'il s'agit d'une variable non continue.

Albert estime quant à lui qu'aucune de ces deux classes ne convient à sa trouvaille.

Bravo Albert ! Tu as tout à fait raison :

cette variable appartient en effet à une troisième classe, la classe des variables *mixtes*.

Aussi intéressante que puisse être cette troisième classe, nous n'en parlerons pas beaucoup aujourd'hui,

car nous devons d'abord comprendre pourquoi les statisticiens trouvent important de séparer

les variables qui ne sont pas mixtes entre variables non continues et variables continues.

Souviens-toi Albert qu'il y a deux choses qui caractérisent une variable aléatoire.

Son domaine, et la façon dont un poids total d'une unité a été réparti sur ce dernier.

Dans le cas des variables non continues,

le poids total d'une unité doit simplement être divisé en petits morceaux,

un morceau pour chaque élément du domaine.

Pour les variables aléatoires continues,

le poids total d'une unité est réparti sur le domaine de la variable par "tartinage".

Et c'est bien là ce qui rend ces variables si particulières.

Si une baguette de pain représente le domaine de la variable,

et un pot de pâte à tartiner le poids total d'une unité,

le jeu consiste ici à tartiner l'entièreté du pot sur la baguette.

Si nous prenons une variable dont le domaine est un segment allant de 0 à 5

et qu'on décide de tartiner le poids total de façon uniforme,

on se retrouve avec une ligne horizontale placée à la hauteur 1/5 au dessus du domaine.

Avec un tartinage du genre, une future observation de la variable aléatoire a autant de chances

de provenir de la première partie du domaine que de la seconde.

Me suivez-vous encore tous, les petits chats ?

Soyez bien attentifs, c'est maintenant que les choses sérieuses commencent.

La ligne horizontale placée à la hauteur 1/5 n'est rien d'autre qu'une fonction mathématique

de la forme f(x)=1/5,

fonction qui renvoit toujours 1/5 peu importe la valeur de x qu'on lui fournit.

Changer la façon dont on tartine le poids total d'une unité sur le domaine,

cela signifie changer cette fonction mathématique.

Avec par exemple f(x)=2x/25,

il y aura plus de poids tartiné sur la seconde moitié du domaine,

et moins sur la première partie, le poids total tartiné restant d'une unité,

et correspondant à la surface hachurée entre la fonction de tartinage et le domaine.

Lorsque le domaine de la variable est la droite des réels,

La fonction de tartinage la plus utilisée est sans aucun doute celle qui donne une courbe en cloche,

ou courbe de Gauss.

L'expression mathématique de cette courbe de Gauss est assez compliquée,

mais ce qu'il faut en retenir, c'est que la lettre grecque µ dans cette expression

permet de choisir l'endroit du domaine où va apparaître le sommet de la cloche.

Ainsi, avec µ=5, la plupart de la matière à tartiner l'est dans les environs du chiffre 5.

Lorsque le domaine d'une variable Y est la droite des réels

et que la fonction de tartinage est une courbe de Gauss,

on dira que la distribution de probabilité de la variable

est "normale" ou encore "gaussienne".

Les statisticiens écrivent d'ailleurs ça de la façon suivante :

Y, suivi du symbole "tilde" et du mot "Normale".

Souvent, ils indiquent aussi entre parenthèses la valeur du symbole µ après le mot Normale.

La beauté de la courbe de Gauss est que si deux ou davantage de variables aléatoires

ayant chacune une distribution de probabilité normale,

décident de faire un enfant par addition,

l'enfant sera lui aussi une variable aléatoire avec distribution de probabilité normale.

En général toutefois, l'enfant obtenu par addition de plusieurs variables aléatoires

n'a pas la même distribution de probabilité que ses parents.

Pour donner un exemple dans lequel cela ne fonctionne pas,

introduisons une dernière fonction de tartinage :

la fonction de tartinage exponentielle.

Elle est réservée pour les variables continues dont le domaine va de 0 à plus l'infini,

et concentre toujours la masse tartinée sur le début du domaine.

Avec 3 parents caractérisés par cette fonction de tartinage,

il n'est pas possible d'obtenir par addition un enfant ayant lui aussi

une distribution de probabilité exponentielle.

Résumons ce qu'Albert et ses amis ont appris.

La plupart des variables aléatoires sont soit non continues, soit continues.

Dans les deux cas, il y a un poids d'une unité à répartir sur le domaine,

Ce qui se fait par tartinage pour une variable continue.

Une fonction de tartinage courante pour les variables dont le domaine est la droite des réels

est la courbe de Gauss,

et l'addition de deux variables avec cette dernière fonction de tartinage

est encore une variable à la fonction de tartinage gaussienne,

mais cela ne marche pas aussi simplement avec d'autres fonctions de tartinage.

Et les variables mixtes dans tout ça ?

Cher internaute, Albert requiert à nouveau votre aide.

Comment doit-il répartir le poids total d'une unité sur une variable

dont le domaine est composé du segment allant de -4 à 1,5

mais aussi des éléments 3, 7 et 9 ?

Laissez-lui des exemples dans la section commentaire de cette vidéo, sur Facebook ou sur Twitter.

Cette vidéo est la première à avoir bénéficié d'une financement partiel via nos fans !

Grâce à vos donations, nous sommes en mesure de lentement mais sûrement faire davantage de vidéos.

Si vous n'êtes pas encore donateur, et souhaitez vous aussi soutenir Albert, rendez-vous sur tipeee.com/amisdalbert

Merci de nous avoir regardés jusqu'ici, et à très bientôt pour la vidéo 7 !

Learn languages from TV shows, movies, news, articles and more! Try LingQ for FREE