Simulation de loi normale sur tableur |
Équipe académique maths, Bordeaux, juin 2001 Inspiré par : Simulation d’expériences aléatoires (IREM Paris Nord) |
Télécharger ce document (RTF) et les fichiers Lotus et Excel associés (ZIP ; 102 Ko)
Programme
Variance, écart type
Introduction de l'écart type pour des données gaussiennes.
Définition de la plage de normalité pour un niveau de confiance donné.
Document d'accompagnement
[...] Pour l’interprétation lorsque le niveau de confiance est 0,95, on notera que le choix de ce dernier résulte d’un consensus pour avoir des formules simples et implique qu’environ une personne sur vingt sorte de cette plage.
Nous proposons ici un programme de simulation d'un échantillon d'une population suivant une loi normale. Il ne s'agit évidemment pas que les élèves comprennent la construction de la simulation ; ils constateront seulement la validité des plages de normalité.
Voir les fichiers simuloinorm.xls pour Excel et simuloinorm.123 pour Lotus
Nous donnons ci-dessous, pour les enseignants, la justification théorique du processus de simulation employé.
Théorème de la limite centrale
Si on suppose que les variables aléatoires indépendantes Xn suivent une même loi (inconnue)
de moyenne m et d’écart type s,
on peut dire que, pour n suffisamment grand, la variable aléatoire
Beaucoup d’auteurs indiquent que « n assez grand » veut dire n ³ 30. C’est jugé « trop rigide » par F. Dress (Probabilité - Statistique chez Dunod). Il précise qu’« on découvre vite que l’approximation normale est d’autant meilleure que la distribution initiale est continue (c’est la condition primordiale), régulière et symétrique (le pire étant donc la loi de Bernoulli de paramètre p petit ou voisin de 1). Pour les meilleurs cas, n ³ 10 voire moins est une suggestion raisonnable, pour les mauvais, n ³ 30 peut ne pas être suffisant… »
Application
Dans toute calculatrice ou tout tableur, il existe une fonction qui simule le tirage au hasard d’un nombre entre 0 et 1 ; sur Excel, il s’agit de la fonction ALEA().
On suppose que cette fonction suit une loi uniforme dont la densité de probabilité est la fonction caractéristique : C[0;1].
.
En supposant que 12 est « suffisamment grand » (ce qu’on pourra vérifier plus tard par l’expérimentation), considérons la variable aléatoire :
D’après le théorème de la limite centrale, cette variable aléatoire suit
approximativement une loi normale de moyenne
Donc la variable aléatoire 12.Y suit approximativement une loi normale de moyenne 6 et d’écart type 1 et la variable aléatoire Z = (12.Y – 6) suit approximativement la loi normale centrée réduite .
Pour simuler sur Excel une série de nombres répartis selon la loi normale
centrée réduite, on entrera dans une cellule la formule :
= ALEA()+ALEA()+ALEA()+ALEA()+ALEA()+ALEA()+ALEA()+ALEA()+ALEA()+ALEA()+
ALEA()+ALEA() – 6
et on recopiera cette formule 100, 200 ou 500 fois.
Pour simuler une série de nombres répartis selon la loi normale de moyenne
m et d’écart type s, on entrera dans une cellule la formule :
= s(ALEA() + ALEA() + ALEA() +
ALEA() + ALEA() + ALEA() + ALEA() + ALEA() + ALEA() + ALEA() + ALEA()
+ ALEA() – 6) + m que l’on recopiera autant de fois que l’on voudra.
Prolongements
Si on craint que 12 soit un nombre trop petit et qu’on prenne n sommes de ALEA(), il faut un peu modifier les calculs.
On prend la variable aléatoire :
Exemple
Enfin, tout ceci reste valable pour les calculatrices en utilisant la fonction Rnd# ou Rand() à la place d’ALEA().