Introduction à la méthode des moindres carrés


Lycée de Bazas (33)
Bordeaux, Groupe Math&Info 95/96

 

Niveau

Terminale ES ; toute classe où le programme fait état de la méthode d’ajustement par la méthode des moindres carrés.

 

Objectifs

Comprendre la méthode des moindres carrés et l’utiliser pour obtenir les deux droites de régression.

 

Prérequis

Savoir :

¤   construire dans un plan rapporté à un repère cartésien, un nuage de points associé au croisement de deux caractères d’une population ;
¤   ajuster un nuage au jugé ou par la méthode de Mayer ;
¤   calculer les distances de points de même abscisse ou de même ordonnée.

 

La partie du programme traitée

Séries statistiques à deux variables : ajustements affines ; calcul de la somme des résidus associés à de tels ajustements.

 

Description

La salle de classe est munie d’un ordinateur, d’un rétroprojecteur, d’une tablette de rétroprojection et d’un tableau blanc.

Le logiciel utilisé : GEOPLANW

Les élèves ont effectué au préalable,au jugé, l’ajustement affine d’un nuage de points donnés et calculé la somme des carrés des distances « verticales » des points du nuage à la droite trouvée, ainsi que la somme des distances « horizontales ».

En classe, les élèves comparent leurs résultats. Le professeur entre, dans l’imagiciel créé à cet effet, la « meilleure » droite d’ajustement trouvée.

L’imagiciel permet de faire varier au clavier l’ordonnée à l’origine de la droite et son coefficient directeur. Il affiche l’équation de la droite et les deux sommes de carrés.

Ceci permet de trouver expérimentalement les valeurs approchées des équations des deux droites d’ajustement.

 

Bilan

Cette activité a été testée par l'auteur en classe de Terminale ES. Le fichier associé est mis à jour pour GéoplanW. Ce fichier est assorti d'un commentaire ou d'une aide grossière (F3).

Tous les objets de chacune des figures peuvent être modifiés (icône M/D).Ce travail d’explications et de recherche des coefficients à l’aide de l’ordinateur a duré 15 mn environ. La recherche expérimentale a été assez rapide.

La compréhension de la méthode a semblé meilleure.

Une difficulté cependant : la recherche des valeurs les plus précises possible s’avère trop longue. Il faut arrêter cette recherche dès que, le pas de déplacement devenant trop petit, la droite donne l’impression de ne plus se déplacer.

 

Travail préliminaire

Série double (tirée du livre Mathématiques TES, Bordas, Fractale, 1994, page 17)

 

J

F

M

A

M

J

J

A

S

O

N

D

Précipitations (en mm)

36

49

40

35

38

33

13

27

65

67

69

61

Température (en ° C)

5,5

6,6

10

13

16,8

20,8

23,3

22,8

19,9

15

10,2

6,9

 

Soit X le caractère « précipitations » dont les valeurs seront notées de x1 à x12 et Y le caractère « température » de valeurs y1, ..., y12.
Construire dans un plan rapporté à un repère orthogonal judicieusement choisi le nuage de points associé à cette série.
Tracer au jugé une droite (d) ajustant « au mieux » le nuage.
Déterminer graphiquement le coefficient directeur a et l’ordonnée à l’origine b de (d).
En notant Ai chaque point (xi ; yi), Bi le point de (d) de même abscisse que Ai, Ci le point de (d) de même ordonnée que Ai, calculer les distances AiBi, les distances AiCi, puis la somme des carrés des AiBi et la somme des carrés des AiCi (remplir le tableau suivant en s’aidant de la calculatrice ; on pourra programmer la calculatrice pour faire ce travail ou bien encore on pourra utiliser un tableur pour fabriquer un tableau du modèle ci-dessous).

   

a =

b =

   

xi

yi

AiBi (facultatif)

(AiBi)2

AiCi (facultatif)

(AiCi)2

36

5,5

       
           
           
           
           
           
           
           
           
           
           
           
   

somme =

 

somme =

 

 

Commentaires pour le professeur

1 - Exemple de fonctionnement pratique

Travail individuel de l’élève (en classe ou en dehors) :

les élèves ont à réaliser le travail décrit dans la feuille annexe.

Préparation de l’intervention informatique :

L’utilisateur (professeur) charge l’imagiciel avec une figure « propre » où n’apparaissent que les axes du repère R, la droite d, les points Ai et les segments [AiBi] ; les points Ai n’apparaissent que par leur marque ; les points Bi sont totalement transparents. Ce travail peut être préparé avant le cours, car GéoplanW charge la figure dans l’état où elle a été enregistrée.

Travail collectif (en classe) :

Parmi les résultats donnés par les élèves, le professeur choisit le coefficient directeur et l’ordonnée à l’origine de la droite qui a permis d’obtenir la plus petite somme des (AiBi)2 ; il met ensuite en place, dans l’imagiciel préparé, la droite correspondante à ces valeurs : Créer – Commande – Affectation –a et b dans le premier champ – les valeurs voulues dans le second champ – le choix d'une touche pour activer la commande (autre que A, B, X, Y).

C’est ici que le rétroprojecteur peut être mis sous tension ; la classe découvre la figure obtenue : repère, nuage, droite, somme des (AiBi)2  

Piloter les variations de b, en intervenant de temps en temps et judicieusement sur le pas de déplacement. Dès que la droite semble ne plus se déplacer, il vaut mieux s’arrêter. Même chose ensuite pour a.

Les élèves notent enfin l’équation de d ainsi obtenue.

Un travail analogue est mené ensuite avec les carrés (AiCi)2 pour obtenir l’autre droite de régression.

 

2 - Utilisation d’une calculatrice et/ou d’un tableur

1. Apprentissage de l’utilisation de la calculatrice pour le calcul des coefficients a et b de la droite de régression de y en x (faire attention à l’inversion de a et b sur beaucoup de calculatrices).
Ce travail permet (en outre) de préciser les résultats approximatifs obtenus précédemment.

2. Utilisation du tableur Excel.

Les valeurs xi étant par exemple saisies dans la plage A3:A14 et les valeurs yi dans la plage B3:B14, l’écriture dans les cellules D3 et D4 (par exemple) des formules respectives :

=INDEX(DROITEREG($B$3:$B$14;$A$3:$A$14);1)

et

=INDEX(DROITEREG($B$3:$B$14;$A$3:$A$14);2)

donnent le coefficient directeur et l’ordonnée à l’origine de la droite de régression de y en x.

Pour obtenir les coefficients a’ et b’ de la droite de régression de x en y, il suffit d’inverser les rôles de x et y et de prendre ensuite pour coefficient directeur 1/a’ et pour ordonnée à l’origine -b/a’

On peut aussi, comme autrefois, construire un tableau permettant de calculer chaque élément des formules admises ou démontrées et d’en déduire les valeurs trouvées dans les travaux précédents. Pour ce tableau l'utilisation d'un tableur est efficace.