Le fichier utilisé dans ces notes est disponible au format xlsm (bam.xlsm 37K).

La boîte à moustaches (traduction de Box & Whiskers Plot) est une invention de TUKEY (1977) pour représenter schématiquement la distribution d'une variable.

 

On trouve ici une très belle explication de la création et de l'interpétation de ce genre de graphique.

Sur le graphique ci-dessus : la médiane des élèves masculins est à 68 kilos, le quart des élèves de poids faible se situe entre 55 et 63 kilos. La moitié des élèves de poids moyen se situe entre 63 et 72 kilos et le dernier quart des élèves se situe entre 72 et 80 kilos. Un élève a un poids de 93 kilos, atypique par rapport à ses camarades. Une seule valeur est atypique (93) car elle est située au-delà de la frontière haute (80). Aucune valeur atypique ne se trouve au-delà de la frontière basse (55).

Marche à suivre

Les données:

On collecte pour chaque élève d'une classe mixte, le poids en kilogrammes, la taille exprimée en centimètres et le sexe (code 1 pour masculin, code 2 pour féminin).
Le fichier des données comporte 3 variables CODE SEXE, POIDS et TAILLE, et 59 observations (23 garçons et 36 filles).

Attribuer le nom "PM" à la plage B4:B26 et "PF" à la zone B27:B62.

Dans les cellules E4 à G17, introduire les formules suivantes(les formules en F7, G7 et
F9, G9 sont des formules matricielles(on termine la validation de la formule à l'aide de Ctrl+Maj+Enter)):

Poids Masculin Féminin
Q1 =QUARTILE(PM;1) =QUARTILE(PF;1) valeur du 1er quartile
Min =MIN(PM) =MIN(PF) plus petite valeur
Moust.Inf {=MIN(SI(PM>F16;PM))} {=MIN(SI(PF>F16;PF))} valeur de la moustache inférieure: c'est la plus petite valeur qui est supérieure à la valeur frontière basse =Q1 - 1,5 * (Q3-Q1)
Médiane =MEDIANE(PM) =MEDIANE(PF) valeur médiane
Moust.Sup {=MAX(SI(PM<F17;PM))} {=MAX(SI(PF<F17;PF))} valeur de la moustache supérieure: c'est la plus grande valeur qui est inférieure à la valeur frontière haute =Q3 + 1,5 * (Q3-Q1)
Max =MAX(PM) =MAX(PF) plus grande valeur
Q3 =QUARTILE(PM;3) =QUARTILE(PF;3) valeur du 3ème quartile

Nb =NB(PM) =NB(PF) nombre de valeurs
Moy =MOYENNE(PM) =MOYENNE(PF) valeur moyenne
Q1-Q3 =F11-F5 =G11-G5 écart interquartile
Front.Basse =F5-1,5*(F11-F5) =G5-1,5*(G11-G5) valeur de la frontière basse
Front.Haute =F11+1,5*(F11-F5) =G11+1,5*(G11-G5) valeur de la frontière haute

Création du graphique:

Lire la suite ...