Aller au contenu

Test de Student

Un article de Wikipédia, l'encyclopédie libre.
(Redirigé depuisTest t)
Test de Student
Régions de rejet au niveau 10% d'un test de Student à 7 degrés de liberté.
Type
Test statistique,test paramétrique(d)Voir et modifier les données sur Wikidata
Inventeur
William Gosset(«Student»)

Enstatistique,untest de Student[1],outestt[2],désigne n'importe queltest statistiqueparamétrique où lastatistique de testcalculée suit uneloi de Studentlorsque l’hypothèse nulleest vraie.

Façade de la brasserie historique Guinness de St. James.
William Sealy Gosset, qui inventa le test t, sous le pseudonyme Student.

Le test de Student etla loi de probabilités qui lui correspondont été publiés en 1908 dans la revueBiometrikaparWilliam Gosset[3].Gosset, un employé de la brasserieGuinnessà Dublin, y avait développé le testtà des fins de contrôle de la qualité de la production de bièrestout.La brasserie avait pour règle que ses chimistes ne publient pas leurs découvertes. Gosset argua que son article ne serait d'aucune utilité pour les concurrents et obtint l'autorisation de publier mais sous unpseudonyme,Student,pour éviter les difficultés avec les autres membres de son équipe[4].

Le testtest devenu célèbre grâce aux travaux deRonald Fisherqui montra que ce test ne couvre pas le cas des échantillons de grande taille. Il apporta donc des modifications au test de Student afin de le généraliser.

Exemples d'utilisation

[modifier|modifier le code]

Le test t a plusieurs utilisations dont voici les plus fréquentes:

  • Comparaison de moyenne d'uneloi normaleà une valeur si la variance est inconnue.
  • Comparaison de deux moyennes issues de deuxlois normalessi leurs variances sont égales et inconnues. Dans le cas où leurs variances sont différentes et inconnues, on utilise une adaptation appelée letest t de Welch.
  • Test sur les coefficients dans le cadre d'unerégression linéaire.
  • Test sur des échantillons appariés[pas clair]

Test de Student sur un échantillon de loi normale

[modifier|modifier le code]

On considère une population deloi normalede moyenneμet d'écart typeσ.L'écart typeσn'est pas connu. On souhaite tester si la moyenneμest égale à une valeur déterminéeμ0.L'hypothèse nulleestH0:μ=μ0,autrement dit on suppose a priori que la moyenne vautμ0.On se place maintenant sous l'hypothèse nulle.

On considère unéchantillonde taillende cette population,autrement dit, selon l'hypothèse nulle, chaqueest unevariable aléatoirequi suit une loi normale de moyenneμ0et d'écart typeσ.De plus, lessont indépendantes. On estime alors la moyenne par lamoyenne empirique:

.

Comme l’hypothèse nulleest supposée vraie, la moyennesuit également une loi normale d'espéranceμ0,mais d'écart typeσ/n.Comme lavarianceσ2est inconnue, on l'estime par sonestimateur sans biais(on note la division parau lieu deafin d'avoir un estimateur sans biais):

.

Définition de la statistique

[modifier|modifier le code]

D'après lethéorème de Cochran,sous l'hypothèse nulle,suit uneloi du chi deuxàn– 1degrés de liberté.

On pose lastatistique de testsuivante:

Par définition, la statistiquesuit uneloi de Studentàn– 1degrés de liberté.La réalisation de la statistique de test:

.

Mise en place du test

[modifier|modifier le code]
Fonction de densité de la loi de Student à 7 degrés de liberté. La zone rouge est la région de rejet.

On rappelle que l'on veut testerH0:μ=μ0.On choisit un risqueα,généralement 0,05 ou 0,01[réf. nécessaire].Le risque α s'appelle risque de première espèce, c'est la probabilité de rejeterdans le cas oùest vraie. La figure ci-contre correspond à un risquede 0,1 et,et donc une loi de Student avecdegrés de liberté. La figure montre lequantiled'ordre(à gauche) et celui d'ordre(à droite). Comme la loi de Student est symétrique, ces quantiles sont égaux au signe près.

  • Si la valeur de(sur l'axe des abscisses) est dans la zone bleue (entre les deux quantiles), alors on conserve l'hypothèse nulle.
  • Si elle est dans la zone rouge, on rejette l'hypothèse nulle.

Dit autrement, si|z|est supérieur auquantiled'ordre1 –α/2de la loi de Student àn– 1degrés de liberté alors on rejette l'hypothèse nulle.

Fonction de densité de la loi de Student à 7 degrés de liberté (toujours et encore) mais cette fois la région de rejet pour tester.

Examinons la variante où cherche à tester l'hypothèse nulleH0:μμ0.Dans ce cas, une valeur deznégative n'est pas discriminante et sizest dans la région bleue de la figure ci-contre alors on conserve l'hypothèse nulle. Par contre, sizest supérieur auquantiled'ordre1 –αde la loi de Student àn– 1degrés de liberté alors on rejette l'hypothèse nulle (région rouge à droite pour un risque de= 10%).

Fonction de densité de la loi de Student à 7 degrés de libertés (encore et toujours) mais cette fois la région de rejet pour tester pour.

TesterH0:μμ0se fait de manière symétrique. Cette fois ci, des valeurs dezne sont pas discrimantes. Sizest inférieur auquantiled'ordreαde la loi de Student àn– 1degrés de liberté (région rouge à gauche pour un risque de= 10% dans la figure) alors on rejette l'hypothèse nulle.

Implémentation

[modifier|modifier le code]
Langage/Logiciel Fonction Notes
R t.test [1]
SAS PROC TTEST [2]
Python scipy.stats.ttest_ind [3]
Matlab ttest [4]
Mathematica TTEST [5]
Stata ttest [6]
Julia OneSampleTTest

EqualVarianceTTest

[7]
Maple OneSampleTTest, TwoSampleTTest, TwoSamplePairedTTest [5]

Notes et références

[modifier|modifier le code]
  1. Bernard Ycart, «Tests statistiques»,Cahier de Mathématiques Appliquées,no6,‎(lire en ligne[PDF])
  2. GaëlMillot,Comprendre et réaliser les tests statistiques à l'aide de R: manuel de biostatistique,dl 2018(ISBN978-2-8073-0291-4et2-8073-0291-2,OCLC1023590131,lire en ligne)
  3. (en)"Student"William Sealy GossetThe probable error of a mean»,Biometrika,vol.6,no1,‎,p.1–25(DOI10.1093/biomet/6.1.1)
  4. Harold Hotelling (1930,p.189) dans un article deBritish statisticscité par S. L. Zabell dans(en)S. L. Zabell, «On Student's 1908 paper "The probable error of the mean"»,Journal of the American Statistical Association,vol.103,‎,p.1-7(DOI10.1198/016214508000000030,JSTOR27640017)
  5. «Student's t-Test - Maple Help», surwww.maplesoft.com(consulté le)
  • Loi de Student,la loi de probabilité de la statistique dans le test t
  • Test t de Welch,une adaptation pour comparer deux moyennes de deux lois normales dont les variances sont inconnues et inégales
  • Test de Wald