Test de Student
Type |
Test statistique,test paramétrique(d) |
---|---|
Inventeur |
William Gosset(«Student») |
Enstatistique,untest de Student[1],outestt[2],désigne n'importe queltest statistiqueparamétrique où lastatistique de testcalculée suit uneloi de Studentlorsque l’hypothèse nulleest vraie.
Histoire
[modifier|modifier le code]Le test de Student etla loi de probabilités qui lui correspondont été publiés en 1908 dans la revueBiometrikaparWilliam Gosset[3].Gosset, un employé de la brasserieGuinnessà Dublin, y avait développé le testtà des fins de contrôle de la qualité de la production de bièrestout.La brasserie avait pour règle que ses chimistes ne publient pas leurs découvertes. Gosset argua que son article ne serait d'aucune utilité pour les concurrents et obtint l'autorisation de publier mais sous unpseudonyme,Student,pour éviter les difficultés avec les autres membres de son équipe[4].
Le testtest devenu célèbre grâce aux travaux deRonald Fisherqui montra que ce test ne couvre pas le cas des échantillons de grande taille. Il apporta donc des modifications au test de Student afin de le généraliser.
Exemples d'utilisation
[modifier|modifier le code]Le test t a plusieurs utilisations dont voici les plus fréquentes:
- Comparaison de moyenne d'uneloi normaleà une valeur si la variance est inconnue.
- Comparaison de deux moyennes issues de deuxlois normalessi leurs variances sont égales et inconnues. Dans le cas où leurs variances sont différentes et inconnues, on utilise une adaptation appelée letest t de Welch.
- Test sur les coefficients dans le cadre d'unerégression linéaire.
- Test sur des échantillons appariés[pas clair]
Test de Student sur un échantillon de loi normale
[modifier|modifier le code]On considère une population deloi normalede moyenneμet d'écart typeσ.L'écart typeσn'est pas connu. On souhaite tester si la moyenneμest égale à une valeur déterminéeμ0.L'hypothèse nulleestH0:μ=μ0,autrement dit on suppose a priori que la moyenne vautμ0.On se place maintenant sous l'hypothèse nulle.
Cadre
[modifier|modifier le code]On considère unéchantillonde taillende cette population,autrement dit, selon l'hypothèse nulle, chaqueest unevariable aléatoirequi suit une loi normale de moyenneμ0et d'écart typeσ.De plus, lessont indépendantes. On estime alors la moyenne par lamoyenne empirique:
.
Comme l’hypothèse nulleest supposée vraie, la moyennesuit également une loi normale d'espéranceμ0,mais d'écart typeσ√n.Comme lavarianceσ2est inconnue, on l'estime par sonestimateur sans biais(on note la division parau lieu deafin d'avoir un estimateur sans biais):
- .
Définition de la statistique
[modifier|modifier le code]D'après lethéorème de Cochran,sous l'hypothèse nulle,suit uneloi du chi deuxàn– 1degrés de liberté.
On pose lastatistique de testsuivante:
Par définition, la statistiquesuit uneloi de Studentàn– 1degrés de liberté.La réalisation de la statistique de test:
- où.
Mise en place du test
[modifier|modifier le code]On rappelle que l'on veut testerH0:μ=μ0.On choisit un risqueα,généralement 0,05 ou 0,01[réf. nécessaire].Le risque α s'appelle risque de première espèce, c'est la probabilité de rejeterdans le cas oùest vraie. La figure ci-contre correspond à un risquede 0,1 et,et donc une loi de Student avecdegrés de liberté. La figure montre lequantiled'ordre(à gauche) et celui d'ordre(à droite). Comme la loi de Student est symétrique, ces quantiles sont égaux au signe près.
- Si la valeur de(sur l'axe des abscisses) est dans la zone bleue (entre les deux quantiles), alors on conserve l'hypothèse nulle.
- Si elle est dans la zone rouge, on rejette l'hypothèse nulle.
Dit autrement, si|z|est supérieur auquantiled'ordre1 –α2de la loi de Student àn– 1degrés de liberté alors on rejette l'hypothèse nulle.
Variantes
[modifier|modifier le code]Examinons la variante où cherche à tester l'hypothèse nulleH0:μ≤μ0.Dans ce cas, une valeur deznégative n'est pas discriminante et sizest dans la région bleue de la figure ci-contre alors on conserve l'hypothèse nulle. Par contre, sizest supérieur auquantiled'ordre1 –αde la loi de Student àn– 1degrés de liberté alors on rejette l'hypothèse nulle (région rouge à droite pour un risque de= 10%).
TesterH0:μ≥μ0se fait de manière symétrique. Cette fois ci, des valeurs dezne sont pas discrimantes. Sizest inférieur auquantiled'ordreαde la loi de Student àn– 1degrés de liberté (région rouge à gauche pour un risque de= 10% dans la figure) alors on rejette l'hypothèse nulle.
Implémentation
[modifier|modifier le code]Langage/Logiciel | Fonction | Notes |
---|---|---|
R | t.test | [1] |
SAS | PROC TTEST | [2] |
Python | scipy.stats.ttest_ind | [3] |
Matlab | ttest | [4] |
Mathematica | TTEST | [5] |
Stata | ttest | [6] |
Julia | OneSampleTTest
EqualVarianceTTest |
[7] |
Maple | OneSampleTTest, TwoSampleTTest, TwoSamplePairedTTest | [5] |
Notes et références
[modifier|modifier le code]- Bernard Ycart, «Tests statistiques»,Cahier de Mathématiques Appliquées,no6,(lire en ligne[PDF])
- GaëlMillot,Comprendre et réaliser les tests statistiques à l'aide de R: manuel de biostatistique,dl 2018(ISBN978-2-8073-0291-4et2-8073-0291-2,OCLC1023590131,lire en ligne)
- (en)"Student"William Sealy Gosset,«The probable error of a mean»,Biometrika,vol.6,no1,,p.1–25(DOI10.1093/biomet/6.1.1)
- Harold Hotelling (1930,p.189) dans un article deBritish statisticscité par S. L. Zabell dans(en)S. L. Zabell, «On Student's 1908 paper "The probable error of the mean"»,Journal of the American Statistical Association,vol.103,,p.1-7(DOI10.1198/016214508000000030,JSTOR27640017)
- «Student's t-Test - Maple Help», surwww.maplesoft.com(consulté le)
Voir aussi
[modifier|modifier le code]- Loi de Student,la loi de probabilité de la statistique dans le test t
- Test t de Welch,une adaptation pour comparer deux moyennes de deux lois normales dont les variances sont inconnues et inégales
- Test de Wald