Test de Student

Type	Test statistique,test paramétrique(d)
Inventeur	William Gosset(«Student»)

Enstatistique,untest de Student^[1],outestt^[2],désigne n'importe queltest statistiqueparamétrique où lastatistique de testcalculée suit uneloi de Studentlorsque l’hypothèse nulleest vraie.

Histoire

Le test de Student etla loi de probabilités qui lui correspondont été publiés en 1908 dans la revueBiometrikaparWilliam Gosset^[3].Gosset, un employé de la brasserieGuinnessà Dublin, y avait développé le testtà des fins de contrôle de la qualité de la production de bièrestout.La brasserie avait pour règle que ses chimistes ne publient pas leurs découvertes. Gosset argua que son article ne serait d'aucune utilité pour les concurrents et obtint l'autorisation de publier mais sous unpseudonyme,Student,pour éviter les difficultés avec les autres membres de son équipe^[4].

Le testtest devenu célèbre grâce aux travaux deRonald Fisherqui montra que ce test ne couvre pas le cas des échantillons de grande taille. Il apporta donc des modifications au test de Student afin de le généraliser.

Exemples d'utilisation

Cette section est vide, insuffisamment détaillée ou incomplète.Votre aideest la bienvenue!Comment faire?

Le test t a plusieurs utilisations dont voici les plus fréquentes:

Comparaison de moyenne d'uneloi normaleà une valeur si la variance est inconnue.
Comparaison de deux moyennes issues de deuxlois normalessi leurs variances sont égales et inconnues. Dans le cas où leurs variances sont différentes et inconnues, on utilise une adaptation appelée letest t de Welch.
Test sur les coefficients dans le cadre d'unerégression linéaire.
Test sur des échantillons appariés^{[pas clair]}

Test de Student sur un échantillon de loi normale

On considère une population deloi normalede moyenne $μ$ et d'écart type $σ$ .L'écart type $σ$ n'est pas connu. On souhaite tester si la moyenne $μ$ est égale à une valeur déterminée $μ 0$ .L'hypothèse nulleest $H 0 : μ = μ 0$ ,autrement dit on suppose a priori que la moyenne vaut $μ 0$ .On se place maintenant sous l'hypothèse nulle.

Cadre

On considère unéchantillonde taille $n$ de cette population $(X_{1},\dots,X_{n})$ ,autrement dit, selon l'hypothèse nulle, chaque $X_{i}$ est unevariable aléatoirequi suit une loi normale de moyenne $μ 0$ et d'écart type $σ$ .De plus, les $X_{i}$ sont indépendantes. On estime alors la moyenne par lamoyenne empirique:

${\overline {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}$ .

Comme l’hypothèse nulleest supposée vraie, la moyenne ${\overline {X}}$ suit également une loi normale d'espérance $μ 0$ ,mais d'écart type $σ / \sqrt n$ .Comme lavariance $σ 2$ est inconnue, on l'estime par sonestimateur sans biais(on note la division par $n-1$ au lieu de $n$ afin d'avoir un estimateur sans biais):

S_{n}^{\ast ^{2}}={\frac {1}{n-1}}\sum \limits _{i=1}^{n}(X_{i}-{\overline {X}}_{n})^{2}

.

Définition de la statistique

D'après lethéorème de Cochran,sous l'hypothèse nulle, ${\frac {n-1}{\sigma ^{2}}}S_{n}^{\ast ^{2}}$ suit uneloi du chi deuxà $n - 1$ degrés de liberté.

On pose lastatistique de testsuivante:

Z={\sqrt {n}}{\frac {{\overline {X}}-\mu _{0}}{S_{n}^{\ast }}}

Par définition, la statistique $Z$ suit uneloi de Studentà $n - 1$ degrés de liberté.La réalisation de la statistique de test:

z={\sqrt {n}}{\frac {{\overline {x}}_{n}-\mu _{0}}{s_{n}^{\ast }}},

où

s_{n}^{\ast }={\sqrt {{\frac {1}{n-1}}\sum \limits _{i=1}^{n}(x_{i}-{\overline {x}}_{n})^{2}}}

.

Mise en place du test

On rappelle que l'on veut tester $H 0 : μ = μ 0$ .On choisit un risque $α$ ,généralement 0,05 ou 0,01^{[réf. nécessaire]}.Le risque α s'appelle risque de première espèce, c'est la probabilité de rejeter $H_{0}$ dans le cas où $H_{0}$ est vraie. La figure ci-contre correspond à un risque $\alpha$ de 0,1 et $n=8$ ,et donc une loi de Student avec $n-1=7$ degrés de liberté. La figure montre lequantiled'ordre $\alpha \over 2$ (à gauche) et celui d'ordre $1-{\frac {\alpha }{2}}$ (à droite). Comme la loi de Student est symétrique, ces quantiles sont égaux au signe près.

Si la valeur de $z$ (sur l'axe des abscisses) est dans la zone bleue (entre les deux quantiles), alors on conserve l'hypothèse nulle.
Si elle est dans la zone rouge, on rejette l'hypothèse nulle.

Dit autrement, si $| z |$ est supérieur auquantiled'ordre $1 - α / 2$ de la loi de Student à $n - 1$ degrés de liberté alors on rejette l'hypothèse nulle.

Variantes

Examinons la variante où cherche à tester l'hypothèse nulle $H 0 : μ \leq μ 0$ .Dans ce cas, une valeur de $z$ négative n'est pas discriminante et si $z$ est dans la région bleue de la figure ci-contre alors on conserve l'hypothèse nulle. Par contre, si $z$ est supérieur auquantiled'ordre $1 - α$ de la loi de Student à $n - 1$ degrés de liberté alors on rejette l'hypothèse nulle (région rouge à droite pour un risque de $\alpha$ = 10%).

Tester $H 0 : μ \geq μ 0$ se fait de manière symétrique. Cette fois ci, des valeurs de $z$ ne sont pas discrimantes. Si $z$ est inférieur auquantiled'ordre $α$ de la loi de Student à $n - 1$ degrés de liberté (région rouge à gauche pour un risque de $\alpha$ = 10% dans la figure) alors on rejette l'hypothèse nulle.

Implémentation


Langage/Logiciel	Fonction	Notes
R	t.test	[1]
SAS	PROC TTEST	[2]
Python	scipy.stats.ttest_ind	[3]
Matlab	ttest	[4]
Mathematica	TTEST	[5]
Stata	ttest	[6]
Julia	OneSampleTTest EqualVarianceTTest	[7]
Maple	OneSampleTTest, TwoSampleTTest, TwoSamplePairedTTest	^[5]

Notes et références

↑Bernard Ycart, «Tests statistiques»,Cahier de Mathématiques Appliquées,n^o6,‎2002(lire en ligne[PDF])
↑GaëlMillot,Comprendre et réaliser les tests statistiques à l'aide de R: manuel de biostatistique,dl 2018(ISBN 978-2-8073-0291-4et2-8073-0291-2,OCLC1023590131,lire en ligne)
↑(en)"Student"William Sealy Gosset,«The probable error of a mean»,Biometrika,vol.6,n^o1,‎1908,p.1–25(DOI10.1093/biomet/6.1.1)
↑Harold Hotelling (1930,p.189) dans un article deBritish statisticscité par S. L. Zabell dans(en)S. L. Zabell, «On Student's 1908 paper "The probable error of the mean"»,Journal of the American Statistical Association,vol.103,‎2008,p.1-7(DOI10.1198/016214508000000030,JSTOR27640017)
↑«Student's t-Test - Maple Help», surwww.maplesoft.com(consulté le28 mai 2023)

Voir aussi

Loi de Student,la loi de probabilité de la statistique dans le test t
Test t de Welch,une adaptation pour comparer deux moyennes de deux lois normales dont les variances sont inconnues et inégales
Test de Wald

Portail des probabilités et de la statistique

[1] Bernard Ycart, «Tests statistiques»,Cahier de Mathématiques Appliquées,n^o6,‎2002(lire en ligne[PDF])

[2] GaëlMillot,Comprendre et réaliser les tests statistiques à l'aide de R: manuel de biostatistique,dl 2018(ISBN 978-2-8073-0291-4et2-8073-0291-2,OCLC1023590131,lire en ligne)

[3] (en)"Student"William Sealy Gosset,«The probable error of a mean»,Biometrika,vol.6,n^o1,‎1908,p.1–25(DOI10.1093/biomet/6.1.1)

[4] Harold Hotelling (1930,p.189) dans un article deBritish statisticscité par S. L. Zabell dans(en)S. L. Zabell, «On Student's 1908 paper "The probable error of the mean"»,Journal of the American Statistical Association,vol.103,‎2008,p.1-7(DOI10.1198/016214508000000030,JSTOR27640017)

[5] «Student's t-Test - Maple Help», surwww.maplesoft.com(consulté le28 mai 2023)

[1]

[2]

[3]

[4]

[5]