Naar inhoud springen

Wilcoxontoets

Uit Wikipedia, de vrije encyclopedie
(Doorverwezen vanafMann-Whitney)

Dewilcoxontoetsvoor tweesteekproevenis eenverdelingsvrije(statistische) toets om na te gaan of twee verdelingen ten opzichte van elkaar verschoven zijn. De toets is genoemd naar deAmerikaansescheikundigeFrank Wilcoxonen equivalent aan demann-whitneytoets.

Een landmeter heeft een nieuwetheodolietgekregen omdat de oude aan vervanging toe is. Het instrument is van hetzelfde merk en van dezelfde uitvoering als het oude. Om na te gaan of de nul-instellingen van de instrumenten gelijk zijn, meet hij met beide instrumenten een aantal keren dezelfde hoogte. Hij doet 10 metingen X met het oude instrument en 12 metingen Y met het nieuwe.

We kunnen ervan uitgaan dat deverdelingenvan X en van Y op een verschuiving na aan elkaar gelijk zijn.

Denulhypotheseis dat de nul-instellingen dezelfde zijn, dus dat de verdelingen exact aan elkaar gelijk zijn, zonder verschuiving. Als alternatieve hypothese nemen we voor de eenvoud een eenzijdige, namelijk dat het nieuwe instrument systematisch te hoog meet.

Met het oude instrument meet hij achtereenvolgens:

Instrument X: 3,0163 3,0147 3,0175 3,0150 3,0123 3,0169 3,0143 3,0122 3,0154 3,0164

Met het nieuwe instrument meet hij:

Instrument Y: 3,0148 3,0146 3,0162 3,0155 3,0153 3,0190 3,0187 3,0167 3,0152 3,0178 3,0177 3,0158

De uitkomsten rangschikken we naar grootte:

Rangnummer: 1 2 3 4 5 6 7 8 9 10 11 12
Instrument: X X X Y X Y X Y Y X Y Y
Meetwaarde: 3,0122 3,0123 3,0143 3,0146 3,0147 3,0148 3,0150 3,0152 3,0153 3,0154 3,0155 3,0158

Vervolg tabel:

13 14 15 16 17 18 19 20 21 22
Y X X Y X X Y Y Y Y
3,0162 3,0163 3,0164 3,0167 3,0169 3,0175 3,0177 3,0178 3,0187 3,0190

Vervolgens zetten we de instrumentaanduidingen uit de tabel op een rij:

X X X Y X Y X Y Y X Y Y Y X X Y X X Y Y Y Y

Onder de nulhypothese is voor elke plaats in de rij de kans op een X dezelfde, maar onder de alternatieve hypothese zullen aan het begin van de rij met grotere kans X'en te vinden zijn en aan het eind van de rij Y'en. In het extreme geval dat de metingen als volgt waren:

X X X X X X X X X X Y Y Y Y Y Y Y Y Y Y Y Y

is het duidelijk: het nieuwe instrument geeft systematisch hogere waarden dan het oude. Als we vinden:

Y X Y X Y X Y X Y X Y X Y X Y X Y X Y X Y X

is dit weliswaar een heel bijzondere uitkomst, maar er is geen reden om het nieuwe instrument te wantrouwen.

Wat moeten we concluderen uit de gevonden uitkomst? Op het eerste gezicht lijken de X'en meer naar links en de Y'en meer naar rechts te liggen. Dus bewijs tegen de nulhypothese. Maar is dit resultaat significant? Om dat na te gaan berekent de toetsingsgrootheidhet totaal van de rangnummers van de X'en in de rij. In ons geval dus:

Het zal duidelijk zijn dat hoe kleiner W is hoe meer reden er is om de nulhypothese te verwerpen. Maar is onze uitkomstte klein? Met kansrekening kan de verdeling vanonder de nulhypothese bepaald worden, gebruikmakend van het feit dat, als de nulhypothese waar is, alle mogelijke rangschikkingen van de X'en en Y'en even waarschijnlijk zijn. We hoeven deze berekening niet steeds zelf uit te voeren, daarvoor zijn er tabellen.

De tweetoevalsvariabelenenzijnonderling onafhankelijken continu verdeeld metverdelingsfunctiesrespectievelijkdie op een verschuiving na aan elkaar gelijk zijn. Er geldt dus:

.

Vanenzijnaselecte steekproevenengegeven.

De toetsingsgrootheidvan de wilcoxontoets voor het toetsen van denulhypothese

bestaat uit de som van derangnummersvan een van de steekproeven, zeg,in het totaal van de waarnemingen:

.

Daarin is dushet rangnummer vanin de geordende rij van beide steekproeven. Afhankelijk van de alternatieve hypothese wordt de nulhypothese verworpen voor te kleine, te grote of te kleine en te grote waarden van.

Exacte verdeling

[bewerken|brontekst bewerken]

Voor steekproeven met omvangen,kan de exacte verdeling van de toetsingsgrootheidonder de nulhypothese met behulp vancombinatoriekgemakkelijk bepaald worden. Voor grotere steekpoeven neemt echter de hoeveelheid rekenwerk flink toe. De verdeling kan ook bepaald worden met de onderstaande recursieve formule. De formule ontstaat door conditionering op de voorwaarde dat de laatste waarde in de volgorde een X ( "...X" ) of een Y ( "...Y" ) is.

Normale benadering

[bewerken|brontekst bewerken]

Voor grotere waarden vanenkan eennormale benaderingtoegepast worden. De verwachtingswaarde en de variantie vanonder de nulhypothese worden gegeven door:

Mann-whitneytoets

[bewerken|brontekst bewerken]

Demann-whitneytoetsberekent om de volgorde van de X'en en Y'en te vergelijken een andere grootheid,die echter omgerekend kan worden in de wilcoxontoetsingsgrootheid.