[Yleistä]
[Tilastollisen testin valinta]
[Päätös nollahypoteesin
hylkäyksestä tai hyväksymisestä]
[Tilastollisten testien
kritiikki]
[Kalvot]
Useimmat määrällisen analyysin menetelmät perustuvat tilastollisten
hypoteesien testaukseen. Aina tätä ei ole kuitenkaan helppo huomata, koska
hypoteesit ovat menetelmien käytäntöön ”sisäänrakennettuja” ja niitä ei
tavallisesti tuoda eksplisiittisesti esille, vaan tutkijan oletetaan ymmärtävän
hypoteesien testauksen periaatteet. Tämän vuoksi hypoteesien testauksen
perusperiaatteiden ja niihin liittyvien ongelmien ymmärtäminen on olennaista,
jotta menetelmien antamien tulosten mielekäs tulkinta olisi mahdollinen. Tässä
osiossa esitetään ensin hypoteesien testauksen ns. ”oppikirjamalli”. Lopussa
käydään vielä lyhyesti läpi tilastolliseen hypoteesien testaukseen liittyviä
ongelmia.
Hypoteesien testaus etenee seuraavien viiden vaiheen kautta. Nämä ovat 1)
hypoteesien valinta, 2) sopivan tilastollisen testin valinta, 3)
merkitsevyystason valinta, 4) testin suorittaminen ja 5) lopullisen päätöksen
tekeminen.
Tutkimusta tehdessä tutkijalla on joitakin oletuksia siitä, minkälaisia
eroja tai samankaltaisuuksia perusjoukosta mitattujen muuttujien välillä
löytyy. Nämä oletukset perustuvat useimmiten teoreettiselle keskustelulle tai
aikaisemmassa tutkimuksessa löydetyille havainnoille. Kuvitellaan esimerkiksi,
että tutkija olisi kerännyt satunnaisotoksen avulla aineiston suomalaisten
ansaitsemista palkoista jollain tietyllä talouden sektorilla. Tutkija on
kiinnostunut naisten ja miesten välisistä palkkaeroista ja niihin vaikuttavista
syistä. Ensimmäisenä hänen kannattaa tutkia, eroavatko miesten ja naisten
keskipalkat toisistaan tällä sektorilla. Merkitään, että μn
tarkoittaa naisten keskipalkkaa ja μm miesten keskipalkkaa
tutkimuksen perusjoukossa.
Tutkijan lähtöoletuksena on, että sukupuolet eroavat palkkatasoltaan toisistaan.
Hypoteesin testauksen yleisenä ideana on, että tutkija muotoilee hypoteesin,
joka on vastoin hänen alkuperäistä oletustaan ja sen jälkeen tutkii, voidaanko
tämä hypoteesi kumota empiirisen aineiston perusteella. Tätä alkuperäisen oletuksen vastaista hypoteesia
kutsutaan nimellä nollahypoteesi (null hypothesis). Se on tapana
merkitä H0. Nollahypoteesin lisäksi tutkija tarvitsee vastahypoteesin
(alternative hypothesis), joka hyväksytään, jos nollahypoteesi pystytään
kumoamaan. Tätä hypoteesia merkitään H1.
Nyt tutkija
hypoteesit voidaan merkitä formaalisti seuraavalla tavalla:
H0:
μn = μm
H1:
μn ≠ μm
Toisin sanoen tutkijan nollahypoteesi on, että miesten ja naisten
keskipalkat ovat samansuuruiset perusjoukossa ja vaihtoehtoisen hypoteesin mukaan
ne eroavat toisistaan. Kyseessä on ns. kaksisuuntainen (two-tailed)
hypoteesin testaus, koska tutkija ei tee oletusta siitä, onko miesten vai
naisten keskipalkat suurempia, vaan olettaa ainoastaan, että ne eroavat
toisistaan.
H0:
μn = μm
Edellä esitetyt hypoteesit ovat vain esimerkkejä mahdollisista nolla- ja
vastahypoteeseista. Sopivien hypoteesien valinta perustuu aina
tutkimusongelmaan, teoriaan ja aikaisempaan tutkimukseen. Niiden ei tarvitse
liittyä tutkittavien arvojen saman- tai erisuuruisuuteen, vaan testauksen periaate
toimii myös muiden tilastollisten suureiden kanssa. Esimerkiksi tutkittaessa
koulutuksen ja ansiotason suhdetta voi nollahypoteesi olla, että näiden
tekijöiden välillä ei ole perusjoukossa korrelaatiota, ja vaihtoehtoinen
hypoteesi, että niiden välillä on positiivinen korrelaatio.
Merkitsevyystason valinta määrittää todennäköisyyden sille, että tutkija
hylkää nollahypoteesin, vaikka se on todellisuudessa pätevä. Kyse on siis
virheellisen valinnan riskistä. Tämän takia merkitsevyystasoa kutsutaan joskus
myös riskitasoksi. »Tilastollisen
päättelyn avulla ei voida koskaan sanoa varmuudella, että jokin
hypoteesi on tosi tai epätosi, vaan kyse on aina siitä, millä
todennäköisyydellä tutkija on valmis hylkäämään hypoteesin.
Yleisesti tieteellisessä tutkimuksessa käytetään 0,05 (eli 5%) tai 0.01
(eli 1%) riskitasoa. Jos kriteerinä käytetään 5% riskitasoa, tarkoittaa tämä,
että tulos on tutkimuksen perusjoukossa 95% varmuudella pätevä, mutta samalla
että, virheen todennäköisyys on 5%. Tämä tarkoittaa toisin sanoen sitä, että
jos perusjoukosta poimittaisiin 100 samankokoista satunnaisotosta, näissä
95:ssä nollahypoteesi hylättäisiin ja 5:ssä se jäisi voimaan. Jos riskitasona
käytettäisiin 1%-tasoa, vain yhdessä sadasta otoksesta nollahypoteesi jäisi
voimaan.
Jokaisen tilastollisen testin tuloksena saadaan ns. p-arvo, joka ilmoittaa
virheellisen päätelmän todennäköisyyden. Jos p-arvo on alle 0,05 on tapana
puhua tuloksesta tilastollisesti ”melkein merkitsevänä”, jos se on alle 0,01
tilastollisesti ”merkitsevänä” ja jos se on alle 0,001 tilastollisesti
”erittäin merkitsevänä”. Taulukoissa on tapana merkitä ”melkein merkitsevät”
tulokset yhdellä tähdellä (*), ”merkitsevät” tulokset kahdella (**) ja
”erittäin merkitsevät” tulokset kolmella tähdellä (***).
Kannattaa muistaa, että usein käytetyt 5%- ja 1%-riskitasot ovat täysin
sopimuksenvaraisia. Periaatteessa rajat voisivat olla esimerkiksi 6% ja 2%.
Tilastotieteen teoriasta ei löydy 5%- ja 1%-luottamustasoille mitään erityistä
perustetta, vaan ne ovat vain vuosien saatossa muodostuneet käytännöiksi. Tämän vuoksi on tärkeää, että
tutkija kiinnittää testitulosten lisäksi aina huomiota myös tulosten
sisällölliseen merkityksellisyyteen.
Kuten jo aiemmin todettiin, tilastolliseen hypoteesien testaukseen on
valtava määrä erilaisia testejä tutkimusongelman ja muuttujien mittaustason
luonteesta riippuen. Yksinkertaiset testit voidaan tehdä laskukoneen ja
tilastollisten taulukoiden tai taulukkolaskentaohjelman avulla. Käytännössä on
kuitenkin paras käyttää tähän tarkoitukseen tehtyjä tilastollisia
tietokoneohjelmistoja, joihin kaikki tärkeimmät tilastomenetelmät on valmiiksi
ohjelmoitu. Näin laskuvirheiden mahdollisuus pienenee, ja tutkija voi keskittyä
tulosten oikeaan tulkintaan.
Kun tilastolliset testisuureet ja niiden todennäköisyydet on laskettu, on
tutkijan tehtävä päätös siitä hylätäänkö nollahypoteesi vai ei. Puhtaasti
tilastolliselta kannalta katsottuna tämä tehtävä on helppo. Jos tilastollisen
testin antama tulos on pienempi kuin valittu riskitaso, hylätään nollahypoteesi
ja todetaan, että vastahypoteesi sai tukea. Muutoin todetaan, että
nollahypoteesia ei voitu kumota. Pelkkä tilastotieteellinen tarkastelu ei
kuitenkaan sellaisenaan riitä, vaan tutkijan on lähestyttävä asiaa myös
sisällöllisesti tutkimusongelman kannalta. Nollahypoteesin hylkäämiseen tai
hyväksymiseen liittyy myös muita tekijöitä. Kuvitellaan esimerkki, jossa tutkija
on kehittänyt johonkin vakavaan sairauteen uuden lääkkeen. Hänen
tutkimustuloksensa osoittavat, että lääkettä käyttäneet testiryhmän jäsenet
selviävät hengissä sairaudesta suuremmalla todennäköisyydellä kuin plaseboa
nauttineet kontrolliryhmän jäsenet. Tilastollinen testi kuitenkin osoittaa,
että ero on merkitsevä vain 6% riskitasolla. Tässä tapauksessa tutkijan tuskin
kannattaa luopua lääkkeen jatkotutkimuksista ainoastaan sen takia, että
testitulosten p-arvot eivät olleet alle 5%.
Englanninkielellä hypoteesien päättelyn perusteita voi
opiskella esimerkiksi seuraavista kirjoista:
·
Bohrnstedt, George W. & Knoke, David (1988): Statistics for
Social Data Analysis. Toinen pianos. F.E. Peacock Publishers, Itasca.
·
Cohen, Louis & Holliday, Michael (1996): Practical Statistics
for Students. Paul Chapman Publishing, Lontoo.
·
Kanji, Gopal K. (1999): 100 Statistical Tests. Sage, London.
Verkosta lisätietoa tilastollisesta päättelystä löytyy mm. Hyperstat Online
–palvelun kohdasta ”The Logic of Hypothesis Testing”. Osoite on:
Toinen hyvä verkkoresurssi on Valerie J. Eastonin ja John H. McCollin ”Statistics Glossary”
ja sen alakohta ”Hypothesis Testing” osoitteessa:
·
http://www.cas.lancs.ac.uk/glossary_v1.1/hyptest.html
1) hypoteesien valinta
2) tilastollisen testin valinta
3) merkitsevyystason valinta
4) testin suorittaminen
5) päätöksen tekeminen
o
Teoriasta johdetun oletuksen
vastainen hypoteesi