6. Monen selittäjän logistinen regressio

Painelaskurilla voidaan suorittaa joitakin monen selittävän muuttujan logistisessa regressiossa tarvittavia laskuja käyttämällä edellistä, yhden muuttujan logistisen regression osiota. Saatujen tulosten tulkinnoissa on ongelmallista se, että selittäjien keskinäiset yhteydet (riippuvuudet; multicollinearity) tekevät ilmiön tilastollisesta tarkastelusta moniselitteisen. Kun halutaan kuvata yksittäisen selittäjän vaikutuksen suuruutta, on muistettava, että kiinnostavan muuttujan arvon muuttuessa myös muiden selittäjien arvot yleensä muuttuvat. Näillä muutoksilla on oma vaikutuksensa selitettävään muuttujaan.

Näemme ratkaisuna ilmiön mekanismien ymmärtämisen, sen eläinlääketieteellisen hallinnan; tilastolliset lähestymistavat eivät yksin riitä ratkaisemaan multikollineaarisuuden ongelmaa. (Siis: Tilastolliset lähestymistavat eivät yksin riitä ratkaisemaan multikollineaarisuuden ongelmaa.)

Tarkastelemme esimerkkinä kolmen selittävän muuttujan regressiota

logit(o) = α + β*X + γ*V + δ*W,

missä

o on keuhkokuumeeseen sairastuneiden vasikoiden osuus ja

logit(o) = ln[o/(100 - o)] eli osuutta o vastaavan paineen luonnollinen logaritmi;

X on kahden päivän ikäisen vasikan veren immunoglobuliini-G:n (IgG) määrä, yksikkönä g/dl,

V on indikaattori emän mastiitille: V = 1, jos emällä on mastiitti ja V = 0, jos emällä ei ole mastiittia ja

W on lehmien lukumäärä tilalla (kpl).

Esimerkissä laskelmat perustuvat aineistoon, jota on käytetty artikkelissa Virtala A-MK, Gröhn YT, Mechor GD, Erb HN: The effect of maternally derived immunoglobulin G on the risk of respiratory disease in heifers during the first 3 months of life. Prev Vet Med. 1999;39:25-37 (linkki). Tässä esitettäviä laskelmia ei ole julkaistu.

Artikkelin aineistoon perustuvat parametrien estimaattien arvot ovat

(α) -1.565, (β) -0.212, (γ) 0.537 ja (δ) 0.013.

A

Jos halutaan tietää, mikä on keuhkokuumeeseen sairastuneiden osuus o = o(x, v, w) mallin mukaan silloin, kun selittäjillä on (esimerkiksi) arvot x = 0.9 (IgG = 0.9 g/dl), v = 1 (emällä on mastiitti) ja w = 100 (tilalla on 100 lehmää), sijoitetaan osiossa 5A (Yhden selittäjän logistinen regressio)

vakiolle (constant) arvo a = -1.565,

kulmakertoimelle (coefficient) arvo b = 1 ja

selittävän muuttujan X arvoksi -0.212 * 0.9 + 0.537 *1 + 0.013 *100 = 1.6462.

Tuloksena saadaan osuus o(0.9, 1, 100) = 52 %.

B

Jos halutaan tietää, mikä on sellainen selittävän muuttujan X arvo x, jolla osuus o = o(x, v, w) saa halutun arvon, kun muilla selittäjillä V ja W on ennalta kiinnitetyt arvot v ja w, menetellään seuraavasti.

Jos v = 1 (emällä mastiitti) ja z = 100 (tilalla 100 lehmää), asetetaan osiossa 5B (Yhden selittäjän logistinen regressio)

vakion a arvoksi -1.565 + 0.537 *1 + 0.013 *100 = 0.272,

osuuden o = o(x, 1, 100) arvoksi asetetaan o = 52 % ja

kulmakertoimen b arvoksi asetetaan selittäjän X kulmakerroin, joka on -0.212.

Tuloksena saadaan muuttujan X arvo 1.6462.