VINOUMA-summamuuttujan jakauma ennen mahdollista uudelleenluokittelua

Tero Erkkilä

Tässä esimerkissä pyritään muodostamaan summamuuttuja Eurobarometri 49-aineiston kysymyksestä Q28. Esimerkissä on tarkoitus havainnollistaa ns. toimimattomien muuttujien ilmenemistä survey-aineistoissa.

Q.28. For each of the following criteria, please tell me if it seems important to you, or not in deciding whether a particular country should join the European Union, or not ?
1. The country has to respect Human Rights and the principles of democracy
2. Its level of economic development should be close to that of other member states
3. It has to accept whatever has already been decided and put in place throughout the process of building Europe
4. Its joining should not be costly for existing member countries
5. It has to be prepared to put the interest of the European Union above its own
6. It has to fight organised crime and drug trafficking
7. It has to protect the environment
8. It has to be able to pay its share of the European Union budget

Vastausvaihtoehdot olivat: 1 = Important, 2 = Not important, 3 = Don't know (DK)

Vaikka monet kysymyssarjassa käsitellyt teemat ovat sinällään mielenkiintoisia, on itse kysymyksenasettelu osin varsin johdattelevaa. Kukapa ei esimerkiksi katsoisi tärkeäksi mahdollisten uusien jäsenten pyrkimyksiä taistella järjestäytynyttä rikollisuutta ja huumekauppaa vastaan tai osallistumista ympäristön suojeluun. Muuttujien saamat arvot kasautuvatkin luokkaan Important, jolloin muuttujan erottelukyky heikkenee. Vaikka tämä havainto sinällään saattaa olla mielenkiintoinen, ei jatkoanalyysi muutujilla ole mielekästä. Oheisessa esimerkissä on muodostettu summamuuttuja kaikista kahdeksasta Q28:n osakysymyksestä. Kaikista osamuuttujista koostuva summamuuttuja ei välttämättä ole selkeästi käsitteellistettävissä, mutta tämän esimerkin tarkoitus onkin lähinnä havainnollistaa jakaumia syntyvällä skaalalla.

Osamuuttujille tehtiin ensin reliabiliteettitesti, jossa alfan arvoksi saatiin 0.8539, mikä on selvästi 0,7 suurempi. Tämän jälkeen muuttujat laskettiin yhteen. Koska DK-luokka otettiin mukaan analyysiin, saa syntynyt summamuuttuja arvoja väliltä 8-24. Jakaumaa tarkasteltaessa onkin syytä muistaa, että kaikissa arvon 16 ylittävissä vastauskombinaatioissa on vastaaja vastannut vähintään yhteen kysymykseen DK. Ohessa on esitetty summamuuttujan frekvenssi-jakauma ennen uudelleenluokittelua niin taulukon kuin pylväsdiagrammin muodossa.
 
Statistics
VINOUMA 
N Valid 16110
Missing 55

VINOUMA
Frequency Percent Valid Percent Cumulative Percent
Valid 8.00 7068 43.7 43.9 43.9
9.00 2438 15.1 15.1 59.0
10.00 2439 15.1 15.1 74.1
11.00 1218 7.5 7.6 81.7
12.00 1009 6.2 6.3 88.0
13.00 411 2.5 2.6 90.5
14.00 420 2.6 2.6 93.1
15.00 144 .9 .9 94.0
16.00 234 1.4 1.5 95.5
17.00 37 .2 .2 95.7
18.00 137 .8 .9 96.6
19.00 20 .1 .1 96.7
20.00 63 .4 .4 97.1
21.00 6 .0 .0 97.1
22.00 53 .3 .3 97.4
23.00 1 .0 .0 97.4
24.00 412 2.5 2.6 100.0
Total 16110 99.7 100.0
Missing System 55 .3
Total 16165 100.0

Bar chart

Kuten frekvenssitaulukon kumulatiivisista prosenteista ja pylväsdiagrammista on huomattavissa, on muuttujan jakauma selkeästi positiivisesti vinoutunut. Jakauma painottuu voimakkaasti skaalan alkupäähän, eli kysymyksissä mainitut teemat on varsin yleisesti katsottu tärkeiksi. Huomattavaa on myös kaikkiin kysymyksiin 'don't know' vastanneiden piikki skaalan arvon 24 kohdalla. Jos summamuuttuja uudelleenluokiteltaisiin, tulisi sen ensimmäiseen luokkaan valtaosa havainnoista. Tällaisen muuttujan erottelukyky ja käytettävyys jatkoanalyysissä olisi varsin kyseenalaisia.