Tässä esimerkissä pyritään muodostamaan summamuuttuja Eurobarometri 49-aineiston kysymyksestä Q28. Esimerkissä on tarkoitus havainnollistaa ns. toimimattomien muuttujien ilmenemistä survey-aineistoissa.
Q.28. For each of the following criteria, please
tell me if it seems important to you, or not in deciding whether a particular
country should join the European Union, or not ?
1. The country has to respect Human Rights
and the principles of democracy
2. Its level of economic development should
be close to that of other member states
3. It has to accept whatever has already been
decided and put in place throughout the process of building Europe
4. Its joining should not be costly for existing
member countries
5. It has to be prepared to put the interest
of the European Union above its own
6. It has to fight organised crime and drug
trafficking
7. It has to protect the environment
8. It has to be able to pay its share of the
European Union budget
Vastausvaihtoehdot olivat: 1 = Important, 2 = Not important, 3 = Don't know (DK)
Vaikka monet kysymyssarjassa käsitellyt teemat ovat sinällään mielenkiintoisia, on itse kysymyksenasettelu osin varsin johdattelevaa. Kukapa ei esimerkiksi katsoisi tärkeäksi mahdollisten uusien jäsenten pyrkimyksiä taistella järjestäytynyttä rikollisuutta ja huumekauppaa vastaan tai osallistumista ympäristön suojeluun. Muuttujien saamat arvot kasautuvatkin luokkaan Important, jolloin muuttujan erottelukyky heikkenee. Vaikka tämä havainto sinällään saattaa olla mielenkiintoinen, ei jatkoanalyysi muutujilla ole mielekästä. Oheisessa esimerkissä on muodostettu summamuuttuja kaikista kahdeksasta Q28:n osakysymyksestä. Kaikista osamuuttujista koostuva summamuuttuja ei välttämättä ole selkeästi käsitteellistettävissä, mutta tämän esimerkin tarkoitus onkin lähinnä havainnollistaa jakaumia syntyvällä skaalalla.
Osamuuttujille tehtiin ensin reliabiliteettitesti,
jossa alfan arvoksi saatiin 0.8539, mikä on selvästi 0,7 suurempi.
Tämän jälkeen muuttujat laskettiin yhteen. Koska DK-luokka
otettiin mukaan analyysiin, saa syntynyt summamuuttuja arvoja väliltä
8-24. Jakaumaa tarkasteltaessa onkin syytä muistaa, että kaikissa
arvon 16 ylittävissä vastauskombinaatioissa on vastaaja vastannut
vähintään yhteen kysymykseen DK. Ohessa on esitetty summamuuttujan
frekvenssi-jakauma ennen uudelleenluokittelua niin taulukon kuin pylväsdiagrammin
muodossa.
| N | Valid | 16110 |
|---|---|---|
| Missing | 55 |
| Frequency | Percent | Valid Percent | Cumulative Percent | ||
|---|---|---|---|---|---|
| Valid | 8.00 | 7068 | 43.7 | 43.9 | 43.9 |
| 9.00 | 2438 | 15.1 | 15.1 | 59.0 | |
| 10.00 | 2439 | 15.1 | 15.1 | 74.1 | |
| 11.00 | 1218 | 7.5 | 7.6 | 81.7 | |
| 12.00 | 1009 | 6.2 | 6.3 | 88.0 | |
| 13.00 | 411 | 2.5 | 2.6 | 90.5 | |
| 14.00 | 420 | 2.6 | 2.6 | 93.1 | |
| 15.00 | 144 | .9 | .9 | 94.0 | |
| 16.00 | 234 | 1.4 | 1.5 | 95.5 | |
| 17.00 | 37 | .2 | .2 | 95.7 | |
| 18.00 | 137 | .8 | .9 | 96.6 | |
| 19.00 | 20 | .1 | .1 | 96.7 | |
| 20.00 | 63 | .4 | .4 | 97.1 | |
| 21.00 | 6 | .0 | .0 | 97.1 | |
| 22.00 | 53 | .3 | .3 | 97.4 | |
| 23.00 | 1 | .0 | .0 | 97.4 | |
| 24.00 | 412 | 2.5 | 2.6 | 100.0 | |
| Total | 16110 | 99.7 | 100.0 | ||
| Missing | System | 55 | .3 | ||
| Total | 16165 | 100.0 | |||
Kuten frekvenssitaulukon kumulatiivisista prosenteista ja pylväsdiagrammista
on huomattavissa, on muuttujan jakauma selkeästi positiivisesti
vinoutunut. Jakauma painottuu voimakkaasti skaalan alkupäähän,
eli kysymyksissä mainitut teemat on varsin yleisesti katsottu tärkeiksi.
Huomattavaa on myös kaikkiin kysymyksiin 'don't know' vastanneiden
piikki skaalan arvon 24 kohdalla. Jos summamuuttuja uudelleenluokiteltaisiin,
tulisi sen ensimmäiseen luokkaan valtaosa havainnoista. Tällaisen
muuttujan erottelukyky ja käytettävyys jatkoanalyysissä
olisi varsin kyseenalaisia.