Rudas, Tamás - tankonyvtar.hu · 2 Az első kiadás előszavából 1936-ban az Amerikai Egyesült Államok elnöke, Franklin Delano Roosevelt másodszori megválasztásáért küzdött

Közvélemény-kutatásRudas, Tamás

Közvélemény-kutatásRudas, Tamás

v 1.0

Publication date 2006Szerzői jog © 2006 Corvina Kiadó

iii

TartalomKözvélemény-kutatás ............................................................................................................. 1Az első kiadás előszavából ................................................................................................... 2A második kiadás előszava ................................................................................................... 41. Megismerhető-e a közvélemény? (Megbízhatóság és érvényesség) ................................. 5

Összefoglalás ................................................................................................................. 82. Kit képviselnek a megkérdezettek? (Reprezentativitás) ................................................. 10

Összefoglalás ............................................................................................................... 163. Hány embert kell megkérdezni? (Mintanagyság) ........................................................... 17

Összefoglalás ............................................................................................................... 274. Hogyan választják ki a megkérdezetteket? (Mintavétel) ................................................ 28

Összefoglalás ............................................................................................................... 355. Hogyan befolyásolja a kérdezés módja az eredményeket? (Adatgyűjtés) ...................... 36

Összefoglalás ............................................................................................................... 446. Mi történik azokkal, akik nem válaszolnak? (Válasz- és véleményhiány) ..................... 45

Összefoglalás ............................................................................................................... 507. Egyformán fontos minden válasz? (Súlyozás) ................................................................ 52

Összefoglalás ............................................................................................................... 658. Hogyan értelmezzük az eredményeket? .......................................................................... 67

Összefoglalás ............................................................................................................... 759. Minden adatra érvényes a vizsgálat hibahatára? ............................................................ 76

Összefoglalás ............................................................................................................... 8310. Összehasonlítók-e a különböző közvélemény-kutatások eredményei? ......................... 85

Összefoglalás ............................................................................................................... 9211. Miért jók a közvélemény-kutatások? ............................................................................ 93

Összefoglalás ............................................................................................................... 96

1

Közvélemény-kutatásÉrtelmezés és kritika

Rudas TamásCorvina

A könyv első kiadása Hogyan olvassunk közvélemény-kutatásokat?címen jelent meg (Budapest, Új Mandátum Kiadó, 1998).

Második, bővített kiadás© Rudas Tamás, 2006

Sorozatterv: Kiss IstvánJelen kiadvány a jogtulajdonos írásos engedélye nélkül

sem részben, sem egészben nem másolható,sem elektronikus, sem mechanikus eljárással, ideértve

a fénymásolást, számítógépes rögzítést vagyadatbankban való felhasználást is.

Kiadja a Corvina Kiadó kft., az 1795-ben alapítottMagyar Könyvkiadók és Könyvterjesztők Egyesülésének tagja

1072 Budapest, Rákóczi út 16.e-mail:[email protected]

www.corvinakiado.huFelelős kiadó: Kúnos László, a Corvina igazgatója

Felelős szerkesztő: Blaschtik ÉvaMűszaki vezető: Illyés Éva

ISBN 963 13 5501 2ISSN 1787–4629

2

Az első kiadás előszavából1936-ban az Amerikai Egyesült Államok elnöke, Franklin Delano Roosevelt másodszorimegválasztásáért küzdött. Ellenfele a republikánus párti Alfred Landon volt. Aszavazópolgároknak nemcsak két elnökjelölt vagy két párt, hanem két gazdaságpolitika közöttis választaniuk kellett. FDR a gazdaság óvatos élénkítésével akarta az országot kivezetni aválságból, Landon további takarékoskodást javasolt. A választás eredményének előrejelzésérea Literary Digest című magazin a történelem minden bizonnyal legnagyobb közvélemény-kutatását hajtotta végre. Tízmillió címre küldtek ki a választási szándékra vonatkozó kérdőívet.Kétmillió négyszázezer választ kaptak, és ezek alapján teljes bizonyossággal állították, hogy aválasztás nyertese Alfred Landon lesz. Előrejelzésük téves volt, és ez az olvasók bizalmának ésérdeklődésének olyan mértékű csökkenéséhez vezetett, hogy a lap hamarosan csődbe ment. Az1936-os elnökválasztás nemcsak az USA, hanem a közvélemény-kutatások történetének is jelentősállomása. A kutatók megértették, hogy önmagában a nagy mintaelemszám nem garantálja azelőrejelzés pontosságát.

Amekkora kudarc volt a Literary Digest számára az 1936-os amerikai elnökválasztáseredményeinek előrejelzése, ugyanakkora volt a siker George Gallup számára. Előrejelzéséneksikere alapján úgy tűnt, ő tudta, mire van szükség ahhoz, hogy viszonylag kisebb mintákraalapozva is sikeres előrejelzést lehessen adni. A megkérdezetteket úgy választotta ki, hogy a teljesminta összetétele néhány lényeges szempontból – mint a nem, az iskolai végzettség, a jövedelem– hasonló legyen a választópolgárok összességéhez. Ezzel a módszerrel nemcsak az 1936-oselnökválasztás eredményét tudta helyesen megjósolni, de 1948-ig mindig sikeres előrejelzést adott.1948-ban azonban az ő előrejelzése is tévesnek bizonyult, éppúgy, mint versenytársaié, akik akkormár mind hasonló elvek alapján választották mintáikat.

A negyvenes évek második fele óta az elemzők többsége egyetért abban, hogy nem elegendő, ha amintát úgy választjuk, hogy bizonyos, könnyen ellenőrizhető szempontokból hasonlítson az összesszavazópolgárból álló népességre. A jó előrejelzéshez az is szükséges, hogy az igazán lényegesszempontból, ti. a szavazási szándék szerint is hasonlítson a minta a szavazópolgárok összességére.Az utóbbi hasonlóság pedig nem feltétel nélküli következménye az előbbinek. Az első feltételúgy is teljesülhet, hogy a mintába kerültek szavazási szándékai erősen különböznek a teljesnépességétől. Csak akkor remélhetjük, hogy a minta a szavazási szándék szerint is jól reprezentáljaa népességet, ha kiválasztásában nem kedvezünk egyik társadalmi csoportnak sem, legyen ez akárfelismerhető (például iskolai végzettség), akár pedig felismerhetetlen jegyek által meghatározott(például a különböző jelöltekre szavazók). Ezt csak úgy valósíthatjuk meg, ha mindenkinekegyforma esélyt biztosítunk arra, hogy a mintába kerüljön, azaz a mintát véletlenszerűen választjuk.Ezzel a felismeréssel megszületett a mintavétel, és vele a közvélemény-kutatások modern elmélete.

Az utóbbi évtizedekben a közvélemény-kutatások, és különösen a politikai közvélemény-kutatások, minden demokratikus ország közéletében fontos szerepet játszanak, és ezért célszerűezen kutatások alapvető módszereinek megismerése.

Az első kiadás előszavából

3

Ezzel a könyvvel a közvélemény-kutatások iránt érdeklődő olvasóknak szeretnék segítségetnyújtani úgy, hogy bemutatom a közvélemény-kutatásokkal kapcsolatos legfontosabb fogalmakjelentését és a közvélemény-kutatások azon jellemzőit, amelyek az eredmények megbízhatóságáraés érvényességére a legnagyobb hatással vannak. Részletesen lesz szó a közvélemény-kutatások eredményeinek értelmezéséről és a különböző közvélemény-kutatások eredményeinekösszehasonlításáról. Nem azt tárgyaljuk, hogy hogyan tervezzünk és hajtsunk végre közvélemény-kutatásokat, hanem olyan ismereteket mutatunk be, amelyek egy közvélemény-kutatásminőségének megítélésében és eredményeinek értelmezésében a leglényegesebbek. Ezek azismeretek hasznosak lehetnek azoknak, akik politikusként, döntéshozóként vagy újságírókéntközvélemény-kutatásokat rendelnek meg, és azoknak is, akik a közvélemény-kutatásokeredményeit akár hivatásszerűen, akár csak érdeklődő újságolvasóként szeretnék pontosanmegérteni.

A szerző

4

A második kiadás előszavaA könyv első kiadása a megjelenése óta eltelt nyolc évben elfogyott, köszönhetően talán annak is,hogy az ország számos egyetemén tankönyvként használják. A közvélemény-kutatások fontosságaés az irántuk megnyilvánuló érdeklődés azonban nem csökkent az elmúlt időben. Az új kiadás aszöveg átfésülésén és néhány szóhasználati változtatáson túlmenően számos helyen részletesebbmagyarázatokkal szolgál, mint az első. A bővítések nem érintik az eredeti könyv célját ésszemléletét: ebből a könyvből nem lehet megtanulni közvélemény-kutatások készítését, de –szándékaim szerint – meg lehet tudni, hogy a közvélemény-kutatások eredményeit hogyan lehetértő és kritikus módon értelmezni.

A szerző

5

1. Megismerhető-e a közvélemény?(Megbízhatóság és érvényesség)Hihetünk-e a közvélemény-kutatások eredményeinek? Pontos képet kaphatunk-e egy egész országvagy akár csak egy városrész lakosságának véleményéről pusztán néhány száz vagy néhány ezerembernek feltett kérdésekre kapott válaszok alapján? Valójában olyan sikeresek és pontosak-e aközvélemény-kutatások, mint ahogyan azt készítőik gyakran állítják? Vagy talán a közvélemény-kutatások készítőik szándékait, az általuk várt eredményeket tükrözik?

Ezekre a kérdésekre nehéz lenne általánosan érvényes válaszokat adni. A közvélemény-kutatások nagy részét olyan problémákkal kapcsolatban végzik, amelyekről a lakosság „pontos”véleménye sohasem lesz ismert. Ezeknek a közvélemény-kutatásoknak az eredményeit nincs mivelösszehasonlítani, ezért nem lehet teljes bizonyossággal megállapítani, hogy milyen mértékbentükrözték a valóságot. A közvélemény-kutatások egy része azonban olyan kérdéseket vizsgál,amelyekkel kapcsolatban a teljes lakosság pontos álláspontja később ismertté válik, és ezekben azesetekben az előrejelzések összehasonlíthatóak a tényleges eredményekkel. A legfontosabb ilyenjellegű közvélemény-kutatások választási eredmények előrejelzését szolgálják. Ezek eredményeiösszehasonlíthatóak a tényleges választási eredményekkel, és így pontosságuk megállapítható.Természetesen ez az összehasonlítás csak akkor helyénvaló, ha a közvélemény-kutatás ideje ésa tényleges választás között az emberek nem változtatják meg szavazási szándékukat. Mivel ezteljes mértékben sohasem teljesül, a ténylegesen elvégezhető összehasonlítások a közvélemény-kutatásokat a valóságnál némileg kedvezőtlenebb színben tüntetik fel. Ezt figyelembe véve mégmeglepőbb lehet az a tény, hogy sok ország számos választása esetében az előre jelzett eredményekcsak igen kis mértékben tértek el a valódi eredményektől.

Mivel a közvélemény-kutatások eredményeinek pontosságát (legalábbis közvetlenül elkészültükután) nem lehet megítélni, az egyetlen alkalmazható minőségi kritérium a kutatásban alkalmazottmódszerekre vonatkozhat. Nem tudjuk, hogy milyen pontosak az eredmények, de tudjuk, hogy amegfelelően megválasztott módszerek jó eséllyel meglepően pontos eredményekre vezetnek, azaztöbb közvélemény-kutatás közül a nagy hibát eredményezők hányada kicsi. Azokat a módszereket,amelyeket a közvélemény-kutatás tervezése és végrehajtása során alkalmaztak, meg lehet ítélni, ésmegfelelő ismeretek birtokában jó képet alkothatunk az eredmények várható pontosságáról.

A közvélemény-kutatások eredményeinek hibáját (azaz eltérésüket a valóságtól) kétféle oknaklehet betudni. A hibák egyik lehetséges fajtája azzal van kapcsolatban, hogy a közvélemény-kutatásnem a teljes népességnek, hanem csak egy részének, nevezetesen a mintába került emberekneka megkérdezésén alapul. Az ebből származó hibákat mintavételi hibának nevezik. A mintavételihiba nagyságát úgy határozhatjuk meg, mint a közvélemény-kutatás eredményének az eltérésétattól az eredménytől, amelyet akkor kapnánk, ha a vizsgált népességből mindenkit kikérdeznénk,méghozzá ugyanazokat az eszközöket (kérdőíveket, telefonos vagy személyes megkérdezést,kérdezőbiztosokat) használva, mint az adott közvélemény-kutatásban. Ennek a hibának a nagysága

1. Megismerhető-e a közvélemény?

(Megbízhatóság és érvényesség)

6

tehát kizárólag azon múlik, hogy a mintába került és ténylegesen megkérdezett emberek véleménye(amennyire az adott eszközökkel megtudható) mennyire tér el a teljes népesség véleményétől.Hangsúlyozzuk, hogy a mintavételi hiba nagysága nem kizárólag a jó mintaválasztáson (ez elméletikérdés) múlik, hanem azon is, hogy a mintába választott személyeket milyen mértékben sikerülténylegesen megkérdezni (ami gyakorlati kérdés).

A hibák másik csoportja azáltal jön létre, hogy az emberek véleményét mindig csak korlátozottmértékben lehet megismerni egy kikérdezés során. Hiába kérjük a megkérdezettet: képzeljeel, hogy most tartják a választásokat, és ezt feltételezve mondja meg, hogy kire szavazna; amegkérdezett jól tudja, hogy a választásokat nem most tartják, ő most valójában nem szavaz, hanemegy ettől jelentősen eltérő helyzetben van (nevezetesen a véleményét kérdezik, és ez a vélemény– összesített formában – hamarosan megjelenik az újságban vagy egy döntéshozó asztalán), ésemiatt nem feltétlenül pont azt a pártot nevezi meg, amelyikre tervei szerint szavazni fog. Például –különösen a valódi választásoktól időben távol – üzenetet küld az aktuális kormánynak arról, hogyelégedett-e. Az azonban, ha a megkérdezett nem elégedett, még nem jelenti azt, hogy feltétlenül egymásik pártot választ majd, ha szavazásra kerül a sor. Azokat a hibákat, amelyek abból származnak,hogy a felhasznált módszerekkel a vizsgálat tárgyát nem lehet teljesen felderíteni (ami lehet amódszerek hibáinak vagy más körülményeknek a következménye), még akkor sem, ha az egésznépességet kikérdezik, nem mintavételi hibának nevezik.

A közvélemény-kutatás eredményeinek teljes hibája a mintavételi és nem mintavételi hibáknak azeredője, de ez nem feltétlenül jelent egyszerű összeadást. Néha a mintavételi és nem mintavételihibák kioltják vagy csökkentik egymást, hiszen mindkét hiba lehet pozitív és negatív is abbanaz értelemben, hogy eredményünk a valódi értéknél lehet nagyobb (pozitív hiba) és lehetkisebb (negatív hiba) is. Mindenesetre a teljes hiba nem lehet nagyobb, mint a mintavételi ésnem mintavételi hiba (abszolút értékének) összege. Ezért egy jó kutatásban mindkét hibafajtátcsökkenteni kell. Ezeknek a hibáknak a nagysága – és ez különösen igaz a nem mintavételi hibára– többnyire nem kvantifikálható, ezért egy konkrét kutatás esetén a hiba nagysága nem állapíthatómeg. A kutatás végrehajtására olyan eljárásokat kell választani, amelyek ezeknek a hibáknak anagyságát várhatóan csökkentik, és ez a legjobb biztosíték arra, hogy az eredmények várhatóannem lesznek túl rosszak.

A mintavételi és nem mintavételi hibák a közvélemény-kutatás megbízhatóságával ésérvényességével vannak kapcsolatban. Egy közvélemény-kutatás annál megbízhatóbb, minélkevésbé esetleges az eredménye. Ez azt jelenti, hogy ha a vizsgálatot azonos módszereketalkalmazva megismételnék (a mintavételtől kezdve), akkor mennyire kapnának más eredményeket.Minél eltérőbbek lennének az ismétlés eredményei az eredetiektől, annál esetlegesebbeknektekinthetőek az eredmények, annál kevésbé megbízhatóak. Némileg paradoxnak tűnhet az, hogyvéletlen mintavételt alkalmazva azt kívánjuk, hogy az eredmények ne legyenek esetlegesek.Mi mást adhatna a véletlen mintavétel, mint a véletlentől függő, azaz esetleges eredményeket?Mint később látni fogjuk, a véletlen mintavétel – néhány egyszerű szabály betartása és kellőennagy mintanagyság esetén – éppenséggel nem ad jellemzően a véletlentől nagy mértékbenfüggő eredményeket. Az eredmények csak kis mértékben fognak a véletlen hatásán múlni,



7

és még ez a függés is jól kvantifikálható. Más (nem véletlen) mintaválasztási eljárásokesetén ennek a függésnek a mértéke nem ismert. A véletlen mintavétel ismert megbízhatóságúeredményekre vezet. Természetesen, amikor egy eljárás megbízhatóságáról beszélünk, a(feltételezett) megismétlésnél feltesszük, hogy a valódi helyzet, amelyet a közvélemény-kutatássalszeretnénk megismerni, nem változott. Ezt a valóságban ritkán hihetjük. Például két egymástkövető közvélemény-kutatás eredményeinek eltérése egyaránt lehet a megbízhatóság alacsonymértékének és az időközben megváltozott véleményeknek a következménye. Következésképpenmegismételt közvélemény-kutatások eredményeinek összehasonlításából nem lehet a kutatásokmegbízhatóságára következtetni.

A közvélemény-kutatás eredményeinek érvényessége azt jelenti, hogy a kapott válaszok ténylegarra vonatkoznak, amiről a közvélemény-kutatás szól. Ha a közvélemény-kutatás célja aszavazópolgárok választási szándékainak előrejelzése, akkor ha a megkérdezettek ahelyett, hogyaz általuk majdan választandó pártot megneveznék, válaszaikban a hatalmon lévő pártnak vagyaz egyébként általuk megválasztani szándékolt pártnak a párt pillanatnyi politikáját megerősítővagy ellenző üzeneteket küldenek, akkor a vizsgálat érvényessége kicsi, mert az eredményeknem arra vonatkoznak, mint amit a készítők várnak. Az emberek jelentős része szavazhat egypártra anélkül, hogy annak politikájával teljesen egyetértene (ha más pártokéval még kevésbéért egyet), de egy megkérdezés alkalmával adott válasza kifejezheti azt is, hogy egy éppenaktuális kérdéssel kapcsolatban egy másik párt álláspontját helyesli. Az érvényességet azonbannemcsak a közvélemény-kutatás készítői által nehezen befolyásolható szempontok csökkenthetik,hanem a feltett kérdések pontatlansága, nehéz értelmezhetősége vagy az esetlegesen sugalltválaszok is. Hasonlóan csökkenti a vizsgálat érvényességét, ha a kérdőív nem nehezíti megazt, hogy a megkérdezett bizonyos tényekről a valóságnak nem megfelelő állításokat tegyen.Például stigmatizáló tényekről (például családon belüli erőszak vagy kábítószer-használat) azemberek nem szívesen számolnak be. Az őszinte válaszadást a kérdések megfogalmazásának (astigmatizáló jelleg csökkentésével) meg kell könnyítenie, és ennek letagadását (kiegészítő kérdésekfeltevésével) meg kell nehezítenie. Természetesen mindez csak akkor hatásos, ha a kérdezőbiztosszemélyisége és viselkedése megkönnyíti az esetleg kellemetlen valóság feltárását.

A közvélemény-kutatások megbízhatóságát és érvényességét a kutatás végzői által választottmódszerek alapvetően befolyásolják. A mintavételi hibát csökkenteni, és ezzel a megbízhatóságotnövelni elsősorban a gondos mintaválasztással, a megfelelő mintanagysággal, a minta minélnagyobb hányadának tényleges lekérdezésével lehet (a lekérdezés a szakzsargonban sikerrelvégrehajtott megkérdezést jelent). A nem mintavételi hibát csökkenteni, és ezáltal az érvényességetnövelni elsősorban a kérdezés helyes módjának megválasztásával, a kérdőív megfelelőszerkesztésével, a kérdezőbiztosok alapos kiképzésével és ellenőrzésével lehet. Ez a felsorolás csakvázlatosan tartalmazza a legfontosabb szempontokat. A kérdezés helyes módjának megválasztásapéldául magában foglalja a döntést a kérdezés helyéről és idejéről és arról is, hogy az adatgyűjtéstkérdezőbiztosok végezzék, vagy pedig úgynevezett önkitöltéses kérdőíveket használjanak; hakérdezőbiztosokat alkalmaznak, az adatgyűjtés személyes megkeresésen alapuljon, vagy telefononkeresztül történjen, esetleg postán juttassák el a kérdőíveket a megkérdezettekhez (amely esetbentermészetesen nincsenek kérdezőbiztosok). Mindezen eldöntendő szempontokat a közvélemény-



8

kutatás tervezőjének együttesen kell mérlegelnie, nem feledkezve meg az egyes módszerek költség-és időigényéről sem. A cél adott költségkereten belül a legmegbízhatóbb és legérvényesebb adatokgyűjtése. Ezt az optimalizálási feladatot általában nem lehet teljesen egzaktul megoldani, és bárbizonyos választások egy adott esetben minden bizonnyal jobbak más választásoknál, a vizsgálattervének kialakításakor a tapasztalatból származó intuícióra is szükség lehet.

A fenti szempontok közül a közvélemény-kutatás megrendelője vagy eredményeinek olvasójanéhányat könnyen megítélhet, és ebben a könyvben elsősorban ezekről lesz szó. A mintanagyságot,a mintaválasztás módját, a nemválaszolók arányát a legtöbb vizsgálatról szóló beszámoló közli.Ritkábban lehet olvasni a kérdőívben szereplő azon kérdésekről, amelyekkel megpróbáltákkideríteni, hogy például a megkérdezett szándékozik-e szavazni (márpedig azok pártpreferenciáinem fogják befolyásolni a választások eredményeit, akik el sem mennek szavazni, és nem biztos,hogy azok, akik nem kívánnak szavazni, ezt előre meg is mondják). Arról pedig, hogy kikvoltak a kérdezőbiztosok, milyen képzésen vettek részt, hogyan ellenőrizték a munkájukat, hogyanbiztosították például azt, hogy nagyjából hasonlóan legyenek öltözve, vagy volt-e lényeges eltéréskorban vagy képzettségben közöttük, szinte soha nem tudunk meg semmit.

Egy jó közvélemény-kutatás (amelyről joggal remélhetjük, hogy hibája kicsi) nagy figyelmetfordít mindezekre a szempontokra. Egy jó közvélemény-kutatási beszámoló valamilyen szintenutal is ezekre a szempontokra. Ebből az is következik, hogy egy bizonyos terjedelem alatt nemlehet érdemben beszámolni egy közvélemény-kutatásról. A közvélemény-kutatás eredményei nemértékelhetők a módszerek ismerete nélkül, amelyekkel az eredmények születtek. A módszerekismerete nélkül az eredményeknek sem a megbízhatósága sem az érvényessége nem ítélhető meg.Sőt, az eredmények egyáltalán nem értelmezhetőek azoknak a módszereknek az ismerete nélkül,amelyeknek alkalmazásával születtek. A magyar sajtóban kialakult gyakorlat (a közvélemény-kutatások módszereinek rövid összefoglalása egy úgynevezett keretben) sokkal jobb, mint haaz olvasót az alkalmazott módszerekről egyáltalán nem tájékoztatnák. Ugyanakkor a szokásostájékoztató méretek nem teszik lehetővé valamennyi szükséges információ közlését, még vázlatosformában sem. Pedig ez nagyon hasznos lenne, mivel a sajtóban megjelenő közlemények sokkülönböző módon végrehajtott, részleteikben erősen eltérő közvélemény-kutatásokon alapulnak.

Egy – a valóságot némileg leegyszerűsítő – példaként tegyük fel, hogy a vizsgálat eredményeszerint egy pártra a szavazók 15%-a szavazna. Ez nem sokat jelent, ha nem tudjuk a következőket:az összes szavazásra jogosult, vagy pedig a valószínűleg valóban szavazók 15%-áról van-e szó;hogyan és mennyire pontosan állapították meg, hogy kik a valószínű szavazók és kik a valószínűlegnem szavazók (érvényesség); a minta nagyságától, a mintavétel módjától és egyéb szempontoktólfüggően mit várhatunk a mintában talált arány és az egész népességre jellemző arány eltéréséneknagyságával kapcsolatban (megbízhatóság).

ÖsszefoglalásEgy közvélemény-kutatás eredményeinek eltérése a valóságtól, azaz hibája, a mintavételi és a nemmintavételi hibákból ered.



9

A mintavételi hibák a megbízhatóságot, a nem mintavételi hibák az érvényességet csökkentik.

E hibák várható nagyságának csökkentésére számos módszer áll a közvélemény-kutatáskészítőinek rendelkezésére. Egy jó közvélemény-kutatás él ezekkel a lehetőségekkel, és azalkalmazott módszerekről be is számol olyan részletesen, hogy érvényessége és megbízhatóságamegítélhető legyen.

10

2. Kit képviselnek a megkérdezettek?(Reprezentativitás)A reprezentativitás a közvélemény-kutatások mintáinak legkívánatosabb tulajdonsága. Egyesközvélemény-kutató cégek azt állítják saját mintáikról, hogy azok „reprezentatívak”, mások csakannyit, hogy mintáik valamilyen szempontokból jól reprezentálják a vizsgálni kívánt sokaságot.Természetesen a közvélemény-kutatás céljaira egy olyan minta lenne a jó, amely a vizsgálni kívántváltozó szerint reprezentatív. Ha például arra vagyunk kíváncsiak, hogy egy bizonyos politikai párta szavazatok hány százalékát kapná, ha most tartanák a választásokat, akkor egy olyan minta lennejó, amelyben a párt szavazóinak aránya megegyezik a párt szavazóinak a populációbeli arányával.Ha a párt az összes szavazat 14%-át kapná, akkor olyan mintára lenne szükségünk, amelyben apárt szavazóinak aránya szintén 14%. Ha például a közvélemény-kutatás 1000 fő megkérdezésénalapul, azaz a mintanagyság 1000, akkor egy olyan minta lenne jó számunkra, amelyben a pártszavazóinak száma 140. Ebből a mintából a párt szavazóinak arányára olyan becslést kapnánk(140/1000=14%), amely megegyezik a populációbeli értékkel. A vizsgált párt szavazóinak számavagy aránya szempontjából ez a minta reprezentatív lenne, mert pontosan tükrözné a populációbeliarányokat.

Sajnálatos módon azt sohasem tudhatjuk, hogy a mintánk a minket érdeklő szempontbólreprezentatív-e. Ennek eldöntéséhez a mintában tapasztalt értéket össze kellene hasonlítani apopulációra jellemző értékekkel. A populációra jellemző értékek azonban nem ismeretesek. Haezeket az értékeket ismernénk, például tudnánk egy párt szavazóinak arányát az összes szavazóközött, akkor a vizsgálatra nem is lenne szükség. A közvélemény-kutatás mindig olyan témárólszól, amellyel kapcsolatban a lakosság álláspontja nem ismert kellő pontossággal, ezért az semeldönthető, hogy a vizsgálat alapjául szolgáló minta reprezentatív-e.

Más a helyzet olyan jellemzőkkel, amelyek a Központi Statisztikai Hivatal által gyűjtött adatokalapján jól ismertek. Ilyenek például a felnőtt népesség megoszlása nemek szerint, az iskolaivégzettség különböző szintjei szerint vagy pedig a Budapesten, egyéb városokban, illetveközségekben lakók aránya. Ezeknek az információknak a forrása a tízévenkénti népszámlálásés a közbülső időben végrehajtott úgynevezett mikrocenzus, amely ugyan nem teljes körűadatfelvétel, de még mindig olyan nagy mintán végzett és megbízható adatgyűjtés, amelynekeredményei a közvélemény-kutatások számára viszonyítási alapként szolgálhatnak. Ezen változókszempontjából a minta reprezentativitása ellenőrizhető és szerencsés esetben megállapítható (ha amintabeli érték nem tér el nagymértékben a populációra jellemző értéktől).

Könnyen előfordulhat, hogy a minta valamely szempontból reprezentatív, de egy más szempontszerint már nem az. Egy mintát akkor nevezhetnénk minden további nélkül reprezentatívnak,ha valamennyi, a vizsgálatban feltett kérdés szerint reprezentálná a teljes populációt. Azt,hogy a reprezentativitás teljesül-e, éppen a legfontosabb (a kutatás tárgyát képező) változók

2. Kit képviselneka megkérdezettek?(Reprezentativitás)

11

szempontjából lehetetlen ellenőrizni. Ezért ebben az általános értelemben reprezentatív mintárólnem beszélhetünk. A minta csak bizonyos változók szerint lehet reprezentatív. A vizsgálat tárgyátképező változó(k) szempontjából a reprezentativitás kérdése nem dönthető el.

Ennek illusztrálására képzeljünk el egy egész pici országot, amelyben csak tíz szavazásra jogosultél (ez a populáció), közülük öt nő és öt férfi. Tegyük fel még azt is, hogy a választáson, amelynekeredményét szeretnénk előre jelezni, csak két párt indul, A és B. A nők közül egy szavaz az A pártra,a férfiak közül pedig 4, a többiek a B pártra szavaznak. Eszerint a lakosság fele az A pártra szavazna,a lakosság fele a B pártra. Ez a valóság. De milyen eredménnyel járna egy közvélemény-kutatás?Ennek illusztrálására feltesszük, hogy minden megkérdezett válaszol szavazási szándékát firtatókérdésünkre, a megkérdezettek pártpreferenciái léteznek, határozottak és őszintén is válaszolnak.A valóságban természetesen ezek közül a feltevések közül egyetlen sem teljesül, de most csaka minták lehetséges tulajdonságait vizsgáljuk, és az egyéb problémákat későbbi fejezetekbentárgyaljuk.

Tegyük még fel, úgy döntünk, hogy a közvélemény-kutatást két fő megkérdezésére alapozzuk,azaz a mintanagyság kettő. Ki lehet számolni, hogy ebben az esetben negyvenöt darab különbözőmintával találkozhatunk. (Bár annak belátása, hogy éppen 45 különböző minta lehetséges ebben azesetben, nem szükséges a továbbiak megértéséhez, bemutatjuk azt az egyszerű gondolatmenetet,amelyen ez az eredmény alapul: Válasszuk ki először az első személyt a mintába. Mivel apopulációban 10-en vannak, a választás tízféle módon lehetséges. Akárkit választottunk is az elsőalkalommal, a második személy kiválasztására még 9 különböző lehetőség maradt, hiszen a 10emberből egyet már kiválasztottunk. Így a két fő kiválasztására 10*9 = 90 lehetőség van. Haazonban 90 lehetőségre gondolunk, akkor ebbe beleszámítottuk azt a mintavételt, amelynek soránaz első választás az x ember és a második választás az y ember, és egy másik mintavételkéntazt is, amelyben y az elsőként kiválasztott ember és x a másodszorra kiválasztott. Valójábanezek a választások ugyanarra a mintára vezettek, nevezetesen arra, amelyben x és y szerepel,függetlenül attól, hogy milyen sorrendben választottuk ki őket. Hasonlóan minden lehetségesmintát kétféle sorrendben választhatunk ki, és előbbi eredményünk, a 90, minden mintát kétszertartalmaz. Tehát ténylegesen 90/2 = 45 különböző minta van. Megjegyezzük, hogy a későbbiekbenennél sokkal bonyolultabb számítások eredményeit közöljük majd, anélkül, hogy utalnánk azokraa módszerekre, ahogy a közölt eredményeket megkaphatjuk.) Az, hogy a 45 lehetséges minta közüléppen melyiket választjuk, véletlentől függő eljáráson alapul és nem befolyásolható.

Az egész populáció és valamennyi lehetséges minta is egy úgynevezett 2×2-es táblázatbahelyezhető. Ez a táblázat minden embert két szempontból csoportosít: a neme és a pártpreferenciájaszerint. Ezekből a szempontokból az ország lakosságának megoszlását az 1. táblázat tartalmazza.


12

Az egyik lehetséges minta két férfiból áll, akik közül egy az A pártra, egy pedig a B pártraszavaz. A negyvenöt lehetséges mintából négy lesz ilyen, hiszen B-re szavazó férfi egy van ésehhez négyféleképpen választhatunk egy A-ra szavazót. Egy ilyen mintából a pártpreferenciáthelyesen becsülnénk (mert a minta fele szavazna az A pártra), tehát a pártpreferencia szempontjábólez a minta reprezentatív. Ugyanakkor a minta nem reprezentatív a nemek szerinti eloszlásszempontjából, mert csupa férfiból áll. Ez utóbbi tényt meg tudnánk állapítani a mintának anépszámlálás adataival való összehasonlításából, az előbbit nem. Ez a minta tehát nem tűnikreprezentatívnak a nemek szerint, de ennek ellenére reprezentatív a pártpreferenciák szerint.

Léteznek olyan minták is, amelyek csak a nemek szerinti megoszlást mutatják helyesen (példáulegy A-ra szavazó férfit és egy A-ra szavazó nőt tartalmaznak), valamint olyan minták, amelyekmindkét szempontból reprezentatívak vagy egyikből sem.

Az összes minta besorolható ezen szempontok szerint. A 2. táblázat azt mutatja, hogy a 45lehetséges minta hogyan oszlik meg a reprezentativitás szempontjából.

Azt látjuk, hogy a 45 lehetséges minta közül 17 olyan, amely a nemek és a pártpreferenciaszerint is reprezentatív, további 8 a pártpreferencia szerint reprezentatív, a nemek szerint nem.Ezen minták bármelyikét választjuk is, a pártpreferenciák előrejelzése helyes lesz. Vannak


13

tehát olyan minták, amelyek a pártpreferenciák pontos előrejelzésére kitűnően használhatóak,annak ellenére, hogy a nemek szerinti megoszlás szempontjából torzítanak. A pártpreferenciákpontos előrejelzésének nem feltétele az, hogy a minta pontosan tükrözze a populáció nemekszerinti megoszlását. Ugyanakkor azon 25 minta között, amelyek a nemek szerinti megoszlástpontosan reprezentálják, 8 olyan van, amely a pártpreferenciák szerint nem reprezentatív, azazaz ellenőrizhető reprezentativitás a nemek szerinti megoszlás szempontjából egyáltalán nemgarantálja a reprezentativitást a pártpreferenciák szempontjából.

Összefoglalóan megállapíthatjuk, hogy egy ellenőrizhető szempont (nemek) szerinti megoszlásnaka pontos vagy pontatlan volta a mintában nem garantálja, hogy a minta a vizsgálat célja(pártpreferencia) szerint reprezentatív. Ezért azok a mintavételi eljárások, amelyek csak arraügyelnek, hogy a mintában bizonyos társadalmi csoportok a populációbeli arányuknak megfelelőenszerepeljenek (természetesen itt csak ellenőrizhető szempontokról lehet szó), de ezen belül akérdezőbiztosokra bízzák a megkérdezettek kiválasztását, nem megfelelőek. Az ilyen eljárásokatkvótás mintavételnek nevezik. Ezek olyan mintákat eredményeznek, amelyek néhány ellenőrizhetőszempontból reprezentatívak, de ez nem jelent biztosítékot arra nézve, hogy a vizsgálat tárgyátképező szempontból is reprezentatívak lennének.

A valóságban a kvótás mintavételi eljárások rosszabb eredményeket adnak, mint azt afentiek alapján hihetnénk. Gyakran lényeges torzításokhoz vezet az, hogy a kérdezőbiztosoka megadott kereteken belül maguk választják ki a megkérdezetteket. Ez azért van így, merta kérdezőbiztosoknak könnyebb megkérdezniük bizonyos csoportok tagjait, mint másokat. Akérdezőbiztosok gyakran saját környezetükből választják ki a megkérdezetteket kvótás mintavételesetén, ami torzításokhoz vezethet. Vagy például könnyen feltételezhető, hogy a rendszerint fiatalkérdezőbiztosok minden társadalmi csoportból a „fiatalosabbakat” fogják előnyben részesíteni,aminek egy politikai közvélemény-kutatás esetén jelentős torzító hatása lehet.

A kvótás mintavétel tehát annak ellenére, hogy bizonyos ellenőrizhető szempontokból biztosítjaa minta reprezentativitását, a vizsgálat tárgyát képező szempontokból gyakran torz mintáhozvezet. Ez a torzítás a körülményektől függően többé vagy kevésbé fontos. Ha csak arra vagyunkkíváncsiak hogy ki nyeri a választásokat, és az egyik párt lényegesen népszerűbb, mint bármelymásik párt, akkor a választások eredményét kissé torz minta alapján is pontosan előre jelezhetjük.Ha azonban az eredmény szoros, akkor már egy kissé torz minta alapján is tévedhetünk. Ezértkvótás mintavételt ma már általában nem használnak.

A kvótás mintavételi eljárás hiányossága úgy is megfogalmazható, hogy a kérdezőbiztosok általpreferált társadalmi csoportok nagyobb mértékben kerülnek a mintába, mint az egyéb csoportok,még akkor is, ha a csoportképző szempontok egy része – az előírt kvóta miatt – nem is torzul.Ezt úgy lehet kiküszöbölni, hogy a populáció minden tagjának egyforma esélyt adunk a mintábakerülésre. Az ezen az elven alapuló mintavételi eljárásokat véletlen mintavételnek nevezik.

A véletlen mintavétel legegyszerűbb formája egy olyan listát használ fel, amely a populáció mindenegyedét tartalmazza. Közvélemény-kutatásoknál a vizsgált populáció emberekből áll, például a


14

budapesti hajléktalanokból, ha azt szeretnénk megtudni, hogy mennyire elégedettek bizonyosszociális ellátásokkal, vagy az összes szavazásra jogosultból egy választási előrejelzésnél, vagya város egy bizonyos területének összes lakójából, ha a buszmegálló kívánatos elhelyezésénekfelderítése a cél, vagy egy iskola tanulóiból, ha a legnépszerűbb tanárt akarjuk kiválasztani.Ezekben az esetekben a teljes populációt felsoroló lista előállítása különböző (az előbbifelsorolásban csökkenő) mértékben nehéz feladat.

Az egyszerű véletlen mintavétel a populáció minden tagjának ugyanakkora esélyt ad a mintábakerülésre. Ha a minta nagysága előre rögzített és a populáció nagysága is ismert, akkor egy személybekerülési valószínűsége e két szám hányadosa. Ha teljes listával rendelkezünk a populációról,akkor az egyszerű véletlen mintavételt úgy képzelhetjük el, hogy a populáció minden tagjának anevét felírjuk egy papírlapra, ezeket belehelyezzük egy nagy dobozba, jól megkeverjük a cédulákat,és addig húzunk ki neveket (a már kihúzottak visszatevése nélkül), amíg el nem érjük a kívántmintanagyságot. Ez a mintavételi eljárás azt is eredményezi, hogy rögzített mintanagyság mellettaz összes lehetséges ekkora méretű minta azonos valószínűséggel kerül kiválasztásra.

A korábbi példában szereplő tíz fős populáció esetén az egyszerű véletlen mintavételt úgyhajtanánk végre (kételemű mintákkal), hogy előbb kiválasztanánk egy személyt a tízből, ésutána még egyet a fennmaradó kilencből. A mintába kerülő személyek kiválasztásánál azonbansemmilyen szubjektív tényező nem játszhatna szerepet, kizárólag a pártatlan véletlen. Mintemlítettük, ebben az esetben 45 különböző kételemű minta lehetséges, és ezek mindegyikeugyanakkora valószínűséggel kerülne kiválasztásra. Ez azt jelenti, hogy ha például kilencezerszervennénk mintát ebből a populációból, akkor várhatóan valamennyi mintát nagyjából kétszázalkalommal választanánk.

Mit nyerünk, és mit veszítünk a véletlen mintavétel alkalmazásával? Az egyik veszteség az,hogy véletlen mintavétel esetén nincs garancia arra, hogy a kapott minta bármilyen fontosjellemző szerint reprezentatív legyen. Előfordulhat, hogy a minta torz még olyan alapvetőszempontból is, mint a nemek szerinti megoszlás. További veszteségnek tűnhet az, hogy a véletlenmintavétel eredménye felett nem gyakorlunk kontrollt, „ki vagyunk szolgáltatva a véletlennek”.A véletlennek való kiszolgáltatottság azonban nem is olyan rossz. Mindenesetre sokkal jobb, mintha a kérdezőbiztosok vagy a vizsgálat egyéb résztvevőinek önkéntelen preferenciái befolyásolnáka minta összetételét. A véletlen pártatlan és – legalábbis hosszú távon – kiegyensúlyozottmintaválasztást eredményez. Semmilyen mintavételi eljárás esetén sem tudjuk megmondani, hogyaz aktuális minta reprezentatív-e a vizsgálandó szempontokból. Véletlen mintavétel esetén aztremélhetjük, hogy ez a reprezentativitás – hosszú távon és átlagosan – teljesül.

Az előző példánkban szereplő negyvenöt különböző kételemű minta közül huszonöt reprezentatívvolt, azaz azt mutatják, hogy a szavazók fele az A pártra, másik fele pedig a B pártra szavaz.A fennmaradó húsz minta közül tízben mindenki az A pártra szavazna, tízben pedig mindenki aB pártra. Ha az összes mintából számítanánk ki az A pártra szavazók arányát, ötven százalékotkapnánk, hiszen (25*50%+10*100%+10*0%)/(25+10+10)=50%. Ebből az is következik, hogyvéletlen mintavétel esetén a mintából az A párt szavazóira kapható becslések átlaga a mintavételi


15

és becslési eljárás sokszori alkalmazása után szintén 50% lesz. Átlagosan tehát helyesen fogjukmegbecsülni a két párt szavazóinak arányát.

Természetesen ez nem jelenti azt, hogy véletlen mintavétel esetén minden minta alapján pontosbecslést adnánk. Azonban olyan mintát, amely alapján a becslés nagyon rossz lenne, ritkánkapunk. Kicsit pontosabban: minél jobban eltér egy mintában az A párt szavazóinak aránya a teljesnépességen belüli arányuktól, annál kisebb valószínűséggel, annál ritkábban fogjuk ezt a mintátmegfigyelni. Az a tendencia, hogy rossz becslést adó mintákat csak ritkán fogunk megfigyelni,sokkal erősebb, mint azt gondolnánk.

Ha például a párt szavazóinak aránya a népességben 50%, a mintanagyság pedig 2500, akkor azösszes lehetséges minta 68%-a annyira jó, hogy a párt szavazóinak aránya a mintában (és ezzelegyütt a populációbeli arányukra vonatkozó becslésünk) 49% és 51% között lesz. Az összes 2500személyt tartalmazó mintáknak a fennmaradó nagyjából egyharmad része egyformán oszlik megolyan minták között, amelyekben a párt szavazóinak aránya több, mint 51%, és olyan minták között,amelyekben a párt szavazóinak aránya kisebb, mint 49 %. Más szavakkal: ha véletlenszerűenválasztunk egy 2500 elemű mintát, akkor az eseteknek több mint kétharmad részében a mintánkannyira jó lesz, hogy a párt szavazóinak arányát illetően a mintára és a populációra jellemző értékekeltérése kisebb, mint 1 százalékpont, és csak a mintáknak kevesebb, mint egy harmada fog olyanbecslést adni, amelynek hibája nagyobb, mint 1 százalékpont. Ezek az eredmények a véletlenmintákra vonatkozó matematikai megfontolásokból származnak. Ezeknek a jó tulajdonságoknaka teljesüléséhez nem kell mást tenni, mint a véletlen mintaválasztás szabályait betartani, és akkor„automatikusan” teljesülnek. Ugyanebben a helyzetben azon minták aránya, amelyekből a pártszavazóinak arányát 48% és 52% közé tennénk, 95% lenne, azaz húsz minta közül tizenkilencesetében legfeljebb két százalékpontot tévednénk. Azon minták aránya, amelyben legfeljebb háromszázalékpontot tévednénk, azaz a pártra szavazók becsült aránya 47% és 53% között lenne, azösszes lehetséges minták 99,7%-a. Ez azt jelenti, hogy 300 mintaválasztás közül mindössze egylenne – várhatóan – annyira balszerencsés, hogy három százalékpontnál nagyobb hibát vétsünk.

Tehát a véletlen mintavételen alapuló eljárások nagy biztonsággal olyan mintákat eredményeznek,amelyekből egy párt szavazóinak arányát kis hibával meg lehet becsülni. Természeten afenti eredmények matematikaiak, és csak megszorítással alkalmazhatóak a valóságra. Azt kellfeltennünk, hogy a népességben mindenkinek van határozott pártpreferenciája, a mintát valóbanegyszerű véletlen mintavétellel választották ki, mindenki válaszolt, aki eredetileg a mintába került,és mindenki őszintén válaszolt. Ezen szempontok közül valamennyi szerint jónak kell lenniea közvélemény-kutatásnak ahhoz, hogy a fenti – igen kedvező – eredmények a pontosságravonatkozóan akár csak közelítőleg is igazak legyenek. Ez azt mutatja, hogy egy közvélemény-kutatás minőségének és ezen keresztül az eredmények érvényességének és megbízhatóságának amegítéléséhez számos részlettel kell tisztában lennünk.


16

ÖsszefoglalásA véletlen mintavétel átlagosan pontos és megfelelő mintanagyság mellett az esetek többségébenegyedileg is igen pontos becsléseket tesz lehetővé.

A véletlen minták az esetek többségében jól reprezentálják a népességet a vizsgált szempontból;ennek nem feltétele az, hogy a minta valamely ellenőrizhető szempontból reprezentatív legyen.

Azt, hogy egy minta jó-e, nem lehet eldönteni. Egy mintát akkor tekintünk jónak, ha helyesmódszerrel választották.

Ne higgyünk azoknak a közvélemény-kutatásoknak, amelyek készítői azt állítják, hogy mintájuk„reprezentatív”. Ezek a kutatók összekeverik vágyaikat a tényekkel.

17

3. Hány embert kell megkérdezni?(Mintanagyság)Minél nagyobb a minta, annál megbízhatóbbak az eredmények. Ezt mindenki tudni véli, bárnem biztos, hogy mindenki ugyanazt érti ezen az állításon. Mielőtt azonban megkeresnénk azta jelentést, amely helyes, emlékezzünk a Literary Digest kudarcára. Ha egy mintát rossz módonválasztanak, a nagyobb létszám nem segít. Ez ugyanis csak nagyobb léptékben lesz rossz. Tehát anagy mintalétszám csak akkor kívánatos, ha egyébként a mintát helyesen választották.

A minta nagy voltának egyik szokásos értelmezése az, hogy a minta elemszáma nagy. Annakmegállapításához, hogy a minta elég nagy-e ebben az értelemben, olyan kritériumokat kellenefelállítani, amelyeket bármilyen populáció esetén alkalmazhatunk. A másik szokásos értelmezés az,hogy a minta a vizsgált sokaságnak nagy hányadát képviseli. Annak eldöntéséhez, hogy egy ilyentípusú kritérium teljesül-e, ismerni kell a vizsgált populáció létszámát. Sok esetben ez a létszámnem ismert (gondoljunk csak a hajléktalanok véleményével foglalkozó vizsgálatra).

Az, hogy a minta milyen mértékben közelíti az egész népességet, sok tényezőtől függ, dematematikai szempontból lényegében csak háromtól: a populáció becsülni kívánt jellemzőjétől, amintavétel módjától és a minta elemszámától.

A populáció becsülni kívánt jellemzője lehet egy arányszám, melyet gyakran százalékos formábanfejezünk ki (például egy pártra adott szavazatok aránya az összes szavazaton belül) vagy egyátlag (például egy politikus rokonszenv-osztályzatainak átlaga). Első látásra úgy tűnhet, hogy eza két eset nem különbözhet nagyon: az arány is egy átlag. Ennek belátásához arra az egyszerűtrükkre van szükség, hogy a párt szavazóihoz rendeljük az 1 értéket, azokhoz pedig, akik nemerre a pártra szavaznának, rendeljük a 0-t. Így minden megfigyelést egy értékkel jellemzünk, ésezeknek összege éppen a vizsgált párt szavazóinak száma. A keresett arány ez az érték osztva aminta teljes elemszámával. De ha egy összeget (a 0-k és 1-ek összegét) elosztjuk a tagok számával,az átlagot kapjuk. Ezért a párt szavazóinak aránya a mintában a megfigyelt 0-k és 1-ek átlaga lesz.E könnyű azonosíthatóság ellenére a két eset eltérő. Feltéve, hogy a párt szavazóinak népességbeliarányát ismerjük, a szavazóknak a különböző mintákban vett számát vagy arányát illetően hasznosállításokat tehetünk pusztán ezt az információt felhasználva. Az átlagos rokonszenv osztályzatesetében a különböző mintákban megfigyelt értékek eloszlása a népességbeli átlagon túlmenőenmég mástól is függ. Ennek a különbségnek az az oka, hogy ha a szavazóknak a populációbeliaránya adott, például, ha egy nyolcmilliós népességben a párt szavazóinak aránya 15%, akkorez – természetesen – csak úgy fordulhat elő, hogy a népességben egymillió-kétszázezren erre apártra szavaznak és hatmillió-nyolcszázezren nem erre a pártra szavaznak. Tehát a minket érdeklőjellemző ebben az esetben meghatározza az egész populációt jellemző viszonyokat. Ezzel szemben,ha egy politikus rokonszenv-átlaga 4, akkor ez úgy is előfordulhat, hogy a népesség fele hármas,fele pedig ötös osztályzatot ad, vagy úgy, hogy a népesség kétharmada ötös, egyharmada pedig

3. Hány embert kellmegkérdezni? (Mintanagyság)

18

kettes osztályzatot. Tehát ebben az esetben a minket érdeklő jellemző nem határozza meg az egésznépesség értékeit. Emiatt a minták jó vagy rossz voltának mértékét nemcsak az a tény határozzameg, hogy a népesség átlagos osztályzata négyes, hanem az is, hogy milyen osztályzatokból jönössze ez a négyes. Ha például a népességben mindenki négyes osztályzatot ad, akkor ezt mindenminta híven tükrözi, de ha a népesség fele hármas, fele ötös osztályzatot ad, akkor lesznek jobb ésrosszabb minták (amelyek többé vagy kevésbé pontosan tükrözik ezt).

A mintavétel módját most csak idealizált, matematikai szemszögből tárgyaljuk. Később leszszó azokról a mintavételi eljárásokról, amelyek a gyakorlatban is kivitelezhetők, és elméletiszempontból is kielégítő eredményeket adnak. Az egyszerű véletlen mintavétel technikailag pontosjelentése az, hogy a vizsgálandó népességből a mintába kerülőket egymás után választjuk, egyikválasztás sem függ az előző eredményétől, és minden húzás alkalmával a vizsgálandó népességminden (addig ki nem választott) tagjának egyforma esélye van a mintába kerülésre. A mintavételimódszerek aszerint is csoportosíthatók, hogy a mintavétel visszatevéssel vagy anélkül történik.Ennek a különbségnek a megértéséhez tegyük fel, hogy a vizsgálandó népesség minden egyedéneka neve fel van írva egy cédulára, ezek a cédulák egy dobozba vannak elhelyezve, és alaposkeverés után kihúzzuk az első mintába került személy nevét. Visszatevés nélküli mintavétel eseténezután újra keverünk, és utána kihúzzuk a második nevet. Visszatevéses mintavétel esetén azelső nevet tartalmazó cédulát visszatesszük, mielőtt újra kevernénk és húznánk. Ez azt jelenti,hogy visszatevéses mintavételnél, legalábbis elvileg, fennáll annak a lehetősége, hogy ugyanazta személyt kétszer válasszuk. Ezért közvélemény-kutatásnál sohasem alkalmaznak visszatevésesmintavételt. Értelmetlen lenne ugyanazt a személyt kétszer is megkérdezni. Visszatevéses ésvisszatevés nélküli mintavétel esetén a keletkező minták statisztikai viselkedése némileg eltér.Ez az eltérés annál kisebb, minél kisebb hányada a mintanagyság a populáció méretének. Haa populáció nagy a mintához képest, akkor ugyanazon személy kétszeri mintába kerülésének avalószínűsége kicsi, és ezért a visszatevéses és visszatevés nélküli mintavétel közötti különbség iskicsi. Egy olyan közvélemény-kutatásban, ahol egy többmilliós népességet egy néhány ezres mintaalapján vizsgálunk, a kétféle mintavétel közötti különbség elhanyagolható, ezért a továbbiakbanezzel nem is foglalkozunk.

A minta elemszámának a növelése ténylegesen csökkenti a népességbeli érték és a megfelelőmintabeli érték várható eltérését. Ebben az értelemben a nagyobb minta jobb. Mindaddig, amíg azelőző bekezdésben tett feltevés (hogy a mintanagyság kicsi a populáció nagyságához képest) igaz, aminta relatív nagysága (a mintaelemszám és a populáció nagyságának hányadosa) nem befolyásoljaa mintából nyerhető becslés jóságát, ez csak a minta elemszámától függ. A 3–7. táblázatok ezta függést illusztrálják. Különböző mintanagyságokra és különböző valós, a népességre jellemzőértékekre azt mutatják, hogy különféle bizonyossággal mekkora eltérést várhatunk a becsült értékekés a valódi értékek között.


19


20


21


22


23

Ezekben a táblázatokban az látható, hogy különböző valós (tehát az egész népességre vonatkozó)értékek esetén, 100, 500, 1000, 2000 és 3000 nagyságú minták esetén a mintából becsült értékvárhatóan mekkora lesz. A táblázatok megadják azt, hogy 99%-os, 95%-os, 90%-os és 75%-os bizonyossággal a becsült értékek milyen intervallumokban helyezkednek el. Ha például apopulációban az érték 20%, akkor egy 2000 nagyságú mintát használva, a mintából becsült érték95%-os valószínűséggel 18,2% és 21,8% között lesz. Ez azt jelenti, hogy ha egy közvélemény-kutató cég működése során ugyanabból a népességből többször választ azonos véletlen módszerrel2000 elemű mintát, akkor várhatóan húsz alkalom közül tizenkilencszer a becslése nem fog jobbaneltérni a valódi 20%-tól, mint 1,8%. A 2000 elemű mintákra vonatkozó táblázat azt is mutatja, hogya mintából becsült érték 99%-os valószínűséggel, azaz várhatóan 100 eset közül 99-szer, 17,7% és22,3% között lesz, ha a valódi érték 20%. Azonos mintanagyságon belül, az 50%-hoz közelebbiértékeket kissé kisebb pontossággal lehet eltalálni, mint az attól távolabb levőket.

A mintanagyság növelésével a becslés várható pontossága nő. Egy 3000 főt tartalmazó mintaesetén, akármi is a populációban érvényes arány, ezt húsz esetből tizenkilencben kevesebb, mint kétszázalékpontnyi hibával megtudhatjuk, sőt 99%-os biztonsággal a hiba kevesebb lesz, mint két ésfél százalékpont. (Bár a mindennapi beszédben ez nincs feltétlenül így, a százalék és százalékpont


24

kifejezések eltérő jelentésűek. Ha a valódi arány 50% és becslésünk hibája nem több mint 10százalék, akkor a becsült érték 45% és 55% között lesz. A 10 százalékpontnyi hiba pedig 40%és 60% közötti becslést jelent. A százalékpont tehát az egész bizonyos százalékát jelenti anélkül,hogy erre külön utalnánk, a százalék pedig egy másik, az adott szövegkörnyezetben definiálandómennyiség százalékát.)

A táblázatok alkalmasak arra is, hogy bennük nem szereplő értékekre vonjunk le következtetéseket.Például, ha a valódi érték 23%, a mintanagyság pedig 2000, akkor a megfelelő táblázatbólkiolvashatjuk, hogy 20%-os arány esetén a 95%-os biztonsághoz legfeljebb 1,8%-os hibatartozik, 30%-os arány esetén pedig ugyanehhez a megbízhatósághoz legfeljebb 2%-os hiba.Ezért 23%-os valódi arányhoz és 95%-os megbízhatósághoz a hiba nagyjából 1,9%-os lehet.Hasonló, úgynevezett interpoláció végezhető, ha itt nem bemutatott mintanagyság esetére akarunkhibahatárokat megállapítani.

A fenti táblázatokból kiolvasható pontosságok helyes értelmezéséhez azt is figyelembe kell venni,hogy a megadott határok között a tényleges becslések nem egyenletesen oszlanak meg, hanemkisebb hibájú becsléseket gyakrabban fogunk megfigyelni. Például egy 1000 fős minta esetén, haa valódi arány, amelyet szeretnénk a felmérésből megbecsülni, 40%, akkor az esetek 99%-ábana minta alapján becsült érték 36% és 44% között lesz. Ugyanakkor a minták 90%-ában a becsültérték 37,5% és 42,5% között lesz. Ebből az következik, hogy a 36% és 37,5%, illetve a 42,5%és 44% közötti becslések aránya csak 9%. Más szavakkal, a becslések 99%-a egy 8 százalékponthosszúságú intervallumban lesz (36% és 44% között), de ezek közül csak 9% lesz az intervallumkét szélén lévő összesen 3 százalékpont méretű tartományban (36% és 37,5% között, illetve 42,5%és 44% között), és 90% az intervallum középső, 5 százalékpont méretű részén (37,5% és 42,5%között) lesz. Sőt, még ez utóbbi intervallumon belül is a kisebb hibájú becslések jellemzőbbek,mint a nagy hibájúak, hiszen a becslések 75%-a 38,2% és 41,8% között lesz.

A táblázatok egy további felhasználása az, ha egy közvélemény-kutatásból rendelkezésünkre állegy becsült érték, és arra vagyunk kíváncsiak, hogy a népességre jellemző értékről mit mondhatunkennek alapján. Ebben az esetben megnézzük, hogy ha a becsült érték lenne a valódi érték, akkoradott biztonsággal, például 95%-os valószínűséggel, mekkora lenne a hiba. Ha a mintanagyság2000 és a becsült érték a minta alapján 20%, akkor jó közelítéssel azt mondhatjuk, hogy atáblázatból kiolvasható intervallum (18,2%– 21,8%) olyan eljárással keletkezett, amely az esetek95%-ában tartalmazza a valódi arányt. Ezt úgy fejezzük ki, hogy az ehhez az intervallumhoztartozó megbízhatósági szint 95%. A megbízhatósági szint és a valószínűség egymással rokon, dehatározottan eltérő fogalom. Értelmetlen lenne az állítás, hogy a 18,2%–21,8% intervallum 95%-osvalószínűséggel tartalmazza a valódi értéket. A valószínűség fogalmát csak véletlen jelenségekkelkapcsolatban használhatjuk. A valódi érték nem véletlen mennyiség, hanem rögzített, bár előttünkismeretlen. A szóban forgó intervallum szintén nem véletlen, miután a 20%-ot már megfigyeltük.Ennek megfigyelése előtt az intervallum előre pontosan nem meghatározható helyzetű, tehátvéletlen, hiszen csak annyit tudunk, hogy az intervallum végpontjai a mintából származó becslésértékénél 1,8 százalékponttal kisebb, illetve annyival nagyobb számok lesznek. A megfigyelésután azonban a véletlen jelleg elvész. Ezért az a helyes állítás, hogy a 18,2%–21,8%-ig terjedő


25

intervallum egy olyan eljárás eredménye, amely az esetek 95%-ában olyan intervallumot ad, amelytartalmazza a valódi értéket.

A közvélemény-kutatások eredményeinek publikálásakor a fenti táblázatokban közöltinformációkra általában az úgynevezett hibahatár megadásával utalnak. Ennek szokásos formájaaz, hogy a hibahatár például +/–3%. Néha azt közlik, hogy a hibahatár a vizsgált jellemző valódiértékétől függően legfeljebb három százalékpont. A megadott hibahatár jelentése az, hogy ha egybizonyos tulajdonság a vizsgált népesség felére volna jellemző, akkor ezt az adott mintanagyságmellett a vizsgálatok 95%-ában ekkora pontossággal meg tudnánk becsülni, tehát a becslésünk47% és 53% között lenne. Mint a táblázatokból láttuk, azonos valószínűségi szint mellett az50% eltalálásához kapcsolódó hiba a legnagyobb, és erre utal az a kitétel, hogy a hibahatárlegfeljebb az adott érték. Más valódi arányokhoz – azonos valószínűségi szinten – ennél kisebbhiba tartozik. Azt is látjuk a táblázatokból, hogy a rögzített valószínűséghez tartozó hibahatárcsak a mintanagyságtól függ. A 8. táblázat az ebben az értelemben vett maximális hibahatártadja meg különböző mintanagyságokra. Ne feledjük, ez csak annyit jelent, hogy az esetek 95%-ában várhatóan ennél nem nagyobb az eltérés a valódi és a becsült érték között. A hibahatársemmiképpen sem értelmezhető úgy, mint a hiba lehetséges legnagyobb értéke. A véletlenmintavétel következtében a hiba nagyságára vonatkozóan csak valószínűségi állításokat tehetünk(megjegyezzük, hogy nem véletlen mintavétel esetén még ilyeneket sem tehetünk), és a hibahatárkifejezésnek nem valószínűségi értelmezése az alapvető közvélemény-kutatási ismeretek hiányárólárulkodik.


26

Az ebben a táblázatban közölt hibahatárok a „hibahatárnál nem nagyobb a hiba az esetek 95%-ában” szabályon túlmenően még egyéb megbízhatósági állításokat is lehetővé tesznek. A hibahatárfelénél nem lesz nagyobb a hiba a minták 68%-ában, és a hibahatár másfélszeresénél nem lesznagyobb a hiba a minták 99,7%-ában.

A mintanagyság szerepének megítélésében a 68%, 95%, 99,7% szabály ismerete a legfontosabb,ezek a leglényegesebb mutatószámok arra nézve, hogy egy mintától milyen pontosságú becsléseketvárhatunk. Az összes lehetséges adott elemszámú mintának ekkora hányada ad rendre a valódiértéktől a hibahatár felénél, a hibahatárnál, illetve másfél hibahatárnál kevésbé eltérő becslést.Természetesen a legfeljebb 1 hibahatárnyit eltérő minták egyúttal másfél hibahatárnyinál is kisebbeltérésűek, és a legfeljebb 1 hibahatárnyi hibájú minták is szerepelnek a másfél hibahatárnál kisebbeltérésű minták között, így kapjuk az egyre növekvő hányadokat. A hibahatár a mintanagyságtólfügg, és amint azt a fenti táblázat mutatja, 2500 elemszámú mintáknál éppen két százalékpont; ennélkisebb létszámú mintáknál ennél nagyobb a hibahatár, ennél nagyobb elemszámú minták eseténpedig ennél kisebb. Ha tehát a mintanagyság legalább 2500, akkor a minták 95%-a, azaz húsz mintaközül várhatóan tizenkilenc a valóságos értéktől nem fog két százalékpontnál jobban eltérni. Ha amintanagyság 1000, akkor húsz mintából tizenkilenc várhatóan annyira jó, hogy a becsült érték ésa valódi érték eltérése nem több, mint 3,2% (ahol a % pontos jelentése százalékpont).


27

A fenti táblázatokban közölt értékek a becslés hibájának csak egyetlen komponensére vonatkoznak.Ez a komponens abból származik, hogy véletlen mintavételt alkalmaztunk. Ha a vizsgált populációmérete sokkal nagyobb, mint a mintanagyság, akkor a véletlen hiba nagyságát kiolvashatjuka táblázatokból. Az előrejelzések hibájának másik két összetevője abból származik, hogyegyrészt a mintaválasztás gyakorlati módja (lásd a következő fejezetet) eltér az itt feltételezettideálistól, másrészt pedig a megkérdezettek közül nem mindenkinek van határozott álláspontjaa vizsgált kérdésről, vagy nem is válaszol. Azt a pontatlanságot, amelyet e két tényezőokoz, nem lehet könnyen kvantifikálni, de nehéz elképzelni, hogy egy-két százaléknál kisebblenne. Ezért a közvélemény-kutatások mintáját nem érdemes túl nagyra választani, a 3000-nélnagyobb mintanagyság semmiképpen sem tűnik indokoltnak: a gyakorlati mintavételből és anemválaszolókból, valamint a bizonytalankodókból származó hibák ekkor már dominánssá válnak.Ha a vizsgálatra annyi pénz is rendelkezésre áll, hogy akár négy- vagy ötezer embert is meglehetne kérdezni, akkor jobb ennek a pénznek egy részét a válaszhiány csökkentésére és a valódivéleménnyel rendelkezőknek az elkülönítésére fordítani. Így még egy viszonylag kisebb mintánalapuló közvélemény-kutatás is megbízhatóbb lehet.

Abban az esetben, ha nem csak egyszerűen százalékos arányokat (például különböző pártokszavazóinak arányát) akarjuk megbecsülni a minta alapján, hanem más, összetettebb jellemzőketis, illetve ha bizonyos szempontok közötti összefüggésekre is kíváncsiak vagyunk, akkor a fentjavasoltnál nagyobb létszámú minták is szükségesek lehetnek, mert a hibahatár – a most tárgyalttényezőkön túlmenően – még attól is függ, hogy mit kívánunk becsülni. Ennek a kérdésnek arészletes tárgyalására később visszatérünk. Az ebben a fejezetben leírt szabályok egy egyszerűarány becslésére vonatkoznak.

ÖsszefoglalásEgyszerű véletlen mintavétel esetén már néhány ezres minta is nagy valószínűséggel egy-kétszázalékpontos pontossággal teszi lehetővé a népességen belüli arányok becslését. A más okbólszármazó hibák ennél feltehetőleg nagyobbak.

Ne költsük pénzünket öt- vagy tízezres mintanagyságú közvélemény-kutatásra, mert a becslésekpontatlansága sokkal nagyobb lesz, mint amit a mintanagyságra alapozó képletek alapján várnánk.

Ha a deklarált mintanagyságnak nem felel meg a közölt hibahatár, akkor valószínűleg sok aválaszhiány, ami erősen csökkenti az eredmények általánosíthatóságát.

28

4. Hogyan választják ki amegkérdezetteket? (Mintavétel)Az előző fejezetekben láttuk, hogy egy egy- vagy kétezer embert tartalmazó mintából a mintavételihiba szempontjából már igen jó becsléseket kaphatunk a vizsgált népesség jellemzőire nézve. Ezekaz eredmények azonban csak akkor igazak, ha a minta kiválasztása bizonyos alapelvek pontosbetartásával történt. Ezeknek a mintaválasztási elveknek nem megfelelő minták esetén nem csaka korábban bemutatott megbízhatósági eredmények nem igazak, de az is könnyen előfordulhat,hogy nincs mód a mintából származó becslések megbízhatóságának megítélésére. Ezért egyközvélemény-kutatás eredményeinek megfelelő értékeléséhez elengedhetetlen a mintaválasztásmódjának pontos ismerete.

A közvélemény-kutatásokhoz felhasznált minták általában egy kompromisszum eredményekéntjönnek létre, amelyben egyrészről az optimális mintaválasztás elmélete, másrészről pediggyakorlati szempontok játszanak szerepet. Hangsúlyozni kell, hogy ebben a fejezetben csak aközvélemény-kutatás céljaira kiválasztott mintáról lesz szó, és nem azokról a személyekről, akiketténylegesen megkérdeztek. Általában nem sikerül a mintába került minden személyt megkérdezni,és időnként olyanokat is megkérdeznek, akik eredetileg nem is voltak a mintában. Ezekről aproblémákról később lesz szó; most csak a kiválasztott mintával foglalkozunk.

Amint azt már korábban is többször érintettük, a közvélemény-kutatások túlnyomó többségevéletlen eljárással választott mintán alapul. A legtöbb kutató egyetért abban, hogy egyedül avéletlen kiválasztás pártatlansága adhat egyforma esélyt a társadalomban jelenlévő valamennyivéleménynek, hogy valódi súlyának megfelelő arányban szerepeljen a mintában. Természetesennem lehetetlen, hogy egy más eljárással választott minta is pontosan tükrözze a véleményekmegoszlását, azt azonban, hogy ez így van-e, vagy sem egy adott esetben, nem tudhatjuk. A véletlenmintáknál viszont, legalábbis átlagos értelemben, bizton számíthatunk a pontos becslésekre.További előnye a véletlen mintáknak, hogy a mintavételi hiba és az ebből származó pontatlanságnagysága kvantifikálható.

A véletlen mintavétellel kapcsolatban a véletlen fogalmát annak köznapi értelmétől némilegeltérően használjuk. Ha a közvélemény-kutatás készítői lemennek az irodájukhoz legközelebbiutcasarokra, és kikérdezik az arra járó embereket, az nem véletlen mintavétel, még akkor sem, hanem tudhatjuk előre, kik fognak arra járni, és emiatt a mintába kerülni, tehát bizonyos értelembena véletlenen múlik, kiket kérdezünk meg. Az sem véletlen mintavétel, ha a kérdezőbiztosoknakadott számú és bizonyos társadalmi csoportokba tarozó embereket kell kiválasztaniuk, de ezt akiválasztást saját maguk végzik, például úgy, hogy ismerőseik vagy a járókelők közül választjákki a „megfelelő” embereket. Ezekben az esetekben sem lehet tudni előre, hogy kik leszneka megkérdezettek, és bizonyos értelemben a véletlenen múlik, hogy ismerőseik közül kikkeltalálkoznak előbb a kérdezőbiztosok, vagy hogy ki jön szembe először az utcán.

4. Hogyan választják ki amegkérdezetteket? (Mintavétel)

29

Ezekben a mintavételi eljárásokban valóban vannak véletlen (azaz előre nem látható) elemek, de eznem az a fajta véletlen, amelyre a mintavételnél szükség van. Itt ugyanis a véletlen ellenőrizhetetlenés ezért hatásaiban kvantifikálhatatlan módon játszik szerepet. Igazi véletlen mintavételnél avéletlen egy jól definiált eljárás alkalmazásán keresztül fejti ki hatását. A véletlen mintavételmegvalósításához tehát nem elegendő, hogy a minta kiválasztói nem kívánják egyik társadalmicsoportot sem előnyben részesíteni a mintába kerüléskor. Véletlen mintavételről akkor beszélünk,ha a minta készítői egy megfelelő eljárás alkalmazásával biztosítják, hogy egyik társadalmi csoporttagjai se kapjanak a többieknél nagyobb esélyt a mintába kerülésre. Az az eljárás tehát, hogy bárkiis jöjjön az utcasarkon, beválasztjuk a mintába (azaz a diszkrimináció szándékának hiánya) nemvalósít meg véletlen mintavételt. Véletlen mintavételhez az kell, hogy még ha valaki nem is jár arraegyáltalán, akkor is ugyanakkora esélye legyen a mintába kerülésre, mint az éppen arra járóknak.

A véletlen szerepe a véletlen mintavételnél nem annyira a bizonytalanság becsempészése, mintannak biztosítása, hogy mindenkinek ugyanakkora esélye legyen a mintába kerülésre. Emiatt a(kontrollált) véletlen mintavételi eljárásokkal keletkező minták átlagos tulajdonságai az egyedibizonytalanság ellenére nagy biztonsággal megjósolhatók.

A fenti általános mintavételi követelményeknek úgy felelhet meg a mintaválasztás módja alegegyszerűbben, ha például egy ezer elemű mintát úgy választanak ki, hogy a vizsgált népességvalamennyi ezer főt tartalmazó csoportjának egyforma esélyt adnak arra, hogy éppen ez a csoportlegyen a vizsgálat mintája. Ez az eljárás biztosítja azt, hogy minden, a vizsgált népességbe tartozószemélynek ugyanakkora legyen az esélye a mintába kerülésre. Az ilyen mintavételi eljárástegyszerű véletlen mintaválasztásnak, egy ilyen eljárással keletkezett mintát egyszerű véletlenmintának neveznek. Ezeknek az egyszerű véletlen mintáknak a tulajdonságait tárgyalta az előzőfejezet.

Eddig az elmélet, de annak a kutatónak, aki közvélemény-kutatását egy egyszerű véletlen mintáraszeretné alapozni, bizonyos nehézségekkel kell szembenéznie. A populáció jellegétől függően ezeka nehézségek akár rendkívül komolyak is lehetnek. Először is egy egyszerű véletlen mintavételvégrehajtásához szükség van egy listára, amely a vizsgálandó népességbe tartozó minden személytfelsorol, méghozzá olyan információval együtt, amely lehetővé teszi a személy felkeresését abbanaz esetben, ha a mintába kerül. Ha egy iskola legnépszerűbb tanárát akarjuk közvélemény-kutatással kiválasztani, akkor bátran támaszkodhatunk arra a – minden bizonnyal létező – listára,amely az iskola összes tanulóját (tehát a vizsgált népességet) tartalmazza. Ráadásul ez a listaazt is megmondja, hogy az egyes tanulók melyik osztályba járnak, így ha akarjuk, könnyenmegtaláljuk őket. Ebben az esetben egy egyszerű véletlen minta előállítása rutinszerű számítógépesfeladat. Hasonló, bár kissé bonyolultabb feladat, ha a telefon-előfizetők képezik a vizsgálatmintáját. Ilyenkor használhatjuk az elektronikus telefonkönyvek adatait. Legfeljebb azon kellelgondolkodnunk, hogy a legutóbbi telefonkönyv készítése óta eltelt idő alatt mennyire változottmeg a telefon-előfizetők összessége: Hány új telefont kapcsoltak be és hány embernek nincsmár telefonja, akinek akkor még volt? Hány telefonszám változott meg? Ez utóbbi természetesennem befolyásolja a telefon-előfizetők összességét, de ne feledjük, a listának valamilyen elérésilehetőséget is biztosítania kell. A telefon-előfizetőket egyszerű lenne telefonon megkérdezni, de


30

az érvénytelen telefonszámok a minta egy részénél ezt lehetetlenné tehetik. További nehézség,amelyre gondolnunk kell, hogy vannak titkos, tehát a listán nem szereplő telefonszámok.Nehéz lenne általános érvénnyel megmondani, hogy az új telefontulajdonosok vagy a titkostelefonszámmal rendelkezők különböznek-e a többi telefontulajdonostól, és ha igen, hogyan. Akutatás tárgyától függő mértékű, de nehezen kvantifikálható nagyságú torzításhoz vezet tehát, haaz aktuális telefonkönyvben felsoroltakat azonosnak tekintjük az aktuális telefontulajdonosokkal.További, talán még az eddigieknél is súlyosabb probléma, hogy a földi (rögzített) és mobiltelefonoknagyon eltérőek abból a szempontból, hogy a földi telefonok általában egy háztartáshoz,míg a mobiltelefonok általában egy személyhez tartoznak, ugyanakkor az előbbiek esetébena háztartás más tagjai is „telefonnal rendelkezők”, csak éppen nem (feltétlenül) szerepelneka telefonkönyvben. Ráadásul, a telefonok egy része közületekhez tartozik, és ezek szinténszerepelnek a telefonkönyvben.

Az előbb tárgyalt kérdéseket, nevezetesen, hogy a rendelkezésre álló lista naprakész-e, illetve, hogyteljes-e, mindig fel kell tenni, mielőtt a népesség egy listája alapján mintát választanánk. Így van ezakkor is, ha az ország egész lakosságából szeretnénk mintát választani a lakcímnyilvántartás adataialapján, vagy ha a választásra jogosultakból a választói névjegyzék alapján.

Még rosszabb a helyzet akkor, ha nem is számíthatunk olyan listára, amely tartalmazná a vizsgálnikívánt népesség teljes felsorolását. Sok esetben ilyen listák nem léteznek (például a fővárosihajléktalanok esetében), vagy pedig adatvédelmi okokból nem állnak a közvélemény-kutatáskészítőinek rendelkezésére (például egy bizonyos betegség miatt kezelés alatt állók listája).

Azokban az esetekben, amikor a teljes népességet tartalmazó megfelelő pontosságú lista nemáll rendelkezésre, az egyszerű véletlen mintavételnél bonyolultabb mintavételi eljárásokat kellalkalmazni.

Az egyszerű véletlen mintavételt néha olyan esetekben sem alkalmazzák, amikor az ehhezszükséges információk rendelkezésre állnak. Ha egy kétezer elemű mintára van szükségünkaz ország lakóiból, akkor ez a minta nagy valószínűséggel több száz településről tartalmaznaembereket. A kérdezőbiztosoknak ezekre a településekre el kellene utazniuk, ha a keresett személytnem találják otthon, akkor vagy ott kell maradniuk, vagy később visszatérniük. Mindez jelentősennövelné a kutatás költségeit és időigényét. Ha a kutatás készítői ragaszkodnak viszonylag kislétszámú, de jól képzett kérdező alkalmazásához – ami a tapasztalatok szerint jobb minőségűadatokhoz vezet, mint több és emiatt kevésbé képzett kérdező közreműködése –, akkor a kutatás asok utazás miatt időben is elhúzódik, és eközben a megkérdezettek véleménye megváltozhat. Ezérta területileg túlzottan szétszórt minták nem kedvezőek, és gyakran az ilyenekre vezető egyszerűvéletlen mintavételi eljárások helyett más módszereket alkalmaznak.

Az egyszerű véletlen mintavétel helyett más módszerek alkalmazása annyiban elfogadható,amennyiben ezek biztosítani tudják, hogy mindenkinek egyforma esélye legyen a mintábakerülésre (vagy legalábbis ha különböző társadalmi csoportok mintába kerülési valószínűségeeltérő, akkor ezek a valószínűségek meghatározhatók legyenek, hogy a megfelelő korrekciót ellehessen végezni). Szerencsére ilyen alternatív eljárások léteznek, és sok szempontból az egyszerű


31

véletlen mintáknál kedvezőbb tulajdonságú mintákhoz vezetnek. Ezeknek az eljárásoknak közösjellemzője, hogy a véletlen mintát nem közvetlenül az egész populációból választják, hanemközbülső lépésekkel lecsökkentik a népességet, és a mintát ebből a lecsökkentett populációbólveszik.

Az egyik szokásos eljárás szerint először meghatározzák, hogy például ötven településrőlkerüljenek a mintába emberek. Ennek eldöntésében az játszik szerepet, hogy az ötven településa később részletezendő szempontok szerint megfelelő mintához vezethet, de a szám a kérdezéslebonyolíthatósága szempontjából még nem túl nagy. Önmagában az a tény, hogy a mintáteleve csak ötven településről választják, még nem jelenti a véletlen mintavétel fő szabályának– nevezetesen, hogy mindenkinek egyforma esélye legyen a mintába kerülésre – a megsértését.Csak arra van szükség, hogy az ötven települést véletlenszerűen válasszák ki az ország összestelepülése közül, és az ötven településen az emberek kiválasztásában megfelelő véletlen módonjárjanak el. Ezt a mintavételi eljárást kétlépcsős mintavételnek nevezik. Az első lépcsőben az országösszes településéből választják ki a mintába kerülőket, a második lépcsőben pedig a mintába kerülttelepülésekről a mintába kerülő embereket. Ha például az első lépcsőben az ország valamennyitelepülésének egyforma esélyt adnak a mintába kerülésre, akkor az egyes településekről a mintábakerülők számát a települések lélekszámával arányosan kell megállapítani, és így összességében azország valamennyi lakójának egyforma esélye van a mintába kerülésre.

A fenti kétlépcsős mintavételi eljárás joggal kritizálható abból a szempontból, hogy a véletlenenmúlik, hogy mely települések kerülnek a mintába. Ez egy olyan követelmény, amely kívánatosa mintába kerülő személyekre nézve. De vajon kívánatos-e ugyanez a tulajdonság a mintábakerülő településekre is? Az egyforma bekerülési esély azért kívánatos az emberekre nézve,mert minden ember véleménye egyforma súllyal szerepel az egész népesség véleményében. Azemberek egyforma súlyát a populációban egyforma bekerülési eséllyel ültetjük át a mintába.Az ország települései azonban nem egyforma súllyal szerepelnek a népesség véleményénekmeghatározásában. Az egész népesség átlagos véleményének meghatározásában egy nagyobblélekszámú település „fontosabb”, mint egy kisebb lélekszámú. (Valóban, a fenti eljárás ezt úgyérvényesítette, hogy egy nagyobb településről – ha az bekerült a mintába – több személyt választottki, mint egy kisebb településről. Most azonban a kérdést úgy tesszük fel, hogy megengedhető-e,hogy a véletlenen múljon az, hogy vannak-e a mintában például budapestiek.) Továbbá még az isfeltehető, hogy nagy településen elő emberek véleménye esetleg más lehet, mint kis településenélőké. Ezért nemcsak indokolatlan lenne minden településnek egyforma esélyt adni a mintábakerülésre, hanem még az is fontos, hogy mindenféle nagyságú települések legyenek a mintában.

Ezeket az elveket egy úgynevezett kétlépcsős rétegzett mintavételi eljárással valósítják meg.Az első lépcsőben továbbra is a településeket választják ki, a másodikban pedig ezekről atelepülésekről a megkérdezetteket. A mintavétel első lépcsőjében az ország településeit nagyságukalapján csoportokba osztják. Általában három–tíz csoportot szoktak használni, amelyek közülBudapest egyedül alkot egy csoportot. Általában figyelembe veszik azt a tényt is, hogy az országkeleti és nyugati felében élő emberek részben történeti, részben pedig gazdasági okokból eltérőkörnyezetben élnek és ennek megfelelően két azonos országrészben élő ember nagyobb eséllyel


32

lehet azonos véleményen, mint két ember, akik különböző országrészekben élnek,ha egyébkéntmás szempontokból azonos párokat hasonlítunk is össze. Az országon belül az egyes régiók közöttikülönbségekről és hasonlóságokról természetesen ennél sokkal részletesebb információk állnakrendelkezésre, és ezek alapján az országot öt–tíz régióra szokás osztani.

A településnagyság és a régiók szempontjait együttesen alkalmazva az ország településeitrétegekbe sorolják. Egy rétegen belül a település nagysága és az országon belül elfoglalthelyzet szempontjából hasonló települések vannak, különböző rétegekben pedig különbözőek. Egyrétegzést például úgy kaphatunk, hogy a következő nagyság-kategóriákat használjuk: 1000 fő alatt,1000–5000 fő, 5000–10000 fő, 10000–50000 fő, 50000–150000 fő, 150000 fő felett. Régiókéntkülön kezelhetjük a Dunántúlnak, a Duna-Tisza közének és a Tiszántúlnak északi, középső ésdéli területeit, és így kilenc régiót kapunk. A településnagyság és a régió kombinálásával 6×9=54réteget kapunk. Budapestet célszerű külön rétegként kezelni. Az így kapott 55 rétegből néhány üreslesz, például nincs 150000 lakosnál nagyobb lélekszámú település a Duna-Tisza köze déli részén.

Ezek a rétegek a vizsgálandó populációban léteznek, és külön részpopulációknak tekinthetőek.Ha belőlük külön véletlen mintákat veszünk, azok együttese az egész népességből származóvéletlen mintának tekinthető. Minden rétegben kétlépcsős mintavételt hajtanak végre úgy,hogy a rétegenkénti mintanagyságot az illető réteg populáción belüli nagyságával (azaz az ottélő emberek számával) arányosan állapítják meg. Ennek a kétlépcsős mintavételnek az elsőlépcsőjében minden rétegből véletlenszerűen néhány települést választanak. A nagyobb lélekszámútelepüléseket tartalmazó rétegekből általában 1 települést, a kisebb lélekszámú településekettartalmazó rétegekből 3–5-öt. Így általában mintegy hetven–száz települést határoznak meg. Azezek lakosaiból választott minták együttesen adják a kétlépcsős rétegzett mintavétel eredményét.

A legtöbb országos közvélemény-kutatás a fent leírt elveket alkalmazza. Bizonyos közvélemény-kutató cégek a rétegek kialakításában, illetve az egyes rétegekből a települések kiválasztásábanfigyelembe veszik, hogy hol rendelkeznek megbízható kérdezőkkel. Ez a minta véletlen jellegétrontja, és így a mintavételi hibát növelheti, ugyanakkor a nem mintavételi hibát és a költségeketcsökkentheti.

Általában kényelmi mintáknak szokás az olyan mintákat nevezni, amelyek kiválasztásánál a főszempont a felmérés egyszerű végrehajthatósága. Természetesen egy minta bizonyos településekpreferálása miatt, ha egyébként véletlen minta, még nem válik kényelmi mintává. Ez utóbbiaklegszélsőségesebb példáit azok a vizsgálatok adják, amelyek mintája a kutató kollégáibólvagy egyetemi hallgatóiból áll. Ilyen mintákat közvélemény-kutatásokban nem használnak, deelőfordulnak például pszichológiai vizsgálatokban.

Visszatérve a kétlépcsős rétegzett mintavételhez, a kiválasztott települések nevét és atelepülésenként megkérdezendő emberek számát tartalmazó listát mintakeretnek nevezik (bára mintakeret kifejezésnek létezik másik szokásos jelentése is). A mintakeret kitöltése amegkérdezendő emberek tényleges kiválasztása. Mint láttuk, a mintakeret elkészítésénél bizonyosnem véletlen lépések is történtek, például a rétegek definíciója nem véletlenítésen alapult,hanem a kutató ismeretein és döntésein. Ez azonban a minta véletlen voltát nem befolyásolja,


33

ha a mintakeret kitöltése, tehát a megkérdezendő személyek meghatározása véletlen módontörténik. A mintaválasztás utolsó lépésében (a jelen esetben a második lépcsőben) a véletlenítéselengedhetetlen követelmény.

A mintakeret kitöltésére két eljárást szoktak alkalmazni. Mindkettőnek vannak előnyei és hátrányai,egyik sem jobb a másiknál, ezért mindkettő használata elfogadható. Az egyik eljárás az,hogy a közvélemény-kutató cég a mintakeretben meghatározott településekről a mintakeretbenmeghatározott számú személy címét megvásárolja egy nyilvántartásból. Ezen a ponton néhatovábbi rétegző szempontokat is figyelembe szoktak venni (természetesen csak olyan rétegzőszempont lehetséges, amely a nyilvántartásban szerepel), például a közvélemény-kutató cégmeghatározhatja ezen személyek között a férfiak és nők arányát úgy, hogy az pontosan tükrözzea nemeknek a népességen belüli arányát. Ez az eljárás éppen annyira jó mintát eredményez, mintamilyen pontosan tartalmazza a felhasznált nyilvántartás a népességet és a lakcímeket (a véletlenkiválasztás végrehajtása lényegében hibamentesnek tekinthető). Amint azt korábban tárgyaltuk,egy ilyen lista sohasem lehet teljesen pontos, valamekkora mértékű elmaradás a valóságtól mindigvan, és mindig van a populációnak egy olyan része, amelyik nem szerepel a listán.

A mintakeret kitöltésének másik módja további két lépcsőt alkalmaz. Először lakásokat választanakki a településeken (mindenhol annyit, ahány embert meg kívánnak kérdezni), utána pediglakásonként egy-egy embert. A lakások kiválasztása a településnek egy véletlenszerűen kiválasztottpontjáról indított sétával történik, amelynek során a kérdező előre (véletlenszerűen) meghatározottirányban sétál, míg el nem jut egy lakásba. Itt ismét egy előre meghatározott utasítást követvedönti el, hogy kit kell megkérdeznie. Minden lakásban csak egy embert kérdez meg. Ezt az embertegy előre kidolgozott utasítás alapján választja ki. Ez a szabályrendszer úgy van kidolgozva, hogyminden demográfiai csoportnak hasonló esélye legyen a megkérdezésre, tehát például az a tény,hogy az egyszemélyes háztartások nagyobb részében egy nő lakik, ne eredményezzen túl sokmegkérdezett nőt és túl kevés megkérdezett férfit. Természetesen ez a demográfiai korrekció nemlehet teljes, például a nagyobb családban élőknek kisebb esélye lesz a mintába kerülésre, minta kisebb családban élőknek. Ezen túlmenően ennek az eljárásnak a jósága azon múlik, hogy abolyongási utasítás mennyire pontosan követhető, és hogy az adott településen az utasítás valóbaneléri-e célját, nevezetesen hogy minden lakást egyforma eséllyel kereshessen fel a kérdező.

Látjuk tehát, hogy mindkét eljárás lakásokkal, illetve címekkel dolgozik, akinek ilyen nincs,annak esélye sincs a mintába kerülésre. Ezért és az egyes módszereknél külön tárgyalt problémákmiatt ezek az eljárások csak közelítik az egyszerű véletlen mintavétel eredményét. Ennekkövetkeztében az egyszerű véletlen minták megbízhatóságáról (a várható hiba nagyságáról) azelőző fejezetekben közölt eredmények csak fenntartásokkal alkalmazhatóak. Mivel a most leírtmintavételi eljárásoknak az egyszerű véletlen mintavételtől való eltérésének nagyságára nézvenem áll rendelkezésre információ, nem lehet megmondani, hogy a közvélemény-kutató cégek általhasznált minták hibája várhatóan mekkora. Az esetek többségében feltehető, hogy a ténylegesmintavételi hiba nagyobb, mint ami egyszerű véletlen mintavétel esetén lenne, ezért az előzőfejezetek eredményei általában csak a hiba alsó korlátjának tekinthetők.


34

Ugyanakkor a személyek kiválasztásában a rétegzés alkalmazása – szerencsés esetben –csökkentheti a várható hiba nagyságát. Például a nemek szerinti rétegzésnél meghatározzuk,hogy a mintába hány nőt és hány férfit kívánunk beválasztani a populáció ismert nemek szerintiösszetétele alapján. Ha tudjuk, hogy a populációban 52% nő és 48% férfi van, akkor egy 1000fős mintát választhatunk úgy, hogy választunk egy 520 elemű mintát a nők közül, egy 480 eleműmintát a férfiak közül, és ezeket együtt tekintjük egy mintának. Az eljárásnak előnye, hogy aminta pontosan tükrözi majd a populáció nemek szerinti összetételét és ebben az értelemben– amellett, hogy véletlen minta – a kvótás minták előnyeit is nyújtja. Ne feledjük azonban,hogy erre csak akkor van lehetőség, ha a populáció nemek szerinti összetételét ismerjük, tehátegy bizonyos információt beépítünk a mintába. Nyilván egy ilyen minta nem is alkalmas arra,hogy felhasználásával megbecsüljük a populáció nemek szerinti összetételét. Hogyan befolyásoljaa rétegzés más ismérvek becsléseinek jóságát? Általában azt mondhatjuk, hogy ha a jellemzőkapcsolatban van a megkérdezett nemével, akkor a rétegzés a becslést javítja. Például, ha a nőkjövedelme általában kisebb a férfiakénál, akkor a nemek szerinti rétegzés a jövedelem becslésétjavítja. Ha a vizsgált szempont nincs kapcsolatban a megkérdezett nemével, akkor a nem szerintirétegzés nem javítja ennek becslését. Ugyanakkor nehéz lenne olyan attitűdöt vagy véleménytmegnevezni, amellyel kapcsolatban biztosan lehetne állítani, hogy nem függ össze a megkérdezettnemével, tehát ez a rétegzés általában javasolható, de nem mindig megvalósítható. Ilyen esetekbenutólagos súlyozást alkalmaznak (lásd később). Mit is jelent pontosan a rétegzési szempont és avizsgált jellemző kapcsolata, amely szükséges ahhoz, hogy a rétegzés javítsa a becslést? Általábanúgy fogalmazhatunk, hogy akkor beszélünk kapcsolatról, ha a rétegzőszempont kategóriáin belül avizsgált változó értékei kevésbé térnek el egymástól, mint az egész populációban. Más szavakkal,a vizsgált jellemző szempontjából a rétegeknek viszonylag homogéneknek kell lenniük.

A rétegzés lehetséges hasznának illusztrálására térjünk vissza az 1. Táblázatban bemutatott kisország adataihoz. Mivel a populációban a férfiak és nők száma azonos, a nemek szerinti kételeműminták egy férfit és egy nőt tartalmaznak. Olyan minta, amely két nőből vagy két férfiból áll,nem fordulhat elő. Azaz a 2. Táblázatban bemutatott összes lehetséges minta közül csak az elsőoszlopban szereplő, nemek szerint reprezentatív minták fordulhatnak elő rétegzéskor. Összesen 25ilyen minta van, amelyek közül 17 a pártpreferencia szerint is reprezentatív, azaz a pártpreferenciáravonatkozóan pontos becslést ad, és 8 olyan van, amely a pártpreferenciára vonatkozóan pontatlanbecslést ad. Azaz a rétegzett minták közül 17/25=68% ad pontos becslést a pártpreferenciára. Azösszes minta közül (amint az a 2. Táblázatból látható) 25 ad pontos becslést a pártpreferenciára,azaz az ilyen minták aránya 25/45=56%. A rétegzett mintavétel alkalmazásából származó nyereségtehát ebben az esetben az, hogy a szóba jövő minták 68%-ából várhatunk pontos becslést, szembenaz 56%-kal, ami egyszerű véletlen mintavétel esetén mutatja a pontos becslést adó minták arányát.

A fenti példa esetében a becslés bizonytalansága, várható hibája, kisebb rétegzett mintavétel esetén,mint egyszerű véletlen mintavétel esetén.


35

ÖsszefoglalásA közvélemény-kutatás megbízhatóságát alapvetően befolyásolja a mintaválasztás módja; ennekismerete nélkül az eredmények nem értelmezhetőek.

Az elméletileg legkedvezőbb helyzet az egyszerű véletlen mintavétel, de ez a gyakorlatban sokszormegvalósíthatatlan. Egyszerű véletlen mintavétel esetén az előző fejezetekben leírt kedvezőmegbízhatóságra és kis hibára számíthatunk.

A gyakorlatban legtöbbször használt lépcsős és rétegzett mintavételi eljárások, ha a mintakeretetegyszerű véletlen mintával töltik ki, nem feltétlenül rosszabbak az egyszerű véletlen mintáknál.Ezen eljárások pontos minősítéséhez a rétegzési szempontokat és az első lépcsőben kiválasztotttelepülések számát kell ismerni.

A mintakeretek kitöltése általában nem valósítható meg egyszerű véletlen mintával. Az ehhez közelálló, címlistán alapuló mintavétel megbízhatósága a felhasznált címlista pontosságán és teljességénmúlik.

A bolyongásos mintavétel egy kis demográfiai torzítást eredményez, de jól képzett kérdezőkkeljobb mintát eredményezhet, mint amilyet egy rossz minőségű címlista alapján lehet választani.

A mintavétel során alkalmazott rétegzés általában javítja a mintából származó becsléseket.

36

5. Hogyan befolyásolja a kérdezés módja azeredményeket? (Adatgyűjtés)A közvélemény-kutatás adatgyűjtésének a következő fontos követelményeknek kell megfelelnie:mindenkit kérdezzenek meg, aki a mintába került; csak a mintába került embereket kérdezzékmeg; a kérdezés módja minél kevésbé torzítsa a válaszokat; az adatgyűjtést rövid idő alattvégezzék el. Ezeknek a feltételeknek a minél pontosabb teljesítése alapvető fontosságú azeredmények megbízhatósága és érvényessége szempontjából. Természetesen a gyakorlatban ezeka követelmények nem teljesülhetnek teljes mértékben, és egyesek teljesülésének ellenőrzésekönnyebb, mint másoké. Ezek közül a követelmények közül egyesek esetében kvantifikálható,hogy milyen mértékben teljesülnek, míg másoknál nem.

Ha nem kerül sor a teljes minta lekérdezésére, az egyrészt a mintanagyságot csökkenti,másrészt pedig kérdésessé teszi, hogy a ténylegesen megkérdezettek mennyire tekinthetők avizsgálandó népességből származó véletlen mintának. Ehhez szorosan kapcsolódó probléma,hogy a megkérdezettek egy része különböző okoknál fogva nem válaszol minden kérdésre. Ezutóbbi problémával a következő fejezetben fogunk foglalkozni, most csak az abból származónehézségeket vizsgáljuk, hogy egyesektől egyáltalán nem sikerült adatot gyűjteni. Az adatgyűjtéskonkrét módjától függően ennek számos oka lehet, például az illetőt nem találták otthon, vagyotthon volt, de nem akart vagy nem tudott egyetlen kérdésre sem válaszolni.

Gyakran előfordul, hogy a mintavételi terv például 1000 ember megkérdezését írta elő, deténylegesen ezek közül csak 800-at sikerült lekérdezni. Annak megítélésére, hogy ez súlyosprobléma-e, azt kell meggondolni, vajon a ténylegesen megkérdezett 800 ember tekinthető-e egy800 elemű minta tagjaiként, akiket ugyanabból a populációból választottak. Ha ez így van, akkor aveszteségünk csupán annyi, hogy a mintanagyság kisebb, tehát a várható hibahatár kissé nagyobblett, de a becslések továbbra is torzítatlanok (azaz átlagosan pontosak). Ha ez így lenne, akkortapasztalatból ismerve a meg nem kérdezhetők szokásos arányát, egy közvélemény-kutató cégválaszthatna egy nagyobb, mondjuk 1250 főt tartalmazó mintát. Ha ezeknek is húsz százaléka nemválaszol, akkor éppen egy 1000 fős mintát kérdeznek le, megegyezően az eredeti tervvel.

Abban az esetben tekinthetnénk a ténylegesen válaszoló 800 embert egy véletlen mintának abból apopulációból, amelyből az eredeti, 1000 fős mintát választották, ha egy véletlen eljárás válogatnáki az 1000 emberből azt a 200-at, aki nem válaszol. Itt a véletlen eljárás azt jelenti, hogy mind az1000 embernek egyforma valószínűsége van a 200 nemválaszoló közé kerülésre, és az emberekrőlegymástól függetlenül határozódik el, hogy a válaszolók vagy a nemválaszolók közé kerülnek.Ugyanezt úgy is megfogalmazhatnánk, hogy az 1000 fős minta minden 200 fős részhalmazánakegyforma esélye van arra, hogy éppen ők legyenek a nemválaszolók. Azaz, ha a 200 nemválaszolóaz 1000 fős mintából vett véletlen minta lenne. Ekkor a 800 válaszoló az eredeti populációból vettvéletlen mintának lenne tekinthető.

5. Hogyan befolyásoljaa kérdezés módja az

eredményeket? (Adatgyűjtés)

37

Reális-e az előző bekezdésben szereplő feltevés? Gondolhatjuk-e, hogy bármely embernekegyforma esélye van arra, hogy ha már belekerült a mintába, akkor a nemválaszolók közé kerüljön?Nem kell-e inkább azt gondolnunk, hogy egy személyes megkérdezésnél a fiatalabb, gyermektelen,magasabb jövedelmű emberek nagyobb valószínűséggel nem találhatóak otthon, mint például azidősebb, kisebb jövedelműek? Egy levélben történő megkérdezésnél nem kell-e azt gondolnunk,hogy azok az emberek, akik nehezen tudják magukat írásban kifejezni, nagyobb eséllyel kerülneka nemválaszolók közé? Általában tehát azt kell gondolnunk, hogy a válaszolók nem képeznekugyanolyan jó mintát a populációból, mint az eredetileg kiválasztott minta, ezért egy közvélemény-kutatás minőségének megítélésében nagyon fontos szempont az, hogy a nemválaszolás arányátmiként igyekeznek csökkenteni, és ez az igyekezet mennyire eredményes.

A fenti példákból világos, hogy a mintába kerülő személyek megkeresésének módja nagybanbefolyásolja a nemválaszolók arányát. A megkeresési mód hatásának megértéséhez külön kellválasztanunk azokat, akiket nem találnak meg, bár a mintában vannak, és azokat, akiketmegtalálnak, de nem hajlandóak részt venni a közvélemény-kutatásban. A megtalálási aránynövelésére, ha a megkérdezés személyes, a kérdezőbiztosok többször visszatérnek a kérdezettlakására, ha korábbi alkalmakkor nem találták otthon. Telefonos megkérdezésnél is többszörismétlik a telefonhívást, ha ez szükséges. Levélben történő megkérdezés esetén, ha a mintábanlévő cím helyes, a kérdezett nagy valószínűséggel megkapja a levelet. Ebből a szempontból teháta levélben történő kérdezés a legbiztonságosabb. Azonban nem mindig áll rendelkezésre egycímlista alapján választott minta, továbbá más szempontokból (például a mintába került személyekválaszolási hajlandóságának növelése vagy annak biztosítása, hogy a válaszok ténylegesen éskizárólag a mintába került személyektől származzanak) ez a megkérdezési mód kevésbé előnyös. Amegtalált, de nem válaszoló emberek aránya a levélben történő megkérdezés esetén a legnagyobb.Ugyanakkor bizonyos speciális témákban elképzelhető, hogy érvényesebb adatot lehet gyűjtenilevélben, mint személyesen.

A megtalált, de nem válaszoló emberek aránya általában személyes megkérdezés esetén alegkisebb. Gyakran a megkérdezettek együttműködési készségének javítására a személyesfelkeresés előtt tájékoztató levelet küldenek nekik.

A nemválaszolók arányának csökkentése szempontjából tehát a három leggyakoribb adatgyűjtésimódszer között nagy különbségek vannak, de nincs olyan, amely minden szempontból és mindenesetben jobb lenne a másik kettőnél.

A jó munkát végző közvélemény-kutató cégek nagy erőfeszítéseket tesznek a nemválaszolókarányának csökkentésére. Nincsen olyan eljárás, amely ezt a problémát teljes mértékbenmegoldaná. Leginkább azok az aprólékos munkát igénylő, de csak részleges sikert ígérőeljárások hasznosak, amelyekre már korábban utaltunk: a minta gondos kiválasztása, a mintábakerült személyek ismételt felkeresése, alternatív kapcsolat-felvételi módok alkalmazása (példáultelefonhívás vagy levélküldés abban az esetben, ha a mintába került személyt nem találják,esetleges előzetes értesítés a személyes megkérdezésről). A megkérdezendő személyek válaszolásihajlandóságát a kérdezés ideje, a kérdezőbiztosok megjelenési és beszédmódja, az a bevezető



38

szöveg, amellyel bemutatják a vizsgálatot és válaszokat kérnek a kérdéseikre, éppen úgybefolyásolják, mint a kérdezést végző intézményről kialakult kép. Ezeket a tényezőket aközvélemény-kutató intézetek befolyásolhatják. Nem befolyásolható annak hatása, hogy egyestémákban a megkérdezettek nagyobb válaszolási hajlandóságot mutatnak, mint más témákban.

A nemválaszolók számának csökkentése érdekében gyakran használnak két olyan eljárást,amelyeknek helyessége erősen kérdéses. Az egyik elterjedt módszer az – amint erre márkorábban utaltunk –, hogy a kutatás tervezett mintanagyságánál eleve nagyobb mintát választanakés megkísérlik ezt a nagyobb mintát lekérdezni. Természetesen lesznek nemválaszolók, és aténylegesen válaszolók eredményeit úgy közlik, mintha eredetileg csak ők alkották volna avizsgálat mintáját. Ez az eljárás előre megbecsülhető nemválaszolási arány esetén biztosítja akívánatos mintanagyságot, de ha ezt a nemválaszolás tényének elkendőzésére használják, akkorfélrevezető. Ha vannak nemválaszolók, akkor a válaszolók nem tekinthetőek az egész populációbólvett véletlen mintának, csak a populáció azon részéből vett mintának, amely válaszolna, ha amintába kerülne. Mivel a nemválaszolók általában különböznek a válaszolóktól, a teljes populációés a válaszolni hajlandó emberek populációja is különbözőek. A ténylegesen válaszoló emberektőlnem várhatjuk, hogy valamennyi ember véleményét képviseljék.

A másik gyakran használt – és megkérdőjelezhető – eljárás, az úgynevezett pótcímek alkalmazása.Az elérhetetlenség vagy az együttműködési szándék hiánya miatt nem válaszolók helyett másokatkérdeznek meg. Ezeket az embereket bizonyos esetekben egy pótlólagos mintából veszik ki.Ha ezt a pótlólagos mintát ugyanúgy választják ki, mint az eredetit, akkor ez az eljárás nemkülönbözik attól, amely eleve nagyobb létszámú mintából indul ki. Kicsit jobbnak tűnik az amódszer, amikor egy nemválaszoló helyett egy hozzá demográfiai szempontból hasonló másikembert választanak. Ezt az eljárást illesztett pótcímek alkalmazásának nevezik. Természetesen errecsak akkor van lehetőség, ha a megfelelő információval már a minta készítésekor rendelkeznek.Ha igaz lenne, hogy a felhasznált demográfiai adatok meghatározzák a véleményt, akkor ezaz eljárás helyes lenne. Ez azonban nyilván nem igaz, a válaszolók és a nemválaszolók közöttmindenképpen fel kell tételeznünk különbségeket. Az eljárás tehát minden jó szándéka ellenéremég rosszabb eredményre vezethet, mint az előző, mert elkendőzi a válaszolók és nemválaszolókközötti demográfiai különbségeket, amelyeket esetleg egy gondos elemzésben a nemválaszoláshatásának vagy okainak felderítésére használhatnánk.

Ha például a kutatók azt tapasztalják, hogy bár a mintába azonos arányban választottak férfiakatés nőket, a válaszolók között a nők nagy többségben vannak, akkor ennek az eltérésnek az okaimegvizsgálhatók és az esetleg ebből esetleg származó torzulás korrigálható. Az első kérdés ilyenesetben az, hogy vajon a ténylegesen megtaláltak között is nagy többségben vannak-e a nők.Ha igen, akkor a mintába került személyek felkeresési módja okozza a torzítást, és az eddigalkalmazottaktól eltérő módokon kell megpróbálni a mintába került személyek megkeresését. Haazt tapasztalják, hogy a mintába került férfiakat és nőket nagyjából egyforma arányban találtákmeg, de a megtalált férfiak közül sokkal többen nem voltak hajlandók részt venni a felmérésben,mint a megtalált nők közül, akkor a probléma lehet a kérdezőbiztosok megválasztásában éskiképzésében vagy pedig a vizsgálat témájában. Előfordulhat, hogy a vizsgálat témája kevésbé



39

érdekes a férfiaknak, de az is, hogy a téma kényesebbnek számít a férfiak számára, mint a nőknek.Amennyiben ez a helyzet, akkor ezt a vizsgálat eredményei között közölni kell. A férfiak ésnők eltérő megtalálási aránya és válaszolási hajlandósága kvantifikálható, és további elemzésekis végezhetők ennek alapján. Egy gondosan végrehajtott, illesztett pótcímes eljárás során ezek azeredmények nem vesznek el, de ha az illesztett pótcímeket megfelelő kontroll nélkül alkalmazzák,akkor ezek a minden bizonnyal fontos információk nem jelennek meg az eredmények között.

Nincs biztosíték arra, hogy a válaszolók és a nemválaszolók ellenőrizhető demográfiaiszempontokból különbözzenek, de ha ez így van, és a nemválaszolási arány jelentős, akkor amintánk demográfiai szempontból torzabb lesz, mint amekkora eltérést a populációra jellemzőarányoktól betudhatnánk a mintavételi hibának, és így becsléseket tehetünk a nemválaszolókjellemzőire.

A pótcímek használatához látszólag hasonló eljárás az, ha a kérdezőbiztosok az otthon nem találtszemély helyett egy másikat kérdeznek meg, de ez a másik személy nincs előre kiválasztva.Különösen csábító lehet ez azokban az esetekben, amikor a minta nem személyek nevét és címéttartalmazó lista, hanem például véletlen séta (bolyongás) eredményeként jön létre. Ha a kérdezőkmaguk lecserélik a mintába került személyeket, az súlyosan károsítja a minta véletlen jellegét, ésnagy valószínűséggel torzításhoz vezet. Ez az eljárás sokkal rosszabb, mint a pótcímek használata,mert nemcsak hogy a nem megtalálható vagy válaszolni nem hajlandó emberek közé tartozószemélyt helyettesít egy válaszolni hajlandó személlyel, hanem még ráadásul a válaszolni hajlandószemélyek közül sem véletlenszerűen választ.

A mintának egy részét a közvélemény-kutatás készítőinek minden erőfeszítése ellenére sem lehetlekérdezni. A tapasztalható nemválaszolási arány településtípusonként és társadalmi csoportonkéntkülönböző. Budapesten például 40%–50% közötti nemválaszolási arányt is lehet tapasztalni (ezaz arány nem tér el lényegesen a más európai nagyvárosokban tapasztalt értéktől.) Ez az aránycsökkenthető, de nem tehető nullává. A közvélemény-kutatások eredményeinek közlésekor anemválaszolásból származó mintaveszteség mértékét közölni kell, mert e nélkül nem tudható,hogy a ténylegesen lekérdezett emberek a populációnak mekkora részéből származó mintánaktekinthetők. Ennek fontosságát érzékeltethetjük, ha feltesszük, hogy az eredetileg a mintába kerültemberek 25%-át nem sikerült lekérdezni, vagy azért, mert nem találták meg, vagy azért, mertnem volt hajlandó válaszolni. A példa kedvéért feltesszük, hogy azok, akiket sikerült lekérdezni,valamennyien válaszoltak a vizsgálat szempontjából érdekes kérdésre, tehát például arra, hogymelyik pártra szándékoznak szavazni. Ez a feltevés természetesen a gyakorlatban nem igaz, de arészlegesen nem válaszolók aránya általában kisebb az egyáltalán nem válaszolókénál, továbbá,mivel ezekről az emberekről a többi válaszuk alapján valamilyen ismeretekkel rendelkezünk, arészleges válaszhiányok némileg másképpen értékelendők, mint a teljes válaszhiány. A részlegesválaszhiány problémájáról a következő fejezetben lesz szó.

Visszatérve a példához, a minta 75%-át sikerült lekérdezni, 25%-át nem. Tegyük fel, hogy amintanagyság 1000 fő volt, és a válaszoló 750 közül 150 mondja, hogy egy bizonyos pártrafog szavazni. Becsülhetjük-e a párt szavazóinak arányát úgy, hogy 150/750=20%? Amint azt



40

már korábban láttuk, a válaszoló 750 fő nem tekinthető a népességből vett véletlen mintának.A valóságot azzal a feltevéssel közelíthetjük a legjobban, hogy a népesség két részből áll, azegyikből a mintába kerülők válaszolnak a kérdésekre, a másikból a mintába kerülők nem. Alegszerencsésebb esetben a 750 fő véletlen minta a válaszolni hajlandókból, a fennmaradó 250fő pedig véletlen minta a válaszolni nem hajlandókból. A 20% tehát jó becslés a válaszolnihajlandók szavazási szándékaira, de hogy az egész népesség szavazási szándékát megbecsüljük,figyelembe kell venni azok szavazási szándékait is, akik a nemválaszolók csoportjába tartoznak.Ez utóbbira nézve nem szolgáltat információt a közvélemény-kutatás. Mielőtt ennek hatásátszámszerűsítenénk, megjegyezzük, hogy ezzel az egész problémával nem kell foglalkozni, haa nemválaszolók éppen egybeesnek a nemszavazókkal, mert akkor a válaszolók a szavazók, ésúgyis a szavazás eredményét akarjuk előre jelezni. Szociológiai okokból a nemválaszolók ésnemszavazók népessége között erős átfedés van, de ennek a két csoportnak az azonossága nemtételezhető fel. Talán gondolhatjuk, hogy a válaszolás elől elzárkózók között többen vannak apolitika iránt nem érdeklődő, és esetleg nem szavazó emberek, de azt nem tételezhetjük fel, hogyazok között, akiket nem sikerült megtalálni, nagyobb arányban lennének nemszavazók, mint a teljesnépességben.

Ha a közvélemény-kutatás eredményeként a vizsgált párt szavazóira 20% adódott, akkor mi leheta teljes népességben a párt szavazóinak az aránya? A válaszolók populációjában a valódi szavazásiszándék eltérhet a 20%-tól, és a nemválaszolók populációjában ez a szavazási arány egészen másérték lehet. Ennek a két tényezőnek a hatása vagy csökkenti vagy növeli egymást. Ha például aválaszolók népességében 18% szavazna a vizsgált pártra, a nemválaszolók népességében 24%,akkor az egész populációban a párt szavazóinak aránya 0,75×18%+0,25×24%=19,5%, tehát abecslés nem túl rossz, pontosabban a becslés közelebb van a valódi szavazási arányhoz, mint aválaszolók szavazási arányához. Ha viszont a válaszolásra nem hajlandóknak 15%-a szavazna avizsgált pártra, akkor a valódi teljes szavazási arány 0,75×18%+0,25×15%=17,25%, tehát a becslésrosszabb az egész népességre nézve, mint amilyen a válaszolni hajlandók népességére nézve lenne.Minél nagyobb a szavazati arányok különbsége a válaszolni hajlandók és nem hajlandók között,annál nagyobb lesz annak a jelentősége, hogy nem sikerült mindenkit lekérdezni.

A 9–12. táblázatok azt mutatják, hogy a minta nem teljes lekérdezése milyen mértékbenrontja a mintából származó becslés teljesítményét. Korábban láttuk, hogy véletlen mintákesetén a mintából származó becsült érték nagy valószínűséggel nem tér el túlzottan a valódiértéktől. Ennek illusztrálására, a mintanagyságról szóló fejezetben úgynevezett megbízhatóságiintervallumokat mutattunk be. Ezeknek legegyszerűbb formája azt állította, hogy a valódi érték68%-os biztonsággal nem tér el jobban a mintából becsült értéktől, mint a hibahatár értékének fele;95%-os biztonsággal mondhatjuk, hogy az eltérés nem nagyobb, mint a hibahatár; és 99,7%-osbiztonsággal mondhatjuk, hogy az eltérés a valódi és becsült érték között nem több, mint a hibahatármásfélszerese. A hibahatár a mintanagyságtól és a becsülni kívánt valódi aránytól egyaránt függőmennyiség, és különböző mintanagyságokhoz tartozó lehetséges maximális értékeit táblázatbanmutattuk be. Ha nem sikerült a teljes mintát lekérdezni, akkor a hibahatár és a megbízhatóság közötta kapcsolat egész más jellegű, és ezt mutatjuk be az alábbi táblázatokban.



41

Ha arra való tekintet nélkül használjuk a megbízhatósági állításokat, hogy nem sikerült ateljes mintát lekérdezni, akkor az adott eltéréshez tartozó megbízhatósági szint más lesz, mintgondolnánk. A tényleges megbízhatósági szint a valójában megkérdezettek arányától és amegkérdezettek és meg nem kérdezettek véleményének eltérésének a nagyságától is függ. A 9–12.táblázatok azt mutatják, hogy mekkora biztonsággal lesz a valódi és a becsült érték közötti eltéréskisebb, mint az adott mintanagysághoz tartozó maximális hibahatár (a teljes minta lekérdezésekorérvényes legalább 95% helyett). Az adott mintanagysághoz tartozó maximális hibahatár használatátaz indokolja, hogy a valóságban általában sem a válaszolni hajlandók populációjában érvényesvalódi értéket, sem pedig a tényleges lekérdezési arányt nem ismerjük. A 9–12. táblázatok azzala feltevéssel adják meg a megbízhatósági szinteket, hogy a populációnak abban a részében,amely a lekérdezhető személyeket tartalmazza (azokat, akik közül a mintába kerülők ténylegesenválaszolnak is a kérdésekre), a vizsgált arány valódi értéke 50%. Ha a vizsgált arány valódi értékea lekérdezhető személyek között eltér ettől az értéktől, akkor a lefedési megbízhatóságok az ittmegadott értékeknél nagyobbak.



42



43

A 9–12. táblázatokat a következőképpen lehet használni: Ha tudjuk például, hogy a mintanagyság2000 fő volt, de ennek csak 80%-át sikerült lekérdezni, és ennek alapján a becsült érték, mondjukegy párt szavazóinak arányára nézve 22%, akkor a 19,8%–24,2% tartomány a valódi, az egészpopulációra jellemző értéket attól függő biztonsággal tartalmazza, hogy a populációnak abban arészében, amelybe a le nem kérdezhető emberek tartoznak, mekkora lenne a párt szavazóinakaránya. Ha ez az arány megegyezik a populáció lekérdezhető részében érvényes aránnyal, akkor amegbízhatóság 92%. Ha azonban az arány 10%-kal eltér, tehát a rá vonatkozó becslésünk 12% vagy32% lenne azok között, akiket nem sikerült megkérdezni, ha mégis meg tudtuk volna kérdezni őket,akkor a megbízhatóság csak 56%. Ez azt jelenti, hogy a valóban elvégzett felméréshez hasonlóanvégrehajtott felmérések csak mintegy az esetek felében produkálnának olyan intervallumokat (abecsült érték plusz–mínusz egy hibahatár szabály alkalmazásával, ahol a hibahatár értékét a 2000főt tartalmazó eredeti mintanagyság alapján határoztuk meg), amelyek ténylegesen tartalmaznáka valódi értéket.

Figyelemreméltó, hogy a fenti szempontból a nagyobb létszámú minták rosszabbak, mint a kisebbelemszámúak. Ennek az az oka, hogy ugyanakkora, például 10%-os eltérés relatíve nagyobbnakszámít a nagyobb mintához tartozó kisebb hibahatárhoz, mint egy kisebb mintához tartozó nagyobbhibahatárhoz képest. A fentiek ismét csak azt sugallják, hogy a mintanagyság túlzott növelésehelyett a közvélemény-kutatásra rendelkezésre álló erőforrásoknak egy jelentős részét a mintaminél teljesebb lekérdezésére kell fordítani.

A későbbiekben szó lesz a minta súlyozásáról, amely kis véletlen hibák korrigálására szolgálóeljárás. Itt csak annyit bocsátunk előre, hogy a nemválaszolás problémájának kezelésére ez a



44

módszer érdemben nem használható, még akkor sem, ha egyes közvélemény-kutatók meg ispróbálják ezt.

A kérdezés módszereinek és a kérdőív szerkezetének, amint arra már korábban utaltunk, akapott válaszok validitása (azaz érvényessége) szempontjából is nagy jelentőségük van. Akérdéseknek világosaknak, mindenki által érthetőknek kell lenniük, ugyanakkor mentesnek atúlzott egyszerűsítésektől. Bár ezek a követelmények kézenfekvőnek tűnhetnek, megvalósításukbizonyos nehézségekbe ütközhet. Könnyen lehet, hogy egy kérdés, amely érthető és világosaz egyik megkérdezettnek, elfogadhatatlanul egyszerűsítő megfogalmazásokat tartalmaz egymásiknak. Hasonlóan lehetséges, hogy egy kérdés, amely reális alternatívák közötti választástkér az utóbbi válaszolótól, értelmetlenül bonyolultnak tűnik az előbbi számára. Nyilvánvalókövetelmény, hogy a kérdések megfogalmazása, sorrendje, a kérdezők viselkedése ne sugalljonválaszokat. Ezeknek a követelményeknek a megvalósításához csak aprólékos munkávalkerülhetnek közel a közvélemény-kutatás készítői. A közvélemény-kutatás olvasói – szerencsésesetben – megismerhetik a kérdőív kérdéseit, de a kérdezői munka minősége utólag nehezenellenőrizhető.

ÖsszefoglalásA mintába került valamennyi embernek, de csak a mintába került embereknek a lekérdezésea közvélemény-kutatás eredményeinek megbízhatósága és érvényessége szempontjábólugyanannyira fontos, mint a mintaválasztás helyes módja.

A mintacsökkénésből származó hibákat a pótcímek használata inkább elkendőzi, mint megoldja.

A mintába kerülés esetén lekérdezhető és nem lekérdezhető emberek csoportjainak véleményeieltérhetnek egymástól. Minél nagyobb ez az eltérés és minél nagyobb a nemválaszolók aránya,annál torzítottabb lesz az adatokból kapható becslés.

A szokásos megbízhatósági állítások jelentős számú nemválaszoló esetén érvényüket vesztik. Azeredmények megbízhatóságának, és ezen keresztül a kutatás minőségének egyik legfontosabbmutatószáma a nemválaszolók aránya az eredeti mintában.

45

6. Mi történik azokkal, akik nemválaszolnak? (Válasz- és véleményhiány)Ebben a fejezetben a válaszhiány kifejezést a korábbitól eltérő tartalommal fogjuk használni, ésazt értjük alatta, hogy valaki, akinek feltették a kérdőív kérdéseit (tehát lekérdezték), bizonyoskérdésekre nem válaszolt. Ez az adatok elemzésénél nehézségeket okoz. Hasonló, bár sokkalsúlyosabb problémákhoz vezet az, ha valaki ugyan válaszol a kérdésekre, de egyes válaszai nemtükrözik véleményét. Ennek egyik oka lehet, hogy az adott kérdésről nincs véleménye, és válaszavéletlenszerű, vagy pedig a kérdőív vagy a kérdező által sugallt választ adja. A másik ok azlehet, hogy a megkérdezett szándékosan el akarja titkolni véleményét. Ez utóbbi esetekben tehátformálisan van válasz, de a valódi véleményre nézve nincs információ az adott válaszban.

Ezek közül a problémák közül a válaszhiányok a legegyszerűbbek. A válaszhiányok jelentőségévelés az eredményekre gyakorolt hatásával kapcsolatban ugyanazt mondhatjuk, mint a mintának azzala hányadával kapcsolatban, amelyet egyáltalán nem sikerült megkérdezni. A válaszolók és nemválaszolók véleménye feltehetőleg eltér az adott kérdésben. Ennek az eltérésnek a nagyságától és anemválaszolók arányától függ az, hogy a válaszok alapján adott becslés mennyire torzított. Ennekmegítéléséhez az előző fejezetben szereplő táblázatok használhatók.

Azokról a megkérdezettekről, akik egy adott kérdésre nem válaszoltak, azon kérdések alapján,amelyekre választ adtak, a közvélemény-kutatás készítői rendelkeznek bizonyos információkkal.Ezeket az információkat fel lehet használni a hiányzó válaszok „pótlására”. Ez a valóságbantermészetesen csak annyit jelent, hogy a hiányzó válaszról feltesszük, hogy ugyanaz, vagy hasonló,mint amit a nemválaszoló személyhez hasonló válaszolók adtak. A nemválaszoló személyhezhasonló személyeket azon kérdések alapján választják ki, amelyekre a nemválaszoló személyis válaszolt. Mindaddig, amíg a kutatás publikált eredményei százalékarányok vagy átlagok, azezekkel a módszerekkel kapható eredmények azonosak azokkal, amelyeket akkor kapnánk, ha azadatok közül elhagynánk a részlegesen válaszolókat és ezután az adatok úgynevezett súlyozásasegítségével próbálnánk korrigálni az adathiányt, ha a súlyozáshoz ugyanazokat a változókathasználnánk, amelyeket a hiányzó adatok pótlására. A gyakran alkalmazott súlyozási eljárástrészletesen tárgyaljuk a következő fejezetben. Ha az elemzés eredményei ennél összetettebbmutatószámok, akkor a hiányzó adatok helyettesítése (a szakmai zsargonban: imputálása) azzala negatív következménnyel jár, hogy a kiegészített adatállományban a válaszok egyformábbnaktűnnek, mint amilyenek a valóságban. Ennek röviden az az oka, hogy egyébként egyformaemberekről, ha az egyik válaszolt egy kérdésre, a másik pedig nem, lényegében azt tesszük felaz imputálás során, hogy a nemválaszoló is ugyanazt a választ adta volna, mint a válaszoló,ami nem feltétlenül igaz. A hiányzó megfigyelések pótlásának léteznek olyan, az itt vázoltnálösszetettebb módjai is, amelyek nem rendelkeznek ezzel a hiányossággal, de mindenképpen igaz,hogy a hiányzó információ nem pótolható érdemben. Az imputálással történő pótlás legfeljebb

6. Mi történik azokkal,akik nem válaszolnak?

(Válasz- és véleményhiány)

46

közelítést adhat, amelynek jóságához az szükséges, hogy a tényleges (nem teljesen megfigyelt)adatok bizonyos előnyös tulajdonsággal rendelkezzenek.

A valótlan válaszok kiszűrésére, legalábbis számuk csökkentésére, bizonyos kérdőív-szerkesztésieljárásokkal néha van lehetőség. Ennek legfőbb módszere az, hogy azokat a kérdéseket, amelyekkelkapcsolatban a legerősebb a valótlan válaszok gyanúja, kissé eltérő formában többször is felteszik,és megvizsgálják a válaszok konzisztenciáját.

A valótlan válasz adásának egyik fontos fajtája az, amikor a megkérdezett saját véleményekéntegy véletlenszerűen, vagy rosszabb esetben a kérdőív vagy a kérdező sugallatára választottalternatíváról számol be. Ennek esélye csökkenthető, ha a kérdőív, mielőtt a véleményre vonatkozókérdést feltenné, előbb megpróbálja azt megtudakolni, hogy a megkérdezettnek van-e véleménye akérdéssel kapcsolatban. Célszerű arra vonatkozó kérdéseket is feltenni, hogy a megkérdezett mirealapozza véleményét (ha azt állítja, hogy van véleménye), és azt is megtudakolni, hogy a kérdezettvéleményét kinyilvánította-e valamilyen formában, vagy tervezi-e ezt. Az ezekre a kérdésekreadott válaszok önmagukban nehezen értelmezhetők, de lehetőséget adnak a megkérdezettnekarra, hogy végiggondolja, véleménye vajon mennyire állandó, illetve megalapozott. Azoknak amegkérdezetteknek, akik először azt állították, hogy van véleményük, de az utóbbi két kérdéshatására elbizonytalanodtak saját véleményük komolyságát illetően, lehetőséget kell adni a„visszatáncolásra”, például annak megkérdezésével, hogy mit gondolnak, változhat-e véleményüka közeljövőben. Mindezeket a kérdéseket úgy kell megfogalmazni, hogy se a vélemény léte,se határozott volta, se hiánya ne tűnjék a megkérdezett számára valamilyen okból elkerülendőválasznak, mert ha ezt nem sikerül teljesíteni, akkor a válaszok torzítani fognak. Ilyen, bizonyosválaszok elkerülésére serkentő ok lehet a kérdőív szerkesztői által sugallt vélemény, a korábbiválaszokra alapozott, számon kérő jellegű ellenőrző kérdés vagy meggondolatlan kérdezői reakció(„de hát Ön az előbb azt mondta, hogy ...!?”), de még az is, ha egy bizonyos válasz nagy számútovábbi kérdésre vezet.

Sajnálatos módon a közvélemény-kutatások eredményeinek közlésekor általában nagyon kevesetlehet megtudni azokról a technikákról, amelyeket a nemválaszolás és a valótlan válaszokelkerülésére alkalmaztak a kérdőív szerkesztői. Ezen technikák alkalmazásának szükségességeugyanakkor azt is maga után vonja, hogy egy kérdőívbe nem lehet egy kérdést minden továbbinélkül beilleszteni, azaz egy fontos kérdéssel együtt bizonyos bevezető és ellenőrző kérdéseket isfel kell tenni az eredmények megbízhatósága és érvényessége érdekében.

Összességében számos ok vezet arra, hogy egy közvélemény-kutatás érdemi kérdésére (példáula szavazási szándékra vonatkozó kérdésre) csak lényegesen kevesebb embertől rendelkezünkválasszal, mint amennyien eredetileg a mintába kerültek. Ha például azt tesszük fel, hogy alemorzsolódás valamennyi lehetséges szinten 15%, akkor ez azt jelenti, hogy az eredeti mintának15%-át nem sikerült megtalálni, tehát egy 1000 fős mintából 850 fő maradt. Ha ezekből ismét15% nem hajlandó részt venni a vizsgálatban, akkor 723 embert sikerült lekérdezni. Ha ezek közülismét 15% nem árulja el pártpreferenciáját, akkor a lényeges információ 625 megkérdezett esetébenáll rendelkezésre. Ha mindhárom kiválasztás véletlenszerű lenne, akkor ez a 625 fő az egész



47

népességből származó véletlen minta lenne. Amint ezt az előző fejezetben részletesen tárgyaltuk, aza feltevés nem tartható, és általában azt kell feltennünk, hogy a végül is ismeretlen pártpreferenciájú375 ember véleménye erősen eltérhet az ismert véleményű 625 ember pártpreferenciájától. Enneka helyzetnek az elemzéséhez még azt is fel kell tételeznünk, hogy a 625 ember egy része, mondjukismét 15%, azt válaszolja a kérdésre, hogy még nem döntött arról, melyik pártot támogatja. Így531 embernek van valamilyen ismert pártpreferenciája, és ebből az 531-ből 30 mondja, hogy egyadott pártra szavazna.

Milyen következtetéseket vonhatunk le ezután a párt szavazatainak várható arányára nézve?Az adatok alapján azt mondhatjuk, hogy a valamilyen pártot választók körében 30/531=5,6%szavazna a vizsgált pártra. Ez a becslés azonban a szokásos mintavételi és nem mintavételi hibákontúlmenően két szempontból is kétséges. Egyrészt az eredetileg tervezett 1000 helyett csak 531ember pártpreferenciája ismert. Másrészt pedig igazából nem a teljes választásra jogosult népesség,hanem csak a szavazáson ténylegesen résztvevők szavazatainak eloszlását akarjuk megbecsülni,hiszen a szavazás eredménye csak a ténylegesen leadott szavazatokon múlik. Ezért azt a kérdéstis fel kell tenni, hogy a megkérdezett szándékozik-e szavazni, és egy jó kérdőív különbözőeszközökkel ellenőrizni igyekszik az erre a kérdésre adott válasz valóságtartalmát. Tegyük még fel,hogy ennek alapján a kutatók arra a következtetésre jutnak, hogy a válaszoló 625 emberből 500fog szavazni. Természetesen ez az 500 ember csak részben fedi le azt az 531-et, akiknek határozottpártpreferenciájuk volt, hiszen lehetnek emberek, akik azt állítják, hogy biztosan fognak szavazni,de még nem tudják, kire, és lehetnek olyan emberek is, akiknek határozott pártpreferenciájuk van,de nem fognak szavazni.

Mindezek eredményeként a 13. táblázatban látható kép tárul a kutatók elé:



48

Sokkal jobban áttekinthető a kép, ha megvizsgáljuk, hogy az a 723 ember, aki hajlandó voltrészt venni a vizsgálatban, hogyan oszlott meg a szavazási szándék és pártpreferencia kombináltkategóriái között. Ezt mutatja a 14. táblázat.



49

A 14. táblázatból a 13. táblázatban szereplő értékek megkaphatók, például az A párt 30 szavazója azA pártot választó és szavazni is szándékozó 25-ből, a szavazni nem szándékozó 3-ból és a szavazásiszándékát illetően bizonytalan 2-ből jön össze.

Milyen becslést lehet ezen adatok ismeretében adni az A párt várható szavazatarányára?Egy lehetséges becslés, amint azt korábban említettük, a 30/531=5,6%, ami a határozottpártpreferenciával rendelkező megkérdezettek között az A pártot választók aránya. Feltehető, hogya pillanatnyilag pártpreferenciát nem nyilvánító 94 ember közül is számosan fognak végül ispártot választani. Ezek közül szélső (és csak elméletileg lehetséges) esetben akár mindenki, vagysenki sem fogja az A pártot választani. Ezek a szélsőséges feltevések a (30+94)/723=17,2% ésa (30+0)/723=4,1% becslésekhez vezetnek. Ezen szélsőséges lehetőségek között az eltérés annálnagyobb, minél nagyobb a pártpreferenciát nem nyilvánítók száma. Természetesen teljességgelelképzelhetetlen, hogy ha az 531 válaszoló közül 30 választja az A pártot, akkor a 94 nem nyilatkozóközül mind azt választja. Az a lehetőség azonban nem tűnik teljesen kizárhatónak, hogy a 94 nemnyilatkozó közül végül egyik sem választja az A pártot. Ha például elképzelhetőnek tartjuk, hogya 94 nem nyilatkozó között az A pártot választók aránya négyszerese legyen az 531 nyilatkozóközött érvényes aránynak, azaz a 94 nem nyilatkozó 22,4%-a szavazzon az A pártra, akkor közülük21 fog az A pártra szavazni, és így a helyes becslés (30+21)/723=7,1%. Ekkor tehát a mintánkalapján adható becslés 4,1% és 7,1% között van. Hangsúlyozni kell, hogy most azzal a kérdésselfoglalkozunk, hogy ha mindenkinek lenne deklarált pártpreferenciája azok között, akik részt vetteka vizsgálatban, akkor mi lenne a mintából származó becslés. Azaz a minta alapján adható becsléstmennyire befolyásolhatja az, hogy nem mindenki válaszolt a pártpreferenciára vonatkozó kérdésre,illetve az, hogy a válaszolók egy része azt mondta, hogy nincs határozott pártpreferenciája.

Ha még azt is figyelembe vesszük, hogy a 723 megkérdezett ember mellett van még 277, akiketnem sikerült megkérdezni, mert vagy nem találtuk meg őket, vagy nem voltak hajlandók részt vennia felmérésben, akkor tovább kell tágítani azt a tartományt, amelyben az 1000 emberen alapulóbecslés, ha rendelkezésünkre állna, elhelyezkedne. Ha csak azzal a visszafogott feltételezésselélünk, hogy a 277 nem megkérdezett ember között az A pártot választók aránya az 5,4% fele éskétszerese között helyezkedhet el, akkor ezzel a 277 ember között az A pártot preferálók számát7 és 30 közé tesszük. Ebből az 1000 ember között az A pártot választók számára a következőkét szélsőséges becslés adható: A ténylegesen megkérdezettek között van legalább 30 ember éslegfeljebb 51 ember, tehát összesen legalább 37 és legfeljebb 81, aki az A pártot preferálja, azazaz A pártot az emberek 3,7% és 8,1% közötti hányada preferálja. A válasz- és véleményhiánybóleredő bizonytalanság (amely az 1000 ember teljes lekérdezése esetén kapható becslés értékérevonatkozik) összehasonlítható a mintavételi hiba jellemző értékével. Egy 1000 főt tartalmazóminta esetében a mintavételi hiba (amely az 1000 ember adatai alapján adható becslés és a teljespopulációra jellemző érték közötti eltérést jelenti) az esetek 95 %-ában nem lesz több, mint 3,2%.Azt mondhatjuk tehát, hogy a mintavételi hiba egy ekkora mintánál hasonló nagyságrendű, mintaz a hiba (pontatlanság), amelyet a válaszhiánynak tulajdoníthatunk. Nagyobb mintanagyságokesetén a mintavételi hiba kisebb lesz, de a nemválaszolásból eredő hiba nem csökken. Ezen nemváltoztat az, ha a becslést csak a 723, 625 vagy akár az 531 emberre vonatkozóan adjuk meg. Ekkorkissé nagyobb mintavételi hibára fogunk gondolni (mivel a mintanagyság kisebb, mint 1000), de



50

ennek hatása nem összemérhető a nemválaszolók miatt fellépő bizonytalanság mértékével, és nemoldja meg azt a problémát, hogy a becslést így egy nem véletlen mintára alapozzuk, és emiattnem várhatjuk, hogy legalább átlagosan pontos legyen. Hangsúlyozni kell, hogy a mintavételi hibanagysága egzakt matematikai eredmény, míg a válaszhiányból származó hiba nagyságára adottbecslés feltevéseken alapuló hipotetikus érték. Abban az esetben, ha a közvélemény-kutatók olyanbecslést tesznek közzé, amely az itt bemutatott feltevéseken vagy ehhez hasonlókon is alapul,akkor meg kell mondaniuk, hogy becslésük úgynevezett szakértői becslés. Egy ilyen becslés azadatokon kívül még egyéb ismereteken és feltevéseken is alapul, és jelentése egész más, mint egyolyan becslésé, amely kizárólag az adatokon és ezek statisztikai elemzésén alapul, és nem használfeltevéseket a hiányzó információk helyettesítésére. Ezt a fajta becslést statisztikai becslésneknevezzük. A szakértői és statisztikai becslések közül egyik sem jobb általában a másiknál, ezekegyszerűen teljesen különböző és nem összehasonlítható elemzési eredmények.

Figyelembe véve, hogy a választás eredményének előrejelzésére nem a teljes népességből kell az Apártot választók arányát megbecsülni, hanem azok közül, akik ténylegesen szavazni fognak, mégnehezebb feladattal találják magukat szemben a közvélemény-kutatás készítői. Nem csak azzalkapcsolatban bizonytalanok az ismereteik, hogy hányan szavaznának az A pártra, hanem még aztsem tudják biztosan, hogy hány ember közül, hiszen ekkor a hányados nevezőjébe a ténylegesenszavazók számát kellene tenniük. A fenti táblázatban azt látjuk, hogy a magát biztosan szavazónakminősítő 500 ember közül 25 preferálja az A pártot, ami 5%-os becslést eredményez a szavazatokra.Még ha eltekintünk is attól, hogy emberek, akik magukat jelenleg biztos szavazóknak vagy biztosnemszavazóknak minősítik, ténylegesen nem feltétlenül fognak ennek megfelelően részt vennivagy nem részt venni a szavazáson, és csak arra gondolunk, hogy a jelenleg bizonytalan 24 emberközül hány fog szavazni, továbbá arra, hogy a pillanatnyilag meg nem kérdezett 277 emberbőlhány fog szavazni, akkor az előző bekezdésben adott becslések hányadosait lényegesen meg kellváltoztatnunk.

Ráadásul további problémát jelent, hogy a mostani bizonytalanok vagy egyáltalán nem válaszolókközül azok fognak-e inkább szavazni, akik az A pártot preferálják, vagy inkább azok, akik máspártokat választanak. Erre nézve már különböző feltevéseket megfogalmazni sem egyszerű, nemis beszélve arról, hogy milyen nehéz lenne ezeket a feltevéseket ellenőrizni. Mindenesetre nemtűnik túlzásnak azt mondani, hogy ezeket a tényezőket figyelembe véve az 1000 ember alapjánténylegesen adható becslés 2% és 13% között lehet.

Mindez ismételten megerősíti azt a korábban már megfogalmazott tanulságot, hogy az adottközvélemény-kutatásra fordítható pénzt csak mértékkel érdemes a mintanagyság növelésérefordítani. Néhány ezres mintanagyság felett inkább a választott minta minél pontosabb és teljesebblekérdezésére kell az erőforrásokat fordítani.

ÖsszefoglalásA nem megtalálhatók, a megkérdezést visszautasítók, a véleményt nem nyilvánítók valóságosvéleménye jelentősen eltérhet azok véleményétől, akik végül is érdemi válaszokat adtak. Ezért a



51

válaszhiányok tényét és súlyát nem szabad elfedni a minta kiegészítésével vagy a nemválaszolástényének elhallgatásával.

A közvélemény-kutatás végrehajtásának minőségére vonatkozó legfontosabb számszerűsíthetőmutató az eredeti mintából ténylegesen válaszolók aránya. Ennek ismerete nélkül az eredményekmegbízhatóságára nézve még csak becsléseket sem lehet tenni.

Az estelegesen hiányzó válaszok csak szerencsés esetekben pótolhatók a tényleges válaszokalapján. Ezeknek a pótlásoknak a közvélemény-kutatás minőségére gyakorolt hatása hasonló azegyáltalán nem lekérdezettek számából és eltérő véleményéből származó torzításhoz.

Ha a hiányzó információk pótlására feltételezéseket alkalmaznak, a kapott eredményeket szakértőibecslésnek nevezik.

52

7. Egyformán fontos minden válasz?(Súlyozás)A korábbi fejezetekben láttuk, hogy a véletlen mintavételi eljárások átlagosan olyan mintákhozvezetnek, amelyek hűen reprezentálják azt a sokaságot, amelyikből a mintát választották, és ahiba nagyságára nézve valószínűségi jellegű állításokat tehetünk. Ezek azt mondják ki, hogy amintából kapható becslés hibája adott valószínűséggel egy hibahatár alatt marad. Természetesenminél kisebb hibahatárra gondolunk, annál kisebb valószínűséggel lesz a becslés ezen belül.Ebben a fejezetben azzal a kérdéssel foglalkozunk, hogy mit szokás tenni olyankor, amikor aközvélemény-kutatás készítői azt tapasztalják, hogy mintájuk valamely ellenőrizhető szempontbóleltér a populációra jellemző értékektől.

Ennek a helyzetnek az illusztrálására vizsgáljuk ismét azt a pici országot, amelyet már a 2.fejezetben is használtunk. Ebben az országban tíz választásra jogosult ember él, öt férfi és öt nő. Aválasztáson két párt indul, A és B, és mindenki választ pártot. A férfiak közül négyen szavaznak azA pártra, a nők közül egy. Az ország lakóinak nemek szerinti megoszlása ismert a kutatás készítőielőtt, a pártpreferenciák azonban nem. A valódi helyzetet a 15. táblázat tartalmazza.

Tegyük fel, hogy a közvélemény-kutatók a rendelkezésükre álló pénz és a becslés pontosságáravonatkozó igény alapján egy négy főt tartalmazó minta szavazási szándékait vizsgálják. A kutatóka véletlen eljárás eredményétől függően vagy olyan mintát kapnak, amely a nemek szerinti eloszlásszempontjából reprezentatív, vagy olyat, amelyik nem reprezentatív. Ha a minta a nemek szerintieloszlást pontosan tükrözi, azaz a mintában két nő és két férfi van, a kutatók örülhetnek, merta véletlen mintavétel ezen ismert szempontból reprezentatív mintát eredményezett. Ha a nemekszerinti eloszlás eltér a nemeknek a populációban ismert eloszlásától, akkor sem kell elkeseredni,mert attól, hogy a nemek szerinti arány szempontjából a minta nem reprezentatív, a valóbanérdekes szempont, a pártpreferencia szerint még lehet reprezentatív. Összesen 210 különböző mintalehetséges, amelyek a 16. táblázatban látható típusokba sorolhatók:

7. Egyformán fontosminden válasz? (Súlyozás)

53


54


55

Összesen tehát 210 különböző minta lehetséges, amelyek a 16. táblázatban felsorolt tizenhat típusvalamelyikébe tartoznak. A mintából kapott szavazati arányokat használhatjuk a populációbanérvényes szavazati arányok becsléseként. Például az első típusú mintából azt becsülnénk, hogy azA párt szavazóinak aránya 100%, a harmadik típusú minták akármelyikét megfigyelve pedig az A


56

párt szavazóinak arányát 75%-ra becsülnénk. Az ötödik típusú minták valamelyikét megfigyelveaz A párt szavazóinak arányát szintén 75%-ra becsülnénk. Ez utóbbi éppen egy olyan minta, amelynem tükrözi pontosan a nemek közötti arányokat, hiszen a kutatók tudják, hogy a populációbanugyanannyi nő van, mint férfi, a mintában pedig a megkérdezettek háromnegyede férfi. Ezt úgy ismondjuk, hogy a férfiak túl vagy felül vannak reprezentálva a mintában. Ennek megfelelően a nőkalulreprezentáltak. Ezen a ponton a gondos kutató valószínűleg megnézné a az A párt népszerűségétkülön a nők és külön a férfiak között. Az itt használt példa túl kis számokkal dolgozik ahhoz, hogyreális becslést lehessen adni az A párt népszerűségére nemenként, de egy valódi közvélemény-kutatásnál, ahol még az egyik csoport jelentős alulreprezentáltsága esetén is több száz megfigyeléslenne csoportonként, ez lehetséges. Ha a kutató azt tapasztalja, hogy a párt népszerűsége különbözőnemenként, akkor azt gondolhatja, hogy az egész minta talán nem ad pontos becslést az A pártnépszerűségére, ha a minta nem tükrözi helyesen a nemek arányát a népességben. A jelen példábana kutató azt tapasztalná, hogy a férfiak kétharmada, a nők közül pedig mindenki az A pártraszavazna (egy ötödik típusú mintában). Ha ezek a becslések pontosak, akkor az egész populációban,ahol az emberek 50%-a férfi, 50%-a nő, az A párt szavazóinak aránya 0,5×2/3+0,5×1=5/6 lenne.Ez utóbbi érték az A párt szavazóinak súlyozott becslése. Ebben a becslésben az ismert nagyságútársadalmi csoportok (férfiak és nők a példában) valódi súlyuknak megfelelően szerepelnek, azaza férfiaknak a mintában talált szavazási arányát (2/3) a férfiak valódi arányával (50%) vesszükfigyelembe, nem pedig a mintabeli arányukkal, és hasonlóképpen a nők esetében.

A fenti példában a súlyozás nem volt szerencsés. A súlyozatlan (nyers) becslés az A pártszavazóinak arányára 3/4, és ez közelebb van a valódi értékhez (1/2), mint a súlyozott becslés(5/6). Ezt persze a kutatók nem tudják megállapítani, hiszen ők nem ismerik az A párt szavazóinaktényleges arányát. Ha ez ismert lenne számukra, nem végeznének közvélemény-kutatást. Másesetekben a súlyozott becslés közelebb visz a helyes értékhez. Például a negyedik típusú mintamegfigyelése esetén a nyers becslés az A párt szavazóinak arányára 75%, a súlyozott becslés pedig0,5×1+0,5×0=0,5=50%, mert ebben a mintában minden férfi az A pártra szavaz és minden nő aB pártra.

Annak érdekében, hogy a súlyozás alkalmazásáról vagy elvetéséről döntsünk, nem azt kellmegnézni, hogy egyes esetekben az eljárás előnyös, vagy hátrányos, mert azt úgysem lehetneeldönteni, hogy az aktuális esetben éppen hasznos-e. Ehelyett annak megvizsgálására van szükség,hogy általában a súlyozott becslések jobbak, vagy rosszabbak-e, mint a súlyozatlan becslések.Intuitíve azt mondhatjuk, hogy ha a súlyozás szempontja szerint az eltérések lényegesek (példáula férfiak és nők szavazási szándékai erősen eltérnek), akkor a súlyozott becslések alkalmazásaelőnyösnek tűnik, ha azonban a vizsgált kérdés nem függ a súlyozásra használható változótól, akkora súlyozás nem szükséges.

A fenti példa esetében a 17. táblázat a 16 lehetséges minta- fajtára tartalmazza az A párt szavazóinakarányára vonatkozó súlyozatlan és súlyozott becsléseket.


57

A 210 lehetséges minta közül 118-ban a súlyozott és súlyozatlan becslés azonos eredményt ad, 32-ben a súlyozott becslés jobb és 60-ban rosszabb eredményt ad, mint a súlyozatlan becslés. Annakmegítéléséhez, hogy a súlyozott, vagy a súlyozatlan becslés a jobb, nem elegendő azt megnézni,hogy melyik hányszor jobb, hanem azt is figyelembe kell venni, hogy az eltérések mekkorák.


58

Valamennyi esetben, amikor a súlyozott becslés jobb, mint a súlyozatlan, a súlyozott becslés 1/4-del jobb, mint a súlyozatlan (1/2 a súlyozott becslés, 1/4-del, illetve 3/4-del szemben). Azonesetek közül, amikor a súlyozatlan becslés jobb, 12 alkalommal a nyereség 1/12 (az 5. és a 13.típusú mintáknál), és 48 alkalommal 1/6 (a 7. és a 10. típusú mintáknál). Ezeknek az úgynevezetthibaeloszlásoknak az összehasonlítására többféle eljárás kínálkozik. A leggyakrabban használt az,amelyikben az eltérések négyzeteinek összegét számítjuk ki és hasonlítjuk össze. Azért használjuka négyzeteket, hogy a nagyobb eltéréseket arányosan jobban büntessük, mint a kicsiket. Ha példáulkét eljárást szeretnénk összehasonlítani, amelyek közül az egyik csak egy hibát vét és annaknagysága 5, a másik pedig két hibát, és azoknak nagysága 2 és 3, akkor az első eljárás négyzeteshibája 5*5=25, a második eljárás négyzetes hibája pedig 2*2+3*3=13. Ezért a második eljárásttartjuk jobbnak, annak ellenére, hogy a hibák (nem négyzetes) összege azonos a két eljárásnál(5=2+3), sőt a második eljárás kétszer hibázik, míg az első csak egyszer.

Ahhoz, hogy ezt a módszert a súlyozott és súlyozatlan becslések összehasonlításáraalkalmazhassuk, meg kell határozni minden lehetséges minta esetében a kétféle becslési eljárásnégyzetes hibáját. Ennek részleteit mutatjuk be a 18. táblázatban. Ne feledjük, hogy a valódi érték,amelyet becsülni szeretnénk, 1/2, és ehhez képest számítjuk a négyzetes eltéréseket.


59

Az eljárások négyzetes hibájának összehasonlítására ezután a különböző mintatípusokra vonatkozónégyzetes hibákat a megfelelő minták számával súlyozva össze kell adni, és a kapott eredményeketösszehasonlítani. A számítást egyszerűsíthetjük, ha azokban az esetekben nem adjuk össze ahibákat, amelyekben a két eljárás hibája azonos, hiszen ezek a tagok nem befolyásolják azt, hogy


60

melyik eljárás négyzetes hibája nagyobb és melyiké kisebb. Csak a különböző tagokat összegezve(és egyszerűsítve) a súlyozatlan becslésekre a 11/4, a súlyozott becslésekre a 8/3 értéket kapjuk. Azelőbbi érték kettő egész és háromnegyed, az utóbbi kettő egész és kétharmad, tehát kisebb. Emiatta súlyozott becslések négyzetes hibája kisebb, mint a súlyozatlanoké.

Az eltérés kicsinek tűnik, de valódi becslési feladatokban az itteninél nagyobb lehet, ráadásula súlyozott becslésekből származó előny nagyságát a mintavételi hibahatárhoz kell viszonyítani– amely érték szintén kicsi. Az eltérés mértéke azon múlik, hogy milyen jellegű a kapcsolata súlyozásra használt változó és a megbecsülni kívánt szempont között. Mielőtt ennek azösszefüggésnek a részleteit megvizsgálnánk, bemutatjuk a súlyozáson alapuló becslés egy másikértelmezését.

A súlyozott becslés azt a hibát korrigálja, amely abból keletkezik, hogy bizonyos társadalmicsoportok nem a populációbeli arányaiknak megfelelően kerültek a mintába, azaz a minta ezekszempontjából nem reprezentatív. Ha például a 10. típusú mintát figyeljük meg, akkor ebben 1 férfités 3 nőt találunk, holott tudjuk, hogy a populációban ugyanannyi nő van, mint férfi. A mintánkbanezért két nőt és két férfit várunk. Ahhoz, hogy ezt megközelítsük, az egyetlen megfigyelt férfitvalamilyen módon kettőnek kellene tekintenünk, és a három megfigyelt nőt valamilyen módonszintén kettőnek kellene tekinteni. Ezt úgy érhetjük el, hogy minden megfigyeléshez egy súlytrendelünk úgy, hogy a férfiak súlyainak és a nők súlyainak összege is kettő legyen. A férfiakonbelül és a nőkön belül természetesen nem kívánjuk az arányokat megváltoztatni. Ezért az egyetlenmegfigyelt férfi súlya 2 lesz, és minden megfigyelt nő súlya 2/3. Így a férfiak összes súlya 2 és a nőkösszes súlya is 2. Az alulreprezentált csoport tagjainak súlya egynél nagyobb, a felülreprezentáltcsoport tagjainak súlya egynél kisebb. Súlyozás után ebben a mintában lesz az A pártnak egy 2 ésegy 2/3 súlyú szavazója, a B pártnak pedig két 2/3 súlyú szavazója. Ezért az A párt szavazóinakaránya (2+2/3)/4=2/3. Ez megegyezik az ebből a mintából kapható súlyozott becsléssel.

A súlyozott becsléseket tehát úgy is megkaphatjuk, hogy a megfigyelésekhez rendelünk súlyokat,és az így súlyozott mintából számítunk (súlyozatlan) becslést. Egy megfigyelés súlyát úgyhatározzuk meg, hogy elosztjuk az őt tartalmazó csoport populációbeli arányát a mintabeliarányával. Ez a hányados a megfigyelés súlya. A 19. táblázatban mind a 16 lehetséges mintatípusramegadjuk a minta súlyozott változatát. Minden cellába az ottani megfigyelések súlyának összegekerül.


61


62


63

Azok a minták, amelyek nem tartalmaznak nőt vagy nem tartalmaznak férfit, nem súlyozhatókabban az értelemben, hogy a nem megfigyelt csoport tagjainak akármekkora súlyt is adnánk,ezek összege nem lehetne kettő. (A valóságban természetesen nem találkozunk olyan mintákkal,amelyek ne tartalmaznának férfiakat és nőket is. A jelen esetben ez a jelenség a nagyon kicsimintanagyság következménye.) Azoknál a mintáknál, amelyeknél két nőt és két férfit figyeltünkmeg, azaz a minta a nemek szerinti megoszlás szempontjából reprezentatív, a súlyozás nem


64

változtat semmit, minden megfigyelés súlya továbbra is 1. A súlyozás a többi (súlyozható) mintátis reprezentatívvá tette a nemek szerint.

A gyakorlatban általában nem egyetlen szempont, hanem több szempont kombinációja szerintsúlyoznak. A súlyozáshoz használt szempontok kiválasztásában szerepet játszik az, hogy milyenváltozók lehetnek egyáltalán súlyozás alapjai, és az, hogy mely változókról gondoljuk, hogyaz ezeket felhasználó súlyozás jobb becslésekhez vezet. Súlyozáshoz azokat a változókat lehethasználni, amelyek megoszlása a vizsgálni kívánt népességben ismert. Ilyen változók a nem, aziskolai végzettség, a kor, a településtípus, ahol a megkérdezett lakik. Ezeknek a változóknak amegoszlása nem csak egyenként ismert, hanem együttesen is, azaz lehet tudni, hogy az országlakosságának mekkora hányada esik ezen változók kategóriáinak egy-egy kombinációjába.

A súlyozás akkor hasznos, ha a súlyozásra használt változó által definiált csoportokban a vizsgáltváltozó homogénebb, mint általában, és ilyenkor előfordulhat, hogy a becslések közelebb leszneka tényleges értékhez, mint amit a hibahatár alapján várnánk. Előző példánkhoz visszatérve, ha anők pártpreferenciái eltérnek a férfiak pártpreferenciáitól, akkor a nemek szerinti súlyozás jobbbecslésekre vezet. Ez volt a helyzet a példában. Ha a nők és a férfiak pártpreferenciái azonosak,azaz a pártpreferencia független a nemtől, akkor érdektelen, hogy a minta pontosan reprezentálja-e a nemek közötti arányokat. Mikor várhatjuk, hogy azok az emberek, akik valamilyenszempontból ugyanabba a csoportba tartoznak, a vizsgált változó (például pártpreferencia)szerint hasonlóbbnak mutatkozzanak egymáshoz, mint az egész népességbe tartozó összesember? Egy tetszőleges változó kategóriái által definiált csoportok annál homogénebbek (azazsaját magukon belül hasonlóak) a vizsgált változó szerint, minél jobban eltérnek egymástól avizsgált változó szerint azok az emberek, akik különböző csoportokba tartoznak. Tehát példáula nem által definiált csoportok (nők és férfiak) annál homogénebbek szavazási szándékaikszerint, minél jobban eltérnek a nők és a férfiak szavazási szándékai egymástól. Ez az állításmatematikailag is megfogalmazható és bizonyítható, természetesen a homogenitás és eltérésmegfelelő definíciója mellett. Súlyozás alapjául olyan változókat érdemes választani, amelyeknéla különböző kategóriáiba tartozás feltehetőleg különbségeket fog okozni a vizsgálandó változóeloszlásában. Az előző bekezdésben felsorolt demográfiai változók éppen ilyenek, és ezért ezekkombinációját szokás használni súlyozásra, bár nyilvánvaló, hogy ezek hatása különböző érdemikérdések esetén más és más lehet.

A gyakorlatban a súlyozást úgy valósítják meg, hogy a fenti négy szempont (nem, iskolaivégzettség, kor, településtípus) szerinti keresztosztályozást elkészítik a mintában is és apopulációban is. Ez utóbbi táblázat a KSH adataiból származik. Ezt a két táblázatot hasonlítjákössze a súlyok megállapítására, éppen úgy, ahogy mi hasonlítottuk össze a nemek megfigyeltarányát a mintában a nemeknek a populációban ismert arányával. Minden megfigyelésnek,aki az előbbi táblázatban azonos helyzetű (azaz négy változó szerint ugyanabban a kategória-kombinációban van), ugyanaz lesz a súlya, éppúgy, ahogy példánkban minden férfinakugyanakkora a súlya, és minden nőnek ugyanakkora a súlya. Ez a súly egyenlő a megfelelőkombinált kategóriának a populációban érvényes százalékos arányának és a mintában megfigyeltszázalékos arányának a hányadosával.


65

Ha minden megfigyelést az így meghatározott súllyal vesznek számításba, akkor olyan mintáhozjutnak, amely a négy súlyozó változó szerint reprezentatív. Hangsúlyozni kell, hogy ezenmanipuláció után a minta még véletlen marad, és jellemzői hasonlóak lesznek egy olyan mintajellemzőihez, amelynek kiválasztásánál a nem, kor, iskolai végzettség és településtípus változókegyüttes rétegző szempont voltak, ha a súlyok egyike sem tér el nagyon 1-től. (A minta itt tárgyaltsúlyozását pontosabban utólagos rétegzésnek is nevezik.)

A súlyozás nem olyan eljárás, amelyet minden korlát nélkül alkalmazhatunk. Az eddigbemutatott előnyös tulajdonságok csak addig jellemzik a súlyozást, amíg azt a véletlen mintavételkövetkeztében keletkező kis pontatlanságok helyesbítésére használják. A harmadik fejezetbenközölt táblázatok információt adnak arra, hogy egy helyesen választott és megfelelő méretű mintaesetén a populációra jellemző arányok és a mintabeli arányok között mekkora eltérést várhatunk.Ha a vizsgálat mintanagysága 2000, és a populációban 53% a nők aránya, de a mintában csak42% a nő, akkor ezt a hibát látszólag korrigálhatjuk súlyozással, mégpedig úgy, hogy minden nősúlya 0.53/0.42 lesz, és a férfiak súlyait is megfelelően megváltoztatjuk. Ezzel egy olyan súlyozottmintát kapunk, amely 50% nőt tartalmaz. De jó-e ez a minta? Egy 2000 nagyságú mintánál 53%nő helyett 42% nőt megfigyelni rendkívül valószínűtlen, és helyesebb, ha azt gondoljuk, hogy amintavételi eljárás rossz volt, mint azt, hogy éppen nem volt szerencsénk. Ha a mintavételi eljárásrossz, akkor a mintát semmilyen transzformáció nem javítja meg. Ha a mintavételi eljárás annyirarossz volt, a férfiak és nők arányát illetően ilyen óriási – a véletlennek nem betudható mértékű –hibát vétettünk, akkor nem számíthatunk arra sem, hogy külön a férfiak között és külön a nők közöttsikerült reprodukálni a pártpreferenciákat. Márpedig ezt az információt a súlyozott minta is megőrziaz eredeti adatokból. Ilyenkor a súlyozás sem segít. Elkendőzheti a mintaválasztás hibáit, de nemjavítja ki azokat. Pontosabban fogalmazva, ezekben az esetekben a súlyozás megszüntetheti a rosszmintából származó torzítást, de azon az áron, hogy a hibahatárt nagyon megnöveli és összességébena becslések pontatlansága meg is nőhet. A minta súlyozása csak akkor helyes eljárás, ha a mintaamúgy is majdnem reprezentatív a súlyozásra használt változók szempontjából, az eltérés nemvalószínűtlenül nagy az adott mintanagyság mellett. Ilyenkor viszont a súlyozás tényleg javítja abecsléseket. Ezért a súlyozás helyes vagy helytelen voltának megítéléséhez tudni kell azt is, hogymekkora változtatásokat eredményezett a mintában. Ebben az értelemben csak kis változtatásokfogadhatók el.

ÖsszefoglalásA minta súlyozása olyan eljárás, amellyel a mintát néhány ellenőrizhető szempontbólreprezentatívvá lehet tenni. A mintában a populációhoz képest alulreprezentált csoportok tagjai 1-nél nagyobb súlyt, a felülreprezentált csoportok tagjai 1-nél kisebb súlyt kapnak.

A súlyozást a minta valószínűtlenül nagy hibáinak eltüntetésére nem szabad használni, ilyenkorinkább azt kell feltenni, hogy hibás volt a mintavételi eljárás. A súlyozás csak a minta kicsi, avéletlen mintavételnek betudható hibáinak korrigálására használható. Ilyenkor a súlyozott mintábóladott becslések, amelyek azonosak az eredeti mintából adható súlyozott becslésekkel, jobbak, minta súlyozatlan becslések.


66

A súlyozás elfogadhatóságának megítéléséhez ismerni kell a legnagyobb és legkisebb súlyokat,mert ezek mutatják a legerősebb alul- és felülreprezentáltság mértékét.

67

8. Hogyan értelmezzük az eredményeket?Egy közvélemény-kutatás publikált eredményei többnyire százalékok és átlagértékek. Például aválasztásokon szavazni szándékozók aránya a szavazásra jogosultak között, egy pártra szavazókaránya a szavazni szándékozók között, egy politikus népszerűségi pontszámainak átlaga. Amintmár arra korábban is utaltunk, technikai értelemben a százalékértékek is átlagok: a vizsgáltalternatívát választóknak adott 100 és a többieknek adott 0 értékek átlaga. Az eredmények továbbágyakran tartalmaznak összehasonlításokat. Például az A párt szavazóinak száma meghaladja a Bpárt szavazóinak számát vagy X politikus népszerűbb, mint Y politikus. Ebben a fejezetben ezeknekaz eredményeknek az értelmezéséről lesz szó.

Létezik még kétféle releváns összehasonlítás, nevezetesen az, amely a közvélemény-kutatáskészítőinek korábbi eredményeit hasonlítja össze a mostani eredményeikkel (például, az Apárt népszerűsége az elmúlt időszakban 3%-kal növekedett), és az, amelyben a közvélemény-kutatások eredményei iránt érdeklődő olvasó különböző közvélemény-kutató cégeknek nagyjábólegy időben, ugyanabban a témában végzett felméréseinek eredményeit hasonlítja össze. Ezeknekaz összehasonlításoknak a kombinációja is lehetséges, tehát kíváncsiak lehetünk különböző cégekáltal különböző időpontokban készített közvélemény-kutatások eredményeinek az összehasonlítóelemzésére is. Ezek az összehasonlítások eltérnek az előzőktől, és később lesz majd szó azalkalmazható módszerekről.

A könyv korábbi fejezeteiben részletesen tárgyaltuk azokat az eljárásokat, ahogyan egy átlagravagy százalékértékre vonatkozó becsléshez a közvélemény-kutatás készítői eljutnak. Helyesenmegtervezett és végrehajtott mintavétel esetén ezek a becslések átlagosan pontosak és kishibahatár tartozik hozzájuk, azaz nagy megbízhatósággal nem térnek el jelentős mértékben azegész populációra jellemző valódi értéktől. Ennek az elméletnek az alkalmazhatóságát jelentősenronthatják a mintaválasztás hibái, a kérdezés felületes végrehajtása, a rosszul szerkesztett kérdőív.A hibák kétféle értelemben ronthatják el a becsléseket.

Egyrészt előfordulhat, hogy egy közvélemény-kutató cég, az alkalmazott módszereket állandónakfeltételezve, ugyanabban a témában több közvélemény-kutatást végrehajtva, rendszeresen, és ezértátlagosan is, a valódi értéknél nagyobb (vagy rendszeresen kisebb) becslést ad. Például egy cég apolitikai pártok népszerűségét rendszeresen vizsgálja. Előfordulhat, hogy az A párt népszerűségérenézve valamennyi becslése a valódi értéknél nagyobb lesz, és a B párt népszerűségére adott becslésepedig minden esetben kisebb lesz a valódi értéknél. Az ilyen szisztematikusan jelentkező eltérésttorzításnak nevezzük. Ennek többféle oka lehet. Például a minta készítésére használt címlistábanfelülreprezentáltak az A párt szimpatizánsai (és alulreprezentáltak a B párt szavazói). Vagy aközvélemény-kutató cégről a lakosság egy részében kialakult kép miatt az A párt szavazói nagyobbarányban hajlandóak részt venni a megkérdezésben, mint a B párt szavazói. (Megjegyezzük, hogyegy felmérés, amely a magyar lakosság körében azt vizsgálta, hogy létezhet-e ilyen hatás, nemtalált érdemi különbséget a legnagyobb közvélemény-kutató cégek lakossági megítélésében.) Vagy

8. Hogyan értelmezzükaz eredményeket?

68

a kérdőív szerencsétlen szerkezete miatt a bizonytalan pártpreferenciájú válaszolók egy része azA pártot választja, esetleg a B párt szavazói kisebb arányban számolnak be pártpreferenciájukról,mint az A párt szavazói.

Az ilyen jellegű torzítások egy része nem elkerülhető. Például, ha az A párt kormányzati szerepetjátszik, a B párt ellenzékben van, a C párt pedig nincs is képviselve a parlamentben, akkorelkerülhetetlen, hogy a közvetlen szavazási szándékon kívül még más szempontok is szerepetjátsszanak a válaszokban. Még ha a kérdések, a mintavétel és a felmérés egyéb körülményeiteljesen azonos esélyeket biztosítanak is ezeknek a pártoknak, azaz általános értelemben azonoskérdéseket tesznek fel ezekre vonatkozóan, az azonos kérdések mégis némileg különböző dolgokravonatkoznak, mivel ezeknek a pártoknak a helyzete lényegesen különbözik. Ugyanakkor feltehető,hogy ennek a torzításnak a mértéke a választások időpontjának közeledésével csökken.

A becslések elméleti tulajdonságaitól való eltérés másik lehetséges fajtája az, amelynekkövetkeztében a becslések ugyan torzítatlanok, azaz hosszabb távon átlagosan helyesek, de azegyes becsléseknek a helyes értéktől számított eltérései átlagosan meghaladják azt a mértéket,amely a véletlen mintavételből következne. Általában ezt eredményezik a felmérés végrehajtásánakesetleges elemei, amelyek a mintavételi hibára rárakódnak. Ilyen esetleges hibák a közvélemény-kutatás módszereinek (beleértve a mintavételi eljárást, a kérdezőbiztosokat, az adatgyűjtés módját,a kérdőívet) nem kellő pontossággal definiált voltából (például rosszul képzett, nem ellenőrzöttkérdezők) származnak. A módszerek (még ha önmagukban jók is) gyakori változtatása szinténa hiba növekedésének irányába hat. Hasonló lehet a következménye az előző fejezetben tárgyaltsúlyozás „mértéktelen” alkalmazásának is.

Az előző bekezdésekben tárgyalt szempontok egyszerűen kiterjeszthetők arra az esetre, amikor azismételt közvélemény-kutatásoknak nem ugyanazt az értéket kellene előrejeleznie, például azért,mert a pártok népszerűsége időközben változik. A fenti szempontok érvényesek maradnak úgy,hogy a populációra jellemző érték helyett a populációra aktuálisan jellemző értéket kell érteni.

A torzítás és a nagy hibahatár (a köznapi beszéd mindkettőt pontatlanságnak hívná)határozottan megkülönböztetendő veszélyek. Nagy hibahatár esetén is lehetnek az eredményektorzításmentesek. Például az A párt szavazóinak valódi aránya tíz egymást követő felvétel idejéna népességben 10%, 13%, 14%, 12%, 11%, 14%, 11%, 11%, 12%, 12%. Tegyük fel, hogy aközvélemény-kutató cég minden alkalommal 2000 embert kérdez meg, és a következő becsléseketkapja: 15%, 17%, 10%, 8%, 15%, 10%, 14%, 10%, 7%, 14%. Ha most megnézzük, hogy abecslések hogyan tértek el a valódi értékektől, akkor a következő különbségeket kapjuk: +5%, +4%,–4%, –4%, +4%, –4%, +3%, –1%,-5%, +2%. Ezeknek a különbségeknek az átlaga nulla, teháta tíz felvétel során a közvélemény-kutató cég eljárása torzítatlannak mutatkozik, mert becsléseiátlagosan helyesek voltak (amiből nem feltétlenül következik, hogy húsz vagy harminc felmérésis átlagosan torzítatlan lenne). Ugyanakkor az esetek többségében az eltérés a becslés és a valódiérték között sokkal nagyobb, mint amekkorát (itt nem részletezett matematikai megfontolásokalapján) egy 2000 nagyságú minta tízszeri megfigyelésénél hihetőnek tartanánk, tehát a hibahatárfeltehetőleg nagyobb, mint amit a mintanagyság alapján várnánk.


69

Hasonlóképpen lehetséges, hogy a hibahatár megfelel a mintanagyság alapján várhatónak, de abecslés torzított. Például egy másik közvélemény-kutató cég is készít 2000 személy megkérdezésénalapuló felméréseket ugyanazokban az időpontokban, amikor az előző, és a következő becsléseketadja az A párt szavazóinak arányára: 8%, 12%, 13%, 10%, 14%, 9%, 12%, 10%, 10%, 12%. Ebbenaz esetben a hibák a következők: –2%, –1%, –1%, –1%, –1%, –1%, +1%, –1%, –1%, 0%. A hibákátlagos értéke –0,8%. A hibák átlagosan nem túl nagyok, nem valószínűtlenek egy 2000 nagyságúminta esetén, tehát – legalábbis ebből a szempontból – a közvélemény-kutatás készítői jó munkátvégeztek, a tényleges hiba lényegében akkora, mint a várható mintavételi hiba. Ugyanakkor atíz esetből nyolcszor a párt szavazóinak számát alulbecsülték a kutatás készítői és csak egyetlenalkalommal becsülték túl. Ez arra utal, hogy az eljárás esetleg torzított, hiszen kis mértékben ugyan,de rendszeresen alulbecsüli a párt szavazóinak arányát. (Ismét megjegyezzük, hogy az, hogy tízesetben torzítás látszik, nem feltétlenül jelenti azt, hogy az eljárás tényleg torzított.)

A legrosszabbak azok az eredmények, amelyek túlnyomórészt egyirányú és nagy hibákat vétenek,például 15%, 18%, 17%, 15%, 18%, 16%, 15%, 16%, 15%, 16%. Ezek az eredményekrendszeresen és nagymértékben felülbecsülik a valódi értékeket.

Hangsúlyozni kell, hogy a fenti számítások a valóságban nem végezhetőek el, mert a populációrajellemző valódi érték nem ismert. Ezért az adatok pontosságára nézve csak az eljárás módszereinekminőségére alapozva tehetünk állításokat. A politikai közvélemény-kutatások esetében kivételtképeznek ez alól a választást vagy népszavazást közvetlenül megelőző felmérések eredményei ésa közvetlenül a szavazás után készülő közvélemény-kutatások.

A közvélemény-kutatások eredményeinek értelmezésében lényeges szerepet játszanak azösszehasonlítások, vagy az adott felmérés adatai között, vagy pedig korábbi felmérések adataival.Abban, hogy egy becsült érték eltérhet a populációra jellemző valódi értéktől, sokféle ok játszikszerepet. Ezért ugyanannak a felmérésnek különböző eredményei általában nem ugyanakkoramértékben hibásak. Ha az eredmények azt mutatják, hogy az A párt szavazóinak aránya 11%, aB párt szavazóinak aránya 15%, akkor ebből nem lehet teljes bizonyossággal arra következtetni,hogy a teljes populációban többen szavaznának a B pártra, mint az A pártra. Mindkét becsültérték tartalmazhat hibát (azaz eltérést a valódi értékhez képest), és ennek irányától és nagyságátólfügg, hogy a megfigyelt értékek alapján milyen állítást tehetünk a populációban érvényes értékekrenézve. Azt természetesen nem tudhatjuk, hogy a hibák milyen előjelűek, tehát az történik-e, hogyfelülbecsüljük az A párt szavazóinak számát, és alulbecsüljük a B párt szavazóinak számát, avagyalulbecsüljük az A párt szavazóinak számát, és felülbecsüljük a B párt szavazóinak számát, avagyesetleg mindkét párt esetében azonos előjelű a hiba. Az első esetben a populációban még nagyobbaz eltérés a két párt szavazóinak aránya között, a második esetben nehéz következtetéseket levonnia populációra nézve, hiszen ekkor a két párt szavazótábora között a különbség a becsült értéknélkisebb, esetleg nulla, sőt az sem lehetetlen, hogy az A pártra többen szavaznának, mint a B pártra.

A döntést azzal kapcsolatban, hogy vajon a B pártra többen szavaznának-e a teljes népességben,mint az A pártra, nem alapozhatjuk a hibák irányára, mert az nem ismert. Egyedül abban lehetünkbiztosak, hogy ha van is hiba, akkor az adott megbízhatósággal (azaz az esetek adott százalékában)


70

nem nagyobb, mint a mintanagyságtól függő, valamilyen érték. Például, ha a mintanagyság2500, akkor, feltéve, hogy a mintanagyságtól függő hibahatár helyesen jellemzi a hiba valószínűnagyságát, 95%-os biztonsággal hihetjük, hogy az A párt szavazóinak valódi hányada 9% és 13%között van, a B párt szavazóinak tényleges aránya pedig 13% és 17% között. Ezért közelítőleg95%-os megbízhatósággal állíthatjuk, hogy az A és B párt szavazóinak hányada különböző, és a Bpártra többen szavaznának, mint az A pártra.

A fenti számítás nem pontos, de nagyjából érzékelteti azt a gondolatmenetet, amellyeldönthetünk arról, hogy százalékos becsült értékek különbsége eléggé nagy-e ahhoz, hogyebből nagy biztonsággal a megfelelő értékeknek a populációban ténylegesen eltérő voltárakövetkeztethessünk. Az ilyen típusú döntésekhez a 20–23. táblázatokat használhatjuk. A táblázatokazt mutatják meg különböző mintanagyságok mellett, hogy legalább mekkora eltérésnek kelllennie két becsült százalékos arány között ahhoz, hogy a populációban érvényes megfelelőszázalékos értékeket 95%-os megbízhatósággal különbözőnek minősíthessük. A táblázatokat úgyhasználhatjuk, hogy kikeressük a két becsült érték átlagának megfelelő sort a táblázatok elsőoszlopában. Ha a két érték közül a kisebbik kisebb, mint a második oszlopban álló érték (ésezzel együtt a nagyobbik nagyobb, mint a harmadik oszlopban álló érték), akkor a megfelelőpopulációbeli értékeket eltérőnek minősíthetjük.


71


72


73

Ezek közül a táblázatok közül azt kell használni, amelyik az adatfelvételre jellemző mintanagyságravonatkozik. Ha ez nem szerepel a táblázatokban, közelítünk. Ha például a mintanagyság 2500,akkor a 2000 elemű és 3000 elemű mintákra vonatkozó táblázatok értékeiből átlagolunk. Ha kétpárt becsült százalékos szavazataránya 17% és 23%, akkor a 20%-os sort választjuk. Ahhoz, hogy a20%-tól eltérő becsült értékek alapján 95%-os biztonsággal arra következtethessünk, hogy a teljespopulációban is eltérés van a két párt szavazóinak aránya (és száma) között, az kell, hogy a nagyobbbecsült érték 2000 nagyságú minta esetén több legyen, mint 21,4% és egy 3000 nagyságú mintaesetén több legyen, mint 21,2%. Eszerint egy 2500 nagyságú mintánál, a nagyobb értéknek többnekkell lennie, mint egy 21,4% és 21,2% közötti érték, amelynek közelítő értékeként elfogadhatjuk ekét szám átlagát, ami 21,3%. Ennél a két aktuális érték közül a nagyobbik (23%) nagyobb, és ezért95%-os biztonsággal állíthatjuk, hogy a 23%-ot kapott pártnak ténylegesen több szavazója van,mint a 17%-ot kapott pártnak. A 95%-os biztonság azt jelenti, hogy ha a két párt szavazóinak számaazonos lenne a népességben, akkor az itt alkalmazott eljárást sokszor ismételve, az esetek 95%-ában ezt helyesen felismernénk, és csak az esetek 5%-ában, azaz 20 alkalmazás közül átlagosan egyalkalommal jutnánk tévesen arra a következtetésre, hogy a két párt szavazóinak száma különbözik.Az 5%-os tévedési valószínűség megnyugtatóan kicsinek tűnhet, de ez nem jelenti azt, hogymegfeledkezhetünk róla. Nem szabad azt hinnünk, hogy a 20–23. táblázatok vagy más hasonlótáblázatok alapján teljes bizonyossággal megállapítható egy véletlen mintán alapuló közvélemény-kutatás eredményeiből, hogy a két párt szavazóinak aránya különbözik-e. A véletlen viselkedésével


74

kapcsolatos matematikai ismeretek lehetővé teszik, hogy a véletlen hatását, a következtetéseinkbenmeglévő bizonytalanságot mérjük és korlátozzuk, de megszüntetni nem tudjuk. Megjegyezzük,hogy ha a mintavétel nem véletlen módszerekkel történik, akkor még a bizonytalanság mérése semlehetséges – nem is beszélve annak korlátozásáról.

A 20–23. táblázatok akkor is használhatóak, ha a két becsült százalékos érték átlaga nem egyezikmeg a táblázatok első oszlopaiban szereplő értékekkel. Ha a mintanagyság 1000, és a becsültértékek 20% és 24%, akkor az átlag 22%. A 21. táblázatból látjuk, hogy ha az átlag 20%, akkorennél a kisebb értéknek legalább 2,0%-kal kell kisebbnek lennie (20–18,0=2,0), ha pedig az átlag25%, akkor a kisebb értéknek ennél legalább 2,2%-kal kell kisebbnek lennie (25–22,8=2,2). Ezért22%-os átlag esetén a kisebb értéknek egy 2,0% és 2,2% közötti értékkel kell kisebbnek lennie, mint22%. Közelítőleg feltehetjük, hogy ez az érték nincs messze a 2,0% és a 2,2% átlagától, ami 2,1%.Ennek alapján a döntési eljárás az, hogy ha a kisebbik érték jobban eltér az átlagtól, mint 2,1%,akkor a két populációbeli értéket ténylegesen eltérőnek minősítjük. Példánkban a kisebb érték 20%,ami kevésbé tér el a 22%-től, mint 2,1%, ezért az adott mintanagyság mellett a megfigyelésekbőlnem következtethetünk 95%-os megbízhatósággal arra, hogy a megfelelő populációbeli értékek iseltérnek. Megjegyezzük, hogy ez a gondolatmenet látszólag csak a kisebbik értéket hasonlítottaaz átlagos értékhez, és a döntést erre az eltérésre alapoztuk. Valójában a nagyobbik érték éppenannyira tér el az átlagtól, mint a kisebbik érték, és ezért az egyik eltérésre alapozott döntésieljárás megegyezik azzal a döntési eljárással, amelyet a másikra alapozhatnánk (vagy mindkettőreegyszerre).

A táblázatokat vizsgálva arra a következtetésre juthatunk, hogy egy bizonyos nagyságú eltérés abecslések között kisebb mintanagyságnál esetleg nem vezet arra a döntésre, hogy a populációrajellemző tényleges értékek között is eltérés van, míg nagyobb mintanagyság esetén már igen.Például 33% és 37% megfigyelése után, ha ezek a megfigyelések egy 1000 fős mintábólszármaznak, még nem következtethetünk 95%-os megbízhatósággal arra, hogy valódi különbségvan a teljes populációra jellemző értékek között, míg ha a becslések egy 3000 fős mintábólszármaznának, ez a következtetés már indokolt lenne.

A fenti táblázatok természetesen matematikai eljárások eredményei és akkor érvényesek, haa mintát teljes egészében sikerült lekérdezni, és azon a feltételezésen alapulnak, hogy ahibahatár az egyszerű véletlen mintavételi eljárásra vonatkozó értékekkel azonos. A ténylegesmintavételi eljárásra jellemző hibahatár eltérhet ezektől az értékektől. Továbbá, korábban láttuk,hogy azok, akik ténylegesen válaszolnak a közvélemény-kutatásban feltett kérdésekre, általábannem tekinthetők a populációból vett véletlen mintának. Ezért a valódi közvélemény-kutatásokeredményeire érvényes hibahatárok általában nagyobbak, mint azt az elmélet a megcélzott vagyakár a ténylegesen lekérdezett mintanagyság alapján adná. Ezeket a hatásokat úgy vehetjük –közelítőleg – figyelembe, hogy úgy teszünk, mintha a kutatás kevesebb ember megfigyelésénalapulna, mint a ténylegesen megkérdezettek száma. Nagyon sok és nehezen kvantifikálhatótényező hatását kellene figyelembe venni annak eldöntéséhez, hogy vajon egy adott kutatásrajellemző hibahatár mekkora mintanagyság esetén érvényes elméleti hibahatárral lehet azonos. Nemszabad elfelejteni azonban azt, hogy a tényleges válaszolók és a mintába kerültek véleményei


75

közötti eltérések nem csak azt eredményezik, hogy a hibahatár változik (nő), hanem azt is, hogya becslések némileg torzítani fognak, azaz szisztematikusan eltérnek a valóságtól. Ez azt jelenti,hogy esetleg még sok felmérés eredményének az átlaga sem lesz közel a valódi értékhez. Ez utóbbihibát pedig nem lehet azzal orvosolni, hogy a mintanagyságot úgy tekintjük, mintha kisebb lennea valóságosnál.

Hasonló elemzésnek vethetnénk alá a politikusok népszerűségi osztályzatait, de ehhez olyaninformációkra lenne szükség, amelyeket nem szoktak a közvélemény-kutatás eredményei közöttközölni. Annak megítéléséhez, hogy ha X politikus például 3,7-es átlagot ér el a mintában,Y politikus pedig 4,2-t, akkor ebből mekkora megbízhatósággal következik, hogy az egészpopulációban számított átlagértékeik is különböznek, ezeken a számokon és a mintanagyságonkívül még azoknak az osztályzatoknak bizonyos jellemzőit is ismerni kellene, amelyekből ezek azátlagok keletkeztek. Amint arra már korábban utaltunk, a pártpreferenciára vonatkozó százalékosértékek tartalmaznak minden releváns információt a mintából, a preferencia átlagok nem, hiszenugyanaz az átlag többféleképpen is előállhat. A pontos osztályzatokra vonatkozó információnélkül a különbségek értékeléséhez olyan feltevésekre és közelítésekre lenne szükség, amelyekakkora bizonytalanságot eredményeznének, hogy az megkérdőjelezné az egész következtetéshasználhatóságát. Ezért ilyen típusú döntésekre csak a közvélemény-kutatás készítőinek vanlehetőségük, az olvasónak általában nem.

ÖsszefoglalásA közvélemény-kutatások publikált eredményei többnyire százalékos értékek vagy átlagok. Jólelvégzett kutatás esetén ezek a populációban érvényes értékeknek torzítatlan (azaz átlagosanpontos) becslései, és a hiba 95%-os biztonsággal várható maximális mértéke elméletileg ahibahatárral jellemezhető, bár a tényleges közvélemény-kutatások esetében torzítások és azelméletileg vártnál nagyobb hibahatárok is előfordulhatnak.

Két becsült érték különbözősége nem vonja maga után minden feltétel nélkül azt, hogy azoka populációban érvényes értékek, amelyeknek ezen becslései ténylegesen különböznek. Erremegfelelő biztonsággal csak akkor következtethetünk, ha a becsült értékek eltérése meghalad egybizonyos küszöböt, amely ezeknek az értékeknek az átlagától és a mintanagyságtól is függ. Ezeknéla számításoknál a ténylegesen lekérdezett minta nagyságát kell használni, és még ezt is célszerű avizsgálat minőségétől függő mértékben csökkenteni.

76

9. Minden adatra érvényes a vizsgálathibahatára?A könyv eddigi részeiben többnyire a közvélemény-kutatás mintájából becsült százalékosarányokkal foglalkoztunk. Bemutattuk, hogy különböző megbízhatóságú becslések érdekébenmekkora mintanagyságokra van szükség, illetve azt, hogy különböző mintanagyságokhozlegfeljebb mekkora hibahatár tartozik (3. fejezet). Azt is megvizsgáltuk, hogy két ilyen becsültérték eltérése alapján hogyan lehet a populációban valóban érvényes eltérésekre következtetni (8.fejezet). Ilyen becsült értékekkel találkozunk akkor, amikor például egy párt szavazóinak arányátbecsüljük meg. Erre az a kézenfekvő eljárás kínálkozik, hogy a mintából például egy adott pártotválasztók számát elosztjuk a minta nagyságával. Ha egy 1000 fős mintából 271-en szavaznának azA pártra, akkor az A párt várható szavazóinak arányára a becslés 271/1000=0,271 vagy 27,1%.

A fenti értéknél azonban sokszor érdekesebb az, hogy a valószínű szavazóknak mekkorahányada szavazna az A pártra. Ez különösen akkor van így, ha a közvélemény-kutatás célja– mint oly sokszor – a választások eredményének előrejelzése. A választás eredménye csak aténylegesen szavazók szavazataitól függ, ezért a közvélemény-kutatások készítőinek gyakran céljaa valószínűleg szavazó és a valószínűleg nem szavazó személyek elkülönítése.

Ha az előbbi példában azt találják, hogy az 1000 megkérdezett közül csak 635 szándékozikszavazni, és az A pártot választó 271 ember közül 217 tartozik közéjük, és a fennmaradó 54szimpatizánsa az A pártnak nem szándékozik szavazni, akkor az A párt várható szavazatarányára a217/635= 0,342 vagy 34,2% becslést adnánk. (Megjegyzendő, hogy a valószínűleg szavazók és aszavazási szándékról beszámoló megkérdezettek nem feltétlenül azonosak.)

Azt gondolhatnánk, hogy a becslés tulajdonságai szempontjából nem lényeges, hogy a teljes(lekérdezett) mintanagysághoz vagy pedig azokhoz viszonyítjuk az A párt szavazóinak számát, akikvalószínűleg elmennek szavazni. A 6. fejezetben egy másik problémával kapcsolatban bemutattuk,hogy a viszonyítási arány, azaz a nevező megváltoztatása mennyire megváltoztathatja a becsültértékeket. A fenti példában láttuk, hogy az A párt szavazóinak arányára vonatkozó becslés27,1%-ról 34,2%-ra nőtt. Valójában azonban a valószínű szavazókhoz való viszonyítás az összesmegkérdezetthez való viszonyítástól egy sokkal lényegesebb szempontból is eltér, mint azt azeddigiek mutatták: a valószínű szavazók arányában kifejezett százalékos becslésekre egészen máshibahatárok vonatkoznak, mint a teljes mintanagyság arányában kifejezett becslésekre. Két becsültszázalékos értékre, amelyek igen hasonlónak tűnnek, és amelyeket a közvélemény-kutatásokkészítői gyakran egymás mellett mutatnak be, egészen más szabályok érvényesek.

A hibahatárok különbözősége a két becslés következő eltéréséből adódik. A mintanagyságszázalékában kifejezett becslés egy olyan hányados, amelynek számlálójában egy véletlentől (is)függő mennyiség szerepel (hányan kerültek a mintába olyanok, akik az A pártot választanák), a

9. Minden adatra érvényesa vizsgálat hibahatára?

77

nevező egy mintavételi ingadozások által nem befolyásolt érték, nevezetesen a felmérés készítőiáltal választott mintanagyság. Különösen így van ez, ha a felmérés készítői addig egészítik ki amintát pótcímekkel, amíg nem sikerül lekérdezni az előre tervezett számú embert. Ezzel szembena valószínű szavazókon belüli becsült arány egy olyan hányados, amelynek számlálóját is ésnevezőjét is terhelheti mintavételi hiba. A számlálót – éppúgy mint az előbbi esetben – azért, merta véletlenen (is) múlik, hogy az A párt szavazói mekkora arányban kerülnek a mintába, a nevezőtpedig azért, mert a véletlenen (is) múlik, hogy a valószínű szavazók mekkora arányban kerülnek amintába. Azt mondhatjuk, hogy az előbbi arány egy becsült mennyiségnek és egy pontosan ismertmennyiségnek a hányadosa, míg az utóbbi arány két becsült mennyiség hányadosa. A hányadoslehetséges hibájához a számláló és a nevező lehetséges hibája is hozzájárul, ezért a mintanagyságszázalékában kifejezett arány hibahatára kisebb, mint a valószínű szavazók százalékában kifejezettbecslés hibahatára.

Lényegében ugyanez a helyzet akkor is, amikor a közvélemény-kutatás készítői egy pártszavazóinak arányát nem az összes megkérdezetthez képest, hanem a valamilyen pártot választókszámához képest adják meg. Ehhez hasonló helyzet nem csak politikai közvélemény-kutatásokbanfordul elő. Például megbecsülhetjük azoknak az arányát egy mintából, akik önkéntes szakmaitovábbképzésben vesznek részt, és megbecsülhetjük ugyanezeknek az arányát azok közül, akik aközeljövőben állást szeretnének változtatni. Az első becsült értékhez tartozó hibahatár itt is kisebblesz, mint a második becsült értékhez tartozó.

Az alábbiakban a hányadosokhoz tartozó közelítő hibahatárt különböző mintanagyságokra azzala feltételezéssel adjuk meg, hogy a számlálóban mindig olyan érték szerepel, amely kisebb anevezőnél, és a számlálóban lévő mennyiség része a nevezőben lévőnek. Ez a helyzet például akkor,amikor egy adott párt szavazóinak számát a valamilyen pártpreferenciát nyilvánítók számáhozvagy pedig a szavazni szándékozók számához viszonyítják. A 24–28. táblázatokban a hányadosokhibahatárának közelítő értékeit adjuk meg a mintanagyság, illetve a számlálóban és a nevezőbenlévő mennyiségek valódi, népességbeli nagyságának függvényében.


78


79


80


81


82

Amint azt a könyv 3. fejezetében részletesen tárgyaltuk, a hibahatár jelentése az, hogy a minták95%-ában (azaz húsz eset közül tizenkilencszer) várhatóan ennél kisebb lesz az eltérés a valódiés a mintából becsült érték között. Ha például a népesség 60%-ának van pártpreferenciája, és anépesség 20%-a (akik valamennyien az előbbi 60% közé tartoznak) választ egy adott pártot, akkora valamilyen pártot választók között ennek a pártnak a népszerűsége 20/60=33,3%. Ha 1000 főtkérdeznek meg, akkor az ilyen vizsgálatoknak 95%-ában a megfelelő becsült érték nem fog jobbaneltérni ettől, mint 3,8 százalékpont (a hibahatár), azaz 29,5% és 37,1% között lesz. Más szavakkalazt is mondhatjuk, hogy a mintából becsült érték 95%-os valószínűséggel a fenti határok közé esik.A hibahatár nagyobb pontosságú közelítések várható gyakoriságának megítélésére is alkalmas.Például az előbbi esetben azt mondhatjuk, hogy a minták 68%-ában várhatóan azt találjuk, hogya becsült érték nem tér el jobban 33,3%-tól, mint 1,9 százalékpont (a hibahatár fele), azaz 31,4%és 35,2% között lesz. Továbbá a minták 99,7%-ában a becsült érték nem tér el jobban a 33,3%-tól,mint 5,7 százalékpont (a hibahatár másfélszerese), azaz 27,6% és 39% között lesz.

A 24–28. táblázatok alkalmazásában nem vétünk nagy hibát, ha úgy használjuk őket, hogy aténylegesen nem ismert valódi értéket a mintából becsült értékkel helyettesítjük. Ennek alapjána fenti állításokat közelítőleg megfordíthatjuk. Például, ha az A párt szavazóinak aránya egy


83

1000 elemű mintában 20%, és a mintának 60%-a választ valamilyen pártot, akkor 68%-osmegbízhatósággal állíthatjuk, hogy a valamilyen pártot választók között az A pártot választóktényleges (a populációban érvényes) aránya 31,4% és 35,2% között van. (Annak jelzésére, hogyegy bizonyos értelemben megfordított állítást tettünk, a valószínűség szót a megbízhatóság szóvalhelyettesítjük.) Hasonlóan, ebben a helyzetben arra következtetünk, hogy a valódi arány 95%-osmegbízhatósággal 29,5% és 37,1% között van, vagy hogy 99,7%-os megbízhatósággal 27,6% és39% között van.

A táblázatok a szokásos módon használhatóak abban az esetben is, ha a megfigyelt értékek nemegyeznek a táblázatokban megadott értékekkel. Ilyenkor meg kell keresni, hogy a számláló melyértékek közé esik, és a nevező mely értékek közé esik, és ennek megfelelően kell megbecsülni ahibahatárt. Például ha a számlálóban szereplő érték 25%, a nevező 55%, a mintanagyság pedig3000 fő, akkor a 20-as és 30-as oszlop, illetve az 50-es és 60-as sor közötti értéket kell választanihibahatárként. Ennek az ezen sorok és oszlopok metszetében álló számok között kell lennie. Ezeka számok 2,2, 2,4 és 2,5, tehát választhatjuk közelítő hibahatárként az 2,4 értéket. A ténylegesenszámított hibahatár valóban 2,45 ebben az esetben.

Érdemes a 24–28. táblázatokban megadott hibahatárokat összehasonlítani a 8. táblázatban szereplőmaximális hibahatárokkal. Azok az értékek egy olyan arány becslésére vonatkoznak, amelyneknevezőjében a mintanagyság áll, tehát például egy párt szavazóinak aránya az egész népességenbelül. A 24–28. táblázatokban hibahatárok vannak megadva olyan hányadosok becslésérevonatkozóan, amelyeknek nevezőjét szintén csak becsülni lehet, például a valamilyen pártotválasztók között az egy adott pártot választók aránya. Az összehasonlítás azt mutatja, hogy azutóbbi esetben a maximális hibahatár több mint kétszerese az előbbi esetre a 8. táblázatbanmegadott maximális hibahatárnak. Nem szabad ugyanakkor elfelejteni azt sem, hogy amíg a 8.táblázat maximális hibahatára valamennyi elméletileg lehetséges hányados becslésére vonatkozik,addig az itteni értékek csak a vizsgált, nem túl szélsőséges esetekre érvényesek. Az itt vizsgáltaknálszélsőségesebb esetekben (például a számláló értéke csak 3%) a hibahatár sokkal nagyobb lehet,azaz messze meghaladja a 8. táblázatban szereplő értéket.

A fentiek alapján, nem túl szélsőséges esetekre vonatkozóan, érdemes megjegyezni azt a szabályt,hogy egy olyan hányadosra vonatkozó hibahatár, amelyben a számláló is és a nevező is becsültérték, több mint kétszerese egy felmérés hibahatárának. A felmérés hibahatáraként megadottérték olyan hányadosok becslésére vonatkozik, ahol csak a számláló becsült érték, a nevezőnem az. A közvélemény-kutatások eredményeinek közlésében az a gyakorlat, hogy a teljesnépesség arányában megadott becslésekkel párhuzamosan közölnek a valamilyen tulajdonsággalrendelkezők (például pártot választók) arányában megadott becsléseket, nem szerencsés, mertezekhez a becslésekhez nagyon különböző hibahatárok és ezért eltérő értelmezések tartoznak.

ÖsszefoglalásA teljes népességen belüli arányok és a népesség valamilyen tulajdonsággal definiált részcsoportjánbelüli arányok hibahatár szempontjából nagyon eltérően viselkednek.


84

A mintanagyságra jellemző hibahatár csak a teljes népességhez viszonyított arányszámokviselkedését jellemzi. A közvélemény-kutatás során vizsgált részcsoporton belüli aránybecsléséhez tartozó hibahatár több mint kétszer nagyobb ennél az esetek többségében.

A közvélemény-kutatás készítőinek erről nem szabad elfelejtkezniük, és nem szabad a kétfélearányt úgy elemezni, mintha a hibahatárok azonosak volnának.

85

10. Összehasonlítók-e a különbözőközvélemény-kutatások eredményei?A közvélemény-kutatások eredményei iránt érdeklődő olvasónak néha lehetősége nyílik arra, hogytöbb közvélemény-kutatás eredményét, amelyek ugyanabban a témában készültek, összevesse.Politikai közvélemény-kutatások esetében azok eredményeinek rendszeres közlése kétféleösszehasonlítást is lehetővé tesz. Egyrészt összehasonlíthatók a különböző közvélemény-kutatócégek nagyjából egy időben készült felméréseinek eredményei, másrészt pedig összehasonlíthatóka korábbi eredmények újabb eredményekkel. Ezekből az összehasonlításokból teljesebb képetremélhetünk, és információkat szerezhetünk olyan folyamatokról, amelyeket másként nemismerhetnénk meg.

Ezeknek az összehasonlításoknak a tárgya többféle szempontból eltérő felméréseknek azeredménye, és mielőtt az összehasonlítás módszereiről szót ejtenénk, meg kell vizsgálnunk,mit is hasonlítunk össze mivel. Különböző időpontokban készült vizsgálatok némileg eltérővalóságot tükröznek. Általában minél nagyobb idő telik el a két adatfelvétel között, annál nagyobbkülönbségekre számíthatunk. Ugyanakkor bizonyos események következtében az emberekvéleménye, attitűdje, politikai preferenciája rövid idő alatt is jelentősen változhat. Amikor tehátkét különböző időpontban végzett közvélemény-kutatás eredményei eltérnek, ennek az eltérésnekkétféle oka lehet. Az eltérés egyik oka a vizsgált vélemények időközben történt megváltozása. Amásik ok az lehet, hogy feltehetőleg mindkét vizsgálat bizonyos hibával tükrözte a készítésekorérvényes véleményeket, és emiatt eredményeik valamilyen mértékben még akkor is eltérnének, haa vizsgált populációban nem változott volna semmi. A minden közvélemény-kutatással együttjáróvéletlen hiba a valóságban meglévő eltérést fel is erősítheti és le is csökkentheti.

Például ha egy párt szavazóinak aránya az első közvélemény-kutatás alkalmával (ténylegesen)15%, a második alkalommal (ténylegesen) 13%, azaz a párt népszerűsége 2%-kal csökkent, akkorlehetséges, hogy az első közvélemény-kutatás becslése 16%, a másodiké pedig 11%. Mindkétkutatás viszonylag pontos becslést adott. Mégis, a két becsült érték összehasonlítása a pártnépszerűségének csökkenését eltúlozza. A valóságban 2%-ot vesztett a párt, az eredmények 5%elvesztését mutatják, tehát a veszteség mértékét két és félszer akkorának becsüljük, mint ami avalóságos érték. Ugyanebben a valódi helyzetben az is előfordulhat, hogy az első közvélemény-kutatás a párt szavazóinak arányát 12%-ra becsüli, míg a második 15%-os népszerűséget talál.Ebből azt a következtetést vonhatnánk le, hogy a párt a két közvélemény-kutatás között elteltidőben növelte szavazóinak számát, pedig a valóságban éppen ennek ellenkezője történt.

A fenti példákból az következik, hogy amikor valamilyen érték változását akarjuk becsülni, mégóvatosabban kell eljárni, mint amikor ezt az értéket önmagában akarjuk becsülni. Ennek oka az,hogy a változások rendszerint viszonylag kisebb értékek, mint azok az értékek, amelyeknek aváltozását vizsgáljuk. Ezért azok a hibák, amelyek az eredeti értékekhez képest nem túl nagyok,esetleg a kisebb változásokhoz viszonyítva már jelentősek lehetnek. Egy további ok az óvatosságra,

10. Összehasonlítók-e akülönböző közvélemény-

kutatások eredményei?

86

hogy a változás mértékének megbecsüléséhez két becsült értéket kell felhasználnunk, amelyektartalmazhatnak hibát, és ezek a hibák akár össze is adódhatnak, tehát esetleg kétszer is akkoráklehetnek, mint azok a hibák, amelyekkel az eredeti mennyiségek becslésénél számolnunk kell.Tehát előfordulhat, hogy egy kisebb mennyiséget (a változást) nagyobb hibával becsülünk. Ígyösszességében a változás becslésénél nagyobb hibahatár érvényes, mint az eredeti mennyiségekbecslésénél.

Az előbbi megfontolások az eredmények összehasonlításának másik esetére is vonatkoznak,amikor is két különböző közvélemény-kutató cég által lényegében egy időben készült vizsgálatokeredményeit hasonlítjuk össze. A korábban mondottak fényében a lényegében azonos idő aztjelenti, hogy időben olyan közel esnek egymáshoz, hogy a valódi véleményeket változatlannaktételezhetjük fel. Ha feltehetjük, hogy a két vizsgálat időpontja között a vizsgált véleménynem változott (vagy csak elhanyagolható mértékben változott), akkor az eredmények eltéréseia két adatfelvétel eltéréseinek tudhatóak be. Ezen eltéréseknek egy része a mintavételi hibábólszármazik. Annak következtében, hogy nem mindenkit kérdeztek meg, a kapott becslésekfeltehetőleg eltérnek az egész populációra jellemző értéktől.

A mintavételi hiba itteni hatásának illusztrálására képzeljük el, hogy ugyanaz a közvélemény-kutató cég, ugyanazokkal a munkatársakkal, ugyanazzal a kérdőívvel, ugyanazokkal a kérdezőiinstrukciókkal, ugyanazzal az adatfeldolgozási eljárással, de két különböző mintán hajt végreközvélemény-kutatást, és ez a két kutatás még időben is egyszerre történik. Ennek a két kutatásnakvárhatóan nem lesznek ugyanazok az eredményei. Mivel minden más körülmény azonos volt, azeredmények eltérése kizárólag a mintavételi hibának tudható be. Az eredmények valóságtól valóeltérésének várható nagysága a mintavételből származó hibahatár nagyságán múlik. Ha ugyanis aközvélemény-kutatásból származó becslések azonosak lennének a valódi értékkel, akkor egymástólsem térnének el.

A valóságban természetesen ugyanaz a cég nem készít két közvélemény-kutatást ugyanabban azidőben. Két egyszerre készült közvélemény-kutatás eredményének összehasonlítása a valóságbancsak olyan esetekben lehetséges, amikor ezeket a vizsgálatokat különböző cégek készítették. Azadatfelvételek eltérésének a mintavételi hibán túlmenő másik komponense abból származik, hogya két cég feltehetőleg eltérő módszereket használ. Különböznek a kérdőívek, a kérdezőbiztosok, akérdezőbiztosoknak adott utasítások, a két cégről a megkérdezettek körében élő kép, és még sokegyéb szempont, amelyek hatással lehetnek az eredményekre. Ennek a nem mintavételi hibának azillusztrálására képzeljük el, hogy két céget bízunk meg azzal, hogy egy általunk megadott mintánvégezzenek közvélemény-kutatást egy általunk megadott témában. Ennek a gondolatkísérletneka kedvéért tételezzük fel, hogy egy embert meg lehet kérdezni a véleményéről kétszer, anélkül,hogy ez a véleményét és válaszolási hajlandóságát befolyásolná. Ebben az esetben a két cég –annak ellenére, hogy ugyanazokat az embereket kérdeznék ugyanazokról a témákról –, ténylegeseneltérő eredményeket produkálna. Ennek oka az, hogy nem pont ugyanazokat a kérdéseket tennékfel, nem pont ugyanúgy tennék fel ezeket a kérdéseket, nem pont ugyanúgy próbálnák megtalálnia mintában szereplő személyeket, stb. A közvélemény-kutatás eredményeinek a valóságtól valóeltérésének azt a részét, amely ezekre az okokra vezethető vissza, nevezzük nem mintavételi



87

hibának. Akinek a kétszer lekérdezhető minta gondolata abszurdnak tűnik, az módosíthatja azelőbbi gondolatkísérletet úgy, hogy a két cégnek két különböző mintát adunk, de tudjuk, hogy ezeka minták minden szempontból azonosak.

A gyakorlatban a mintavételi és nem mintavételi hiba természetesen nem szétválasztható. Konkrétesetben a mintavételi és nem mintavételi hibák egymást erősíthetik vagy gyengíthetik. Annakellenére, hogy a valóságban ezek a hibák együttesen jelentkeznek, elméleti szétválasztásuk fontos.A mintavételi hibára nézve megállapíthatjuk a hibahatár nagyságát, pusztán a mintanagyságés a mintavételi eljárás ismeretében. Ez természetesen csak akkor igaz, ha a közvélemény-kutatók egyformán pontosan hajtják végre mintavételi tervüket. Ha nem, az elméleti hibahatárfélrevezető lehet. A nem mintavételi hiba nagyságáról csak hozzávetőleges képe lehet aközvélemény-kutatások eredményei iránt érdeklődő olvasónak. A közvélemény-kutató cégekmunkáját hosszabb távon megfigyelve felhalmozódhat ismeret arra nézve, hogy egyes cégekmegbízhatóbbak (azaz kisebb hibával dolgoznak), mint más cégek. Ennek megítélésére egyrészta publikált eredmények és a valóság (ha erre fény derül) többszöri összehasonlítása, másrésztaz alkalmazott módszerek megismerése vezethet. A módszerek minőségének megítélésében azebben a könyvben leírt szempontokat használhatjuk. Ezek a szempontok egy új kutatás várhatóminőségének megítélésében fontosabbak, mint egy-egy korábbi eredmény nagyon pontos vagyakár nagyon pontatlan volta, hiszen ez utóbbiak a véletlen szerencsének vagy a nagyobb ténylegesmintavételi hiba alakjában megjelenő véletlen balszerencsének is lehetnek a következményei, ésnem feltétlenül ismétlődnek egy újabb kutatásban.

A közvélemény-kutató cégek munkájának megítélésében a nem mintavételi hiba várható nagyságanem az egyetlen szempont. Elméletileg torzításokra is fel kell készülnünk. Lehetséges, hogypéldául egy politikai közvélemény-kutatásban egyes cégek rendszeresen alá- vagy fölébecsülikbizonyos pártok szavazói táborának nagyságát. Ennek többféle oka lehet – még ha el istekintünk a szándékos torzítás lehetőségétől, ami inkább a közvélemény befolyásolására irányulókísérlet, mint a közvélemény kutatása. Ilyen ok lehet a rossz mintaválasztási technika (példáulegy olyan címlistából válogatott minta, amely a valóságosnál kisebb vagy nagyobb aránybantartalmazza egy párt szimpatizánsait). Oka lehet a torzításnak a közvélemény-kutató cégrőlkialakult kép, aminek következtében egy párt szavazói az átlagosnál kisebb vagy nagyobbmértékben fognak válaszadásra vállalkozni. Oka lehet továbbá a torzításnak az, hogy a kérdezők,rossz megválogatásuk, esetleg hiányos képzésük vagy a mintába került személyek felkeresésénekhelytelen módja miatt bizonyos társadalmi csoportok tagjait kisebb vagy nagyobb arányban találjákmeg és nyerik meg a kutatásban való részvételre, mint másokat, és az ebből származó torzításta súlyozás nem mindig tudja korrigálni. A sikeres korrigálás akkor lenne lehetséges, ha az alul-vagy felülreprezentálás a súlyozásnál figyelembe vett társadalmi csoportok szempontjából jönnelétre a mintában, de erre semmi biztosíték sincs. Ha például a vad kutyák tulajdonosai pártotalapítanának, akkor könnyen lehetséges, hogy ennek a pártnak a szavazóit a kérdezőbiztosok kisebbarányban találnák meg (talán nem is térnének vissza egy címre olyan lelkesen, ha nem találtákotthon a mintába került személyt, mint azokra a címekre, ahol nem kell egy vad kutya harapásátóltartani). Ebből a párt szavazóinak alulbecslése, azaz torzítás származna. Ezen a torzításon nem segíta súlyozás, mert hiába érjük el, hogy a fontos társadalmi csoportok a populációbeli arányukhoz



88

hasonlóan szerepeljenek a mintában (pontosabban az adatok alapján adott becslésben), a vad kutyáktulajdonosai minden társadalmi csoportban alul lesznek reprezentálva.

Azt látjuk tehát, hogy torzítás a közvélemény-kutató cégek akaratától függetlenül is létrejöhet. Atorzítás lehetséges okai között a nem mintavételi hibák jelenős szerepet játszanak, de a mintavételesetleges hiányosságai (például rossz címlista használata) is torzításra vezethetnek.

A közvélemény-kutató cégek esetleges szisztematikus torzítására igazából nem úgy deríthetünkfényt, hogy eredményeiket a valósággal összehasonlítjuk (ami például választások alkalmávallehetséges), hanem úgy, hogy egy cég eredményeit hosszabb időszakon keresztül összevetjük máscégek eredményeinek az átlagával. Ahhoz, hogy ez az összehasonlítás érvényes és megbízhatólegyen, számos apró részletre kell ügyelni, de összefoglalóan azt mondhatjuk, hogy ha esetleg egyescégek rendszeresen torzítanának egy-egy politikai párt javára (vagy kárára), akkor ennek a többicég által megjelentetett eredményekhez képest is fel kellene tűnnie. Hozzátesszük azonban, hogyelméletileg nem lehetetlen egy olyan helyzet kialakulása sem, amikor egyetlen cég eredményeiközelebb vannak a valósághoz, mint a többiek átlaga.

Amikor egy párt népszerűségére vonatkozó két, időben eltérő eredményt hasonlítunk össze, akkor atapasztalt eltérésnek oka lehet az időközben megváltozott valódi helyzet és a két kutatási eredményfeltehetően eltérő hibája (mintavételi és nem mintavételi) is. Ha az a kérdés, hogy az A párt növelte-e szavazóinak táborát két közvélemény-kutatás között, akkor ha ezeket a kutatásokat ugyanaz a cégvégezte, az esetleges szisztematikus torzítással nem kell számolnunk, hiszen ez, ha van egyáltalán,várhatólag ugyanaz mindkét alkalommal, és ezért az eredmények különbségét nem befolyásolja.Például tegyük fel, hogy az A párt az első alkalommal a becslés szerint a szavazatok 15%-át kapná,a második alkalommal pedig a becslés 12%. Ha ez a két eredmény ugyanattól a cégtől származik,és azt sejtjük, hogy ez a cég például általában 2%-kal magasabb értéket becsül az A párt szavazóiranézve, mint a valóság, akkor nem 15%-ot és 12%-ot kell összehasonlítani, hanem 13%-ot és 10%-ot, de ezek nem nagyon különböző feladatok. Ha két különböző cég végezte a két vizsgálatot, akkormegpróbálhatjuk az eredményeket a feltételezhető torzításnak megfelelően korrigálni. (Feltehető,hogy a torzítás a valódi értékekhez képest kicsi.) Ha az első eredmény az X cégtől származik és amásodik az Y cégtől, akkor az esetlegesen feltételezett torzításnak megfelelően változtatni kell azértékeket. Ha azt feltételezzük, hogy az X cég az A pártot átlagosan 2%-kal felülbecsüli, az Y cégrőlpedig nincs okunk rendszeres torzítást feltételezni, akkor a korrigált érték 13% és 12%. Ezeknekaz értékeknek az összehasonlítása pedig egészen más eredményre vezethet, mint az eredeti 15%és 12% összehasonlítása.

Ha az esetleges korrekciót végrehajtottuk, azzal a kérdéssel kerülünk szembe, hogy a két eltérőérték azért eltérő-e, mert a választók szavazási szándékai megváltoztak a két közvélemény-kutatásközött eltelt időben, vagy pedig az eltérés a hiba következménye. Ha a két vizsgálat hibahatáráranézve rendelkezünk ismerettel, akkor azt mondhatjuk, hogy akkora eltérések esetén, amelyeket azadott hibahatárok mellett gyakran tapasztalhatnánk, nincs okunk valódi változásra következtetni,mert nem áll rendelkezésünkre bizonyíték arra nézve, hogy a különbség a két becsült érték közöttnem csak a felmérések hibáinak következménye. Ha azonban az eltérés a két érték között akkora,



89

amekkora eltérés az adott hibahatárok mellett csak a mintáknak egy kis hányadában fordulna elő,feltéve a valódi értékek változatlan voltát, akkor dönthetünk úgy, hogy inkább azt a következtetéstválasztjuk, hogy van valódi eltérés a választók szavazási szándékaiban – és nem kizárólag a hibaokozza a megfigyelt eltérést.

Ezeknek a döntéseknek a megalapozására az alábbiakban olyan táblázatot közlünk, amely aztmutatja meg különböző hibahatárok mellett, hogy a minta-párok (az első és a második kutatásmintái) 95%-ában legfeljebb mekkora mértékű eltérések fordulnának elő a két mintából becsültértékek között, ha a populációra jellemző értékek változatlanok maradnának. A 29. táblázatnak azalkalmazásában a publikált becsült értékeket az esetleges torzításoknak megfelelően korrigálni kell.Hibahatárként egy olyan mennyiséget kell használnunk, amely az egyes vizsgálatok teljes hibájáravonatkozik, nem csak a mintavételi hibára. A mintavételi hiba a mintanagyság függvénye és egyerre vonatkozó táblázat szerepel ebben a könyvben is (8. táblázat). Ezt a mintanagyságtól függőhibahatárt célszerű kissé megemelni, hogy a nem mintavételi hibákat is tartalmazza. Rosszabbminőségű kutatások esetén nagyobb növelés indokolt, mint jobb minőségű kutatások esetén.



90



91

A 29. táblázatot úgy használhatjuk, hogy megkeressük a két vizsgálat hibahatára alapján jellemzőcellát, és az ott talált értéket összehasonlítjuk a két becslés közötti eltéréssel. Ha a két becslés közöttieltérés meghaladja a táblázatban közölt értéket, akkor 95%-os biztonsággal következtethetünkarra, hogy a populációban a két felvétel között változás történt. Itt a 95%-os megbízhatóságjelentése az, hogy ha ezt a döntési eljárást sokszor alkalmaznánk, akkor azokat az eseteket nézve,amikor valójában nincs változás a populációban (azaz a szavazati arányok ugyanazok maradtak),az alkalmazások 95%-ában erre a következtetésre jutnánk – helyesen.

Például tegyük fel, hogy az első vizsgálat egy 2000 elemű mintán alapult, és az A párt szavazóinakarányára 15%-os becslést adott. A második vizsgálat egy 1000 elemű mintán alapult, és a pártszavazóinak arányát 13%-nak találta. Tegyük még fel, hogy sem az első, sem pedig a másodikvizsgálatot készítő közvélemény-kutató cégről nem tételezzük fel, hogy szisztematikusan torzítanaaz A párt szavazóinak arányát illetően. A könyvben korábban közölt táblázat szerint a 2000 fősmintához 2,2%-os hibahatár tartozik, az 1000 fős mintához 3,2%-os hibahatár. Végül tegyükfel, hogy az első közvélemény-kutatás készítőit kissé kevésbé tekintjük megbízhatónak, mint amásodikat készítő céget, és ennek megfelelően az első kutatás hibahatárát 3%-nak, a másodikét 4%-nak választjuk. Az ezekhez a hibahatárokhoz tartozó érték a 29. táblázatban 5,0%. Ez azt jelenti,hogy a két becslésnek ilyen hibahatárok mellett 5,0%-kal kellene eltérnie egymástól ahhoz, hogy95%-os biztonsággal állíthassuk, hogy a populációban is eltér a párt szavazóinak aránya abban a kétidőpontban, amikor a közvélemény-kutatások készültek. A jelen példában tehát a becsült értékekeltérése 95%-os megbízhatósággal nem indokolja, hogy eltérőnek tekintsük a párt szavazóinakarányát a két időpontban.

Ha valaki nem kívánja az egyes közvélemény-kutatások hibahatárát a mintanagyság és a kutatásminőségére vonatkozó megfontolások alapján saját maga megbecsülni (valóban, a vizsgálatminőségéről általában rendelkezésre álló információk nem teszik lehetővé ezt a kvantifikálást),akkor hagyatkozhat a közvélemény-kutatás készítői által megadott hibahatárra, feltéve, hogy eztaz információt közlik. Ennek a hibahatárnak az összehasonlítása a mintanagyságból számíthatóhibahatárral (ezek megtalálhatóak ebben a könyvben táblázat formájában) információt adhat arranézve, hogy a publikált hibahatár tartalmazza-e a nem mintavételi hiba hatását is. Ha a publikálthibahatár meghaladja a mintanagyságból következő értéket, például egy 1000 fős minta eseténa hibahatárt 5%-nak adják meg (holott a mintanagyság alapján 3,2% lenne), akkor feltehetőlega nemválaszolók és egyéb hibanövelő tényezők miatt alkalmazott korrekcióról van szó. Ekkorhasználhatjuk a publikált hibahatárt. Természetesen kérdéses, hogy vajon a kutatás készítőihelyesen becsülik-e meg a saját munkájukra jellemző hibahatárt.

Mindenesetre a 29. táblázatban szereplő értékek azt mutatják, hogy meglehetősen nagy becsülteltérésekre van szükség ahhoz, hogy ezekből nagy biztonsággal következtethessünk a párt szavazóiszámának tényleges megváltozására a két felvétel között eltelt időben. Ebből az következik, hogya gyakran újságok címoldalára kerülő állítás, mely szerint egy párt népszerűsége növekedett egykorábbi közvélemény-kutatás óta – azon az alapon, hogy 2 vagy 3 százalékkal többen állították amintában, hogy erre a pártra szavaznának – legalábbis megkérdőjelezhető. Ekkora eltérés a politikaiközvélemény-kutatásokban szokásos mintanagyságok mellett csak nagyon gyenge bizonyítékot



92

jelent az előbbi állítás esetén, hiszen ez meglehetősen sokszor előfordulhat a mintában akkoris, amikor a populációra jellemző érték nem változott. Amennyiben a vizsgált mennyiség nemegyszerűen a magukat egy bizonyos pártot választóknak valló válaszolók aránya a mintában, hanemennél bonyolultabb, képzett mennyiség (például ezek aránya a szavazni szándékozók között vagyegyik párt előnye egy másik párttal szemben a szavazni szándékozók között), akkor természetesena 24. táblázat alkalmazásában az ezekre a mennyiségekre jellemző – nagyobb – hibahatárt kellalkalmazni, ahogyan azt az előző fejezetben bemutattuk.

ÖsszefoglalásKülönböző időpontokban különböző közvélemény-kutató cégek által végzett felmérésekeredményeinek összehasonlításánál az esetleges valódi eltérésre mindkét vizsgálat hibájarárakódhat.

A változások valódi voltáról hozható döntés mindkét vizsgálat hibahatárától és a tapasztalt eltérésnagyságától is függ.

A hibahatár valódi értékét a mintanagyság és a vizsgálat végrehajtásának minősége befolyásolja.

Bizonyos közvélemény-kutató cégek eredményei rendszeresen torzíthatnak egyik vagy másik pártjavára.

Ha a torzításra vonatkozó ismeret rendelkezésre áll, ezt az eredmények összehasonlításában felkell használni.

93

11. Miért jók a közvélemény-kutatások?Mindezek után az olvasó joggal teheti fel a kérdést, hogy vajon hihetünk-e a közvélemény-kutatások eredményeinek. Ha ilyen sokféle hibát lehet elkövetni, ráadásul ezen hibák jelentősrésze nem kvantifikálható, akkor vajon érdemes-e közvélemény-kutatásokat készíteni? Másképpenfogalmazva, ha ilyen sok hibát lehet véteni a valódi közvélemény megismerésére irányulóvizsgálatokban, akkor vajon a közvélemény-kutatásoknak a közvéleményt feltáró funkciójánálnem fontosabb-e ezeknek a vizsgálatoknak a közvéleményt befolyásoló funkciója? Másokpedig azt kérdezhetik, hogy a közvélemény-kutatások sok szakmai sikere (például választásokeredményeinek gyakran meglepően pontos előrejelzése) csak a véletlen különös kegyének tudható-e be, vagy az önbeteljesítő jóslatok sok ismételgetésének (azaz a közvélemény manipulálásának)az eredménye-e.

Mindezek teljesen indokolt kérdések, és az alábbiakban megpróbálom az olvasó elé tárni sajátválaszaimat. Hangsúlyozni kell, hogy míg a könyv korábbi részében leírt állítások jórésztmatematikai jellegű tények és ezek következményei, illetve senki által nem vitatott módszertanitapasztalatok, az itteni kérdésekre adható válaszok inkább csak vélekedések, még ha álláspontomatbizonyos tények alá is támasztják.

Először is szeretném leszögezni, hogy nem minden közvélemény-kutatás eredményei jók (azaztükrözik viszonylag pontosan a valóságot). Még a legjobban dolgozó közvélemény-kutató cégekkelis előfordulhat, hogy egy-egy vizsgálat eredményei pontatlanok. Ez a mintavételi eljárás véletlenjellege és néhány más tényező miatt elkerülhetetlen. Ugyanakkor nagyon sok olyan közvélemény-kutatás eredményeit publikálták már, amelyek igen pontosan közelítették a valóságot. Választásieredményeket nemegyszer 1–2 százalékpont pontossággal jeleznek előre közvélemény-kutatások.Hogyan is lehetséges ez?

A legfontosabb ok az, hogy a könyv korábbi részeiben tárgyalt különböző hibaforrások mindegyikeeredményez valamekkora hibát, de ezen hibák az esetek többségében részben kiegyenlítikegymást. Egy jól végrehajtott közvélemény-kutatás esetében nagyon csekély a valószínűségeannak, hogy valamennyi hibaforrás ugyanolyan előjelű hibát produkáljon. Például az, hogy egyadott párt szavazóinak arányát vizsgálva valamennyi hibaforrás abba az irányba hasson, hogy avalóságnál nagyobb arányt adjon a vizsgálat eredménye, aligha fordul elő. Általában az történik,hogy a hibaforrások egy része pozitív (a valóságnál nagyobb), más része negatív torzítást (avalóságnál kisebb érték) eredményez. Ezek a hibák részben kiegyenlítik egymást, ahelyett, hogyösszeadódnának. Például, ha egy vizsgálatban tizenegy lehetséges hiba (mintavétel, a mintábakerült személyek meg nem találása, nem válaszolás stb.) játszik szerepet, és valamennyi hiba 2%-os eltérést eredményez, akkor sokkal valószínűbb, hogy ezek közül hat pozitív és öt negatív lesz –végül a hiba 2% –, mint az, hogy mind a tizenegy hiba pozitív lesz – ami 22% hibát eredményezne.Ez azonban csak akkor várható, ha a közvélemény-kutatás készítői szakmájuk szabályait betartják.Ha egy közvélemény-kutatás készítői – akaratlanul vagy akaratlagosan – a vizsgálat mindenlépésében előnyben részesítik egy párt szavazóit, akkor a hibák könnyen összeadódhatnak.

11. Miért jók aközvélemény-kutatások?

94

Ebben a könyvben főleg arról volt szó, hogy melyek azok a veszélyek, amelyeket a közvélemény-kutatások készítőinek el kell kerülniük, és arról, hogy az eredmények felhasználója hogyan ítélhetimeg a végzett munka minőségét. Nagyon keveset foglalkoztunk azzal, hogy milyen konkrételjárásokkal lehet a hibák nagyságát csökkenteni, és ezzel valószínűvé tenni a valósághoz közelieredményeket. Éppen ezeknek az eljárásoknak az ismerete és alkalmazása biztosítja azt, hogy akülönböző okokra visszavezethető hibák várhatóan egyenként is kicsik legyenek, és azt is, hogyszámíthassunk közöttük a kiegyenlítődésre.

Megítélésem szerint a fentiek adják a lényegében helyes választ azokra a kérdésekre, hogyhihetünk-e a közvélemény-kutatásoknak, illetve, hogy miért olyan jók a közvélemény-kutatásokeredményei. Azokra a kérdésekre, hogy a közvélemény-kutatások vajon befolyásolják-e aközvéleményt, ez szerepet játszik-e eredményességükben, illetve ez a szerepük nem lényegesebb-e, mint deklarált céljuk, nincs és nem is lehetséges általános érvényű válasz. Mindenesetre akármitis gondolnak a közvélemény-kutatások ellenzői és hívei ezekről a kérdésekről, vitathatatlan, hogya közvélemény-kutatások gyakran pontos képet adnak a közvéleményről, és ezért eredményeiketfigyelembe kell venni. Ebből a szempontból érdektelen, hogy ennek oka az, hogy a közvélemény-kutatások jól tükrözik a közvéleményt, vagy pedig az, hogy a közvélemény-kutatások sikeresenbefolyásolják azt.

A közvélemény-kutatások esetleges közvéleményt befolyásoló szerepe, illetve ennek mértékeszámos tényezőtől függ, amelyek közül legfontosabb az, hogy milyen kérdéssel kapcsolatbanvizsgáljuk a közvéleményt. A közvélemény-befolyásoló hatás bizonyos kérdésekben erősebblehet, míg másokban gyengébb. A közvélemény-befolyásoló szerep lehetséges nagysága erősenkultúrafüggő, és emiatt, még ha léteznének is empirikus vizsgálatok arra nézve, hogy aközvélemény-kutatások mennyire képesek befolyásolni a közvéleményt, ezek az eredményekcsak erős megszorításokkal lennének átvihetőek az egyik országról a másikra. Ezen túlmenőennagyon nehéz lenne egy olyan vizsgálatot végrehajtani, amely empirikus bizonyítékkal szolgálnaa közvélemény-kutatások közvéleményt befolyásoló szerepével kapcsolatban. Ehhez arra lenneszükség, hogy először megvizsgálják a közvéleményt valamely kérdésben, ezután a közvéleményegy részének tudomására hozzák az eredményeket, majd megnézzék, hogy a közvélemény-kutatáseredményeiről informáltak véleménye másként változott-e meg, mint azoké, akik nem értesültekaz eredményekről.

Egy ilyen vizsgálat lehetőségének elemzése előtt meg kell jegyezni, hogy a vizsgálat, még hamegvalósítható is, nem azt mérné, vajon a közvélemény-kutatás hatására változott-e az emberekvéleménye, hanem azt, hogy az eredmények publikálása hatott-e a véleményekre. Elméletilegvilágos, hogy önmagában az a tény, hogy valakinek a véleményét megkérdezik valamiről,befolyásolhatja a véleményét (hát még az, hogy hogyan kérdezik meg a véleményét!), de ennekhatása nem mérhető, mert egy ilyen méréshez az összehasonlíthatóság érdekében a megkérdezéselőtt, azaz megkérdezés nélkül is kellene ismerni az emberek véleményét, ami az ehhez avizsgálathoz szükséges pontossággal lehetetlen. Ráadásul még ha a megkérdezés befolyásolja is anéhány ezer megkérdezett egy részének a véleményét, nyilván nem befolyásolja a populáció óriási


95

többségének (azoknak, akiket nem kérdeztek meg) a véleményét. Tehát vizsgálatunk legfeljebb aztmérheti, hogy a közvélemény-kutatás eredményeinek publikálása befolyásolja-e a közvéleményt.

Próbáljuk meg megtervezni ezt a vizsgálatot! Legelőször egy olyan témát kell választani, amelykellően fontos, hogy az embereknek legyen róla véleménye, és ez a fontosság motiválja amegkérdezetteket a pontos válaszadásra. Ha azt kérdezzük, hogy a fehér, vagy a sárga színt szereti-e jobban a megkérdezett, akkor ez a közvélemény-kutatást meglehetősen komolytalanná teszi amegkérdezettek szemében, és attól kell majd tartanunk, hogy sok véletlenszerű választ kapunk,ami az eredmények értékelését lehetetlenné teszi. Ezért egy fontos kérdésre van szükség, példáularra, hogy melyik pártra szavazna. (Természetesen a színre vonatkozó kérdés is lehet fontos, hapéldául egy város lakóit kérdezik meg arról, hogy egy középületet milyen színűre fessenek.) Azeredményeket ezután közzé kell tenni a közvélemény-kutatások esetében szokásos módokon, majdújra megkérdezni az embereket ugyanarról a kérdésről, és megnézni, hogy azok véleménye, akikaz eredményekről értesültek, másként változott-e, mint azoké, akik nem tudnak az eredményekről.

Ha a két csoport véleménye hasonlóan változott, akkor nem következtethetünk arra, hogy aközvélemény-kutatás befolyásolta a véleményeket. Ha a két csoport véleménye eltérően változott– nos ebből sem következtethetünk a közvélemény-kutatás hatására, hiszen a két csoport másféleemberekből áll, akiknek véleménye sok más okból is eltérően változhat. A két csoport közöttikülönbség abból származik, hogy az egyik tagjai elolvassák az újságokban, vagy meghallgatjáka rádióban a (például politikai) közvélemény-kutatások eredményeit, a másik csoport tagjai nem.Tehát az első csoport tagjai jobban érdeklődnek a politika iránt, esetleg gyakrabban olvasnakújságot, feltehetőleg magasabb az iskolai végzettségük, stb. Ezért könnyen elképzelhető, hogyvéleményük a közvélemény-kutatástól függetlenül is másként változik, mint a kevésbé érdeklődőcsoporté.

Ezt a problémát csak úgy oldhatnák meg a kísérlet tervezői, ha ők döntenék el, hogy kikértesülnek a közvélemény-kutatás eredményeiről, és kik nem. Általános kísérlettervezési elvekezen túlmenően még azt is megkívánják, hogy a kísérlet résztvevőit véletlenszerűen osszák azeredményekről értesülők, illetve nem értesülők csoportjaiba. Csak így remélhetjük, hogy a kétcsoport azonos lesz, és ha véleményük eltérően változik, akkor az kizárólag a közvélemény-kutatás eredményei megismerésének tudható be. Ha a kísérletet így akarják végrehajtani, akkor nemlehet a közvélemény-kutatás eredményeit a szokásos módokon közölni (hiszen az újságot bárkielolvashatja), hanem más megoldást kell választani. Például az eredményeket nem publikálják,hanem a kiválasztottaknak levélben megküldik. Ekkor értékelhető a vélemények esetlegesen eltérőmegváltozása a két csoportban. Ha a vélemények eltérő módon változnak a két csoportban, akkoraz a közvélemény-kutatás eredményei megismerésének tudható be. Már csak az a kérdés marad,hogy ha egy megkérdezettel személyre szóló levélben tudatjuk azt, hogy melyik a legnépszerűbbpárt, és ez esetleg a saját véleményének a megváltoztatására készteti, akkor vajon ugyanezt ahatást tételezhetjük-e fel a közvélemény-kutatás eredményeinek a sajtóban szokásos módon történőpublikálásáról.


96

Mindezen nehézségek miatt a közvélemény-kutatások esetleges közvéleményt befolyásolóhatására vonatkozó empirikus bizonyíték nemigen áll rendelkezésre, és biztosan állíthatjuk,hogy Magyarországra nézve ilyen bizonyíték nincs. Érdekes adalék ezzel kapcsolatban (azAmerikai Egyesült Államokból), hogy az „Ön kire szavazna?” kérdésnél általában pontosabbelőrejelzést lehet adni a választások győzteséről annak a kérdésnek az alapján, hogy „Ön szerintki nyeri a választásokat?”. Ezt a tényt úgy is értelmezhetjük, hogy az emberek meg tudjákkülönböztetni saját véleményüket a közvéleménytől. Ugyanakkor a választások utáni felmérésekalkalmával a megkérdezetteknek nagyobb hányada állítja, hogy ő a győztes pártra szavazott, mintamekkora a győztes tényleges szavazati aránya volt. Itt nyilván befolyásolással állunk szemben,de nem a közvélemény-kutatás az, ami befolyásol, hanem a választások tényleges eredményénekmegismerése.

ÖsszefoglalásNem igaz, hogy minden közvélemény-kutatás jó eredményeket ad, de a helyesen megválasztottmódszerekkel végzett közvélemény-kutatások az esetek nagy többségében majdnem pontoseredményekre vezetnek. Ennek oka azon túlmenően, hogy a különböző hibák kicsik, az, hogya hibák kiegyenlítődnek. A gyakran igen pontos eredmények jelentik a közvélemény-kutatásokhasznát.

Az ellenzők fő érvét – hogy a közvélemény-kutatások befolyásolnák a közvéleményt – nemtámasztja alá empirikus bizonyíték.

Documents

Rudas, Tamás - tankonyvtar.hu · 2 Az első kiadás előszavából 1936-ban az Amerikai Egyesült Államok elnöke, Franklin Delano Roosevelt másodszori megválasztásáért küzdött