Valószínuségszámítás és statisztika afizikában
2019. május 3.
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adat, minta, statisztikus sokaság
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikai vizsgálat
Egy statisztikai vizsgálat során
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikai vizsgálat
Egy statisztikai vizsgálat során
• vannak adataink valamirol,
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikai vizsgálat
Egy statisztikai vizsgálat során
• vannak adataink valamirol,
• és ezek alapján próbálunk következtetéseket levonni.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikai vizsgálat
Egy statisztikai vizsgálat során
• vannak adataink valamirol,
• és ezek alapján próbálunk következtetéseket levonni.
• Az esetek dönto többségében ezek a következtetések vagy egyparaméter értékére, vagy egy esemény valószínuségérevonatkoznak.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
ADATOK
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adattípusok
• Kvantitatív adatok: méréseket vagy leszámlálásokat jellemzoszámok.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adattípusok
• Kvantitatív adatok: méréseket vagy leszámlálásokat jellemzoszámok.
• Kvalitatív adatok: kategóriákra bonthatók, melyeket valamilyennemnumerikus jellemzok alapján különböztetünk meg, pl. férfi/no.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adattípusok
• A kvantitatív adattípust tovább bonthatjuk:
- diszkrét: amikor a lehetséges adatok száma véges vagymegszámlálható. (Pl. tyúkok által tojt tojások száma).
- folytonos: amikor az adat végtelen sok lehetséges értéketvehet fel egy folytonos skálán. (Pl. a tehén által naponta adotttej mennyisége literben).
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdattípusokA mérések szintje
Egy másik lehetoség az adatok jellemzésére, hogy megadjuk aszintjüket.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdattípusokA mérések szintje
• Nominális szintu mérés: elnevezéseket, címkéket, vagykategóriákat tartalmazó adatok, melyeket nem lehet valami szerintrendezni.Pl.: kérdoíves válasznál igen, nem, nem tudom.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdattípusokA mérések szintje
• Nominális szintu mérés: elnevezéseket, címkéket, vagykategóriákat tartalmazó adatok, melyeket nem lehet valami szerintrendezni.Pl.: kérdoíves válasznál igen, nem, nem tudom.
• Ordinális szintu mérés: olyan adatok, melyeket lehet rendezni, deaz adatok közti különbségeknek nincs értelmük, vagy nem lehetmeghatározni.Pl.: egyetemek sorrendje, érdemjegyek mint jeles, jó, közepes, stb.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdattípusokA mérések szintje
• Nominális szintu mérés: elnevezéseket, címkéket, vagykategóriákat tartalmazó adatok, melyeket nem lehet valami szerintrendezni.Pl.: kérdoíves válasznál igen, nem, nem tudom.
• Ordinális szintu mérés: olyan adatok, melyeket lehet rendezni, deaz adatok közti különbségeknek nincs értelmük, vagy nem lehetmeghatározni.Pl.: egyetemek sorrendje, érdemjegyek mint jeles, jó, közepes, stb.
• Intervallum szintu mérés: rendezheto adatok, melyeknél akülönbségeknek is van értelmük, de nincs természetes nullpont(ami pl. valamilyen mennyiség nemlétét jelezné), és emiatt azarányoknak nincs értelme.Pl.: évek mint 1848 vagy 1526, beérkezési idok egy kísérletnél, stb.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdattípusokA mérések szintje
• Nominális szintu mérés: elnevezéseket, címkéket, vagykategóriákat tartalmazó adatok, melyeket nem lehet valami szerintrendezni.Pl.: kérdoíves válasznál igen, nem, nem tudom.
• Ordinális szintu mérés: olyan adatok, melyeket lehet rendezni, deaz adatok közti különbségeknek nincs értelmük, vagy nem lehetmeghatározni.Pl.: egyetemek sorrendje, érdemjegyek mint jeles, jó, közepes, stb.
• Intervallum szintu mérés: rendezheto adatok, melyeknél akülönbségeknek is van értelmük, de nincs természetes nullpont(ami pl. valamilyen mennyiség nemlétét jelezné), és emiatt azarányoknak nincs értelme.Pl.: évek mint 1848 vagy 1526, beérkezési idok egy kísérletnél, stb.
• Arány szintu mérés: az adatok rendezhetok, a különbségnek vanértelme és van természetes nullpont, ami azt jelzi, hogy az adottmérendo mennyiség nincs jelen. Ekkor az arányoknak is vanértelmePl.: árak (a 0Ft azt jelenti, hogy az adott termék vagy szolgáltatásnem kerül semmibe). ¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Tipikus problémák adatgyujtésnél:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Tipikus problémák adatgyujtésnél:
• Kis minták.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Tipikus problémák adatgyujtésnél:
• Kis minták.
• Kérdések sorrendjétol függ a válasz:
- Ön mit mondana, a közlekedési vagy az ipari légszennyezésmagasabb? (45% - 27%)
- Ön mit mondana, az ipari vagy a közlekedési légszennyezésmagasabb? (24% - 57%)
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Tipikus problémák adatgyujtésnél:
• Kis minták.
• Kérdések sorrendjétol függ a válasz:
- Ön mit mondana, a közlekedési vagy az ipari légszennyezésmagasabb? (45% - 27%)
- Ön mit mondana, az ipari vagy a közlekedési légszennyezésmagasabb? (24% - 57%)
• Közvélemény-kutatásnál a nem válaszolók. (Általában különböznekazoktól, akik válaszolnak).
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Tipikus problémák adatgyujtésnél:
• Kis minták.
• Kérdések sorrendjétol függ a válasz:
- Ön mit mondana, a közlekedési vagy az ipari légszennyezésmagasabb? (45% - 27%)
- Ön mit mondana, az ipari vagy a közlekedési légszennyezésmagasabb? (24% - 57%)
• Közvélemény-kutatásnál a nem válaszolók. (Általában különböznekazoktól, akik válaszolnak).
• Érdekelt adatgyujtok (pl. gyógyszercégek).
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Tipikus problémák adatgyujtésnél:
• Kis minták.
• Kérdések sorrendjétol függ a válasz:
- Ön mit mondana, a közlekedési vagy az ipari légszennyezésmagasabb? (45% - 27%)
- Ön mit mondana, az ipari vagy a közlekedési légszennyezésmagasabb? (24% - 57%)
• Közvélemény-kutatásnál a nem válaszolók. (Általában különböznekazoktól, akik válaszolnak).
• Érdekelt adatgyujtok (pl. gyógyszercégek).
• Önkényes szelekció a figyelembe vett adatok között.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Adatgyujtés fajtái:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Adatgyujtés fajtái:• Megfigyeléses vizsgálat (observational study): bizonyos jellemzo
tulajdonságok megfigyelése és mérése anélkül, hogymegváltoztatnánk a vizsgálat tárgyát/alanyát.Pl.: csillagászati/asztrofizikai megfigyelések.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Adatgyujtés fajtái:• Megfigyeléses vizsgálat (observational study): bizonyos jellemzo
tulajdonságok megfigyelése és mérése anélkül, hogymegváltoztatnánk a vizsgálat tárgyát/alanyát.Pl.: csillagászati/asztrofizikai megfigyelések.
• Kísérlet (experiment): valamilyen kezelést végzünk és utánamegfigyeljük a hatásait a kísérlet tárgyán/alanyán.Pl.: klinikai gyógyszervizsgálat, részecske ütköztetések aCERN-ben.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Adatgyujtés fajtái:• Megfigyeléses vizsgálat (observational study): bizonyos jellemzo
tulajdonságok megfigyelése és mérése anélkül, hogymegváltoztatnánk a vizsgálat tárgyát/alanyát.Pl.: csillagászati/asztrofizikai megfigyelések.
• Kísérlet (experiment): valamilyen kezelést végzünk és utánamegfigyeljük a hatásait a kísérlet tárgyán/alanyán.Pl.: klinikai gyógyszervizsgálat, részecske ütköztetések aCERN-ben.
• Utólagos vizsgálat (retrospective study): múltbéli adatokathasználunk (amik nem is feltétlenül az általunk vizsgált kérdésszempontjából lettek rögzítve).Pl.: autóbalesetben meghaltak és másban meghaltakösszehasonlítása.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Adatgyujtés fajtái:• Megfigyeléses vizsgálat (observational study): bizonyos jellemzo
tulajdonságok megfigyelése és mérése anélkül, hogymegváltoztatnánk a vizsgálat tárgyát/alanyát.Pl.: csillagászati/asztrofizikai megfigyelések.
• Kísérlet (experiment): valamilyen kezelést végzünk és utánamegfigyeljük a hatásait a kísérlet tárgyán/alanyán.Pl.: klinikai gyógyszervizsgálat, részecske ütköztetések aCERN-ben.
• Utólagos vizsgálat (retrospective study): múltbéli adatokathasználunk (amik nem is feltétlenül az általunk vizsgált kérdésszempontjából lettek rögzítve).Pl.: autóbalesetben meghaltak és másban meghaltakösszehasonlítása.
• Elore tervezett vizsgálat (prospective study): az adatokat ajövoben gyujtjük olyan csoportokból, melyek valamilyen közösfaktorban megegyeznek.Pl.: a mobilt használó és nem használó vezetok csoportjainakösszehasonlítása. ¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
• Vak és duplán vak vizsgálat: a vizsgálat alanya nem tudja, hogykezelést kap vagy placebót, duplán vak esetben a kísérletezo semtudja.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésZavar
• Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletetvégzo nem tudja megkülönböztetni az egyes faktorokat.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésZavar
• Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletetvégzo nem tudja megkülönböztetni az egyes faktorokat.
Pl.: Indén mindenkitol levonunk 1 pontot, ha nem jelenik meg azeloadáson, javul-e a részvételi arány? Tfh., hogy javul. De lehet,hogy tavaly reggel 8-kor volt az eloadás, és azért nem jártak. A kétfaktor nem különböztetheto meg.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésZavar
• Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletetvégzo nem tudja megkülönböztetni az egyes faktorokat.
Pl.: Indén mindenkitol levonunk 1 pontot, ha nem jelenik meg azeloadáson, javul-e a részvételi arány? Tfh., hogy javul. De lehet,hogy tavaly reggel 8-kor volt az eloadás, és azért nem jártak. A kétfaktor nem különböztetheto meg.
• A kísérletet lehetoleg úgy kell megtervezni, hogy ne lépjen fel zavar.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésBlokkosítás
A zavar elkerülését segítheti a blokkosítás:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésBlokkosítás
A zavar elkerülését segítheti a blokkosítás:
• Felosztjuk a populációt olyan alcsoportokra, melyekben a kísérletszempontjából fontos tulajdonságok megegyeznek.
• Mindegyik blokkban véletlenszeruen választjuk ki a kezelteket.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésBlokkosítás
A zavar elkerülését segítheti a blokkosítás:
• Felosztjuk a populációt olyan alcsoportokra, melyekben a kísérletszempontjából fontos tulajdonságok megegyeznek.
• Mindegyik blokkban véletlenszeruen választjuk ki a kezelteket.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésBlokkosítás
A zavar elkerülését segítheti a blokkosítás:
• Felosztjuk a populációt olyan alcsoportokra, melyekben a kísérletszempontjából fontos tulajdonságok megegyeznek.
• Mindegyik blokkban véletlenszeruen választjuk ki a kezelteket.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésRandomizált és kontrollált
• Egy elterjedt módszer a teljesenrandomizált (véletlenszerusített)elrendezés:Véletlenszeruen választjuk ki azokat, akikkezelést kapnak
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésRandomizált és kontrollált
• Egy elterjedt módszer a teljesenrandomizált (véletlenszerusített)elrendezés:Véletlenszeruen választjuk ki azokat, akikkezelést kapnak
• Egy másik megközelítés a szigorúankontrollált elrendezés:Nagyon körültekintoen kiválasztott egyedek,pl. ha vérnyomáscsökkentot tesztelünk és azegyik blokkban van egy 30 éves túlsúlyos,cigarettázó férfi, aki szereti a sós és zsírosételeket, akkor a másik blokkba is teszünkilyet.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
STATISZTIKUS SOKASÁG ÉS MINTA
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaság
Statisztikus sokaság
Definíció: a statisztikai vizsgálat tárgyát képezo egyedek összességét ahozzájuk tartozó (szempontunkból érdekes) adatokkal együtt egystatisztikai sokaságnak vagy populációnak hívjuk.
Példák
• Magyarországi lakosok testmagassága, életkora, vérnyomása, stb.
• Folyó vízállása, közutak vagy routerek terheltsége, tozsdeiárfolyam, stb.
• Telefonbeszélgetések hossza, hívások közti várakozási ido,kozmikus részecskék észlelése, stb.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaság
Statisztikus sokaság
Definíció: a statisztikai vizsgálat tárgyát képezo egyedek összességét ahozzájuk tartozó (szempontunkból érdekes) adatokkal együtt egystatisztikai sokaságnak vagy populációnak hívjuk.
Példák
• Magyarországi lakosok testmagassága, életkora, vérnyomása, stb.
• Folyó vízállása, közutak vagy routerek terheltsége, tozsdeiárfolyam, stb.
• Telefonbeszélgetések hossza, hívások közti várakozási ido,kozmikus részecskék észlelése, stb.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaság
Statisztikus sokaság
Definíció: a statisztikai vizsgálat tárgyát képezo egyedek összességét ahozzájuk tartozó (szempontunkból érdekes) adatokkal együtt egystatisztikai sokaságnak vagy populációnak hívjuk.
Példák
• Magyarországi lakosok testmagassága, életkora, vérnyomása, stb.
• Folyó vízállása, közutak vagy routerek terheltsége, tozsdeiárfolyam, stb.
• Telefonbeszélgetések hossza, hívások közti várakozási ido,kozmikus részecskék észlelése, stb.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaságSokaság eloszlása
Statisztikai sokaság eloszlása
• Ha a vizsgálat tárgyát képezo egyedek száma N, akkor mindenegyes egyed 1/N valószínuséggel fordul elo, illetve ha az egyedekegy A részhalmaza k egyedet tartalmaz, akkor annak valószínuségek/N.
• Ezzel a statisztikai sokaság valószínuségi mezové válik, azegyedekhez tartozó számértékek pedig egy X valószínuségiváltozóvá.
→ Definíció: az így kapott X eloszlását hívjuk a a statisztikaisokaság eloszlásának.
• Amennyiben több számérték is érdekel minket egyedenként, asokaság több dimenzióssá válik, és a X1,X2, . . . ,Xn együtteseloszlását nevezzük a sokaság eloszlásának.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaságSokaság eloszlása
Statisztikai sokaság eloszlása
• Ha a vizsgálat tárgyát képezo egyedek száma N, akkor mindenegyes egyed 1/N valószínuséggel fordul elo, illetve ha az egyedekegy A részhalmaza k egyedet tartalmaz, akkor annak valószínuségek/N.
• Ezzel a statisztikai sokaság valószínuségi mezové válik, azegyedekhez tartozó számértékek pedig egy X valószínuségiváltozóvá.
→ Definíció: az így kapott X eloszlását hívjuk a a statisztikaisokaság eloszlásának.
• Amennyiben több számérték is érdekel minket egyedenként, asokaság több dimenzióssá válik, és a X1,X2, . . . ,Xn együtteseloszlását nevezzük a sokaság eloszlásának.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaságSokaság eloszlása
Statisztikai sokaság eloszlása
• Ha a vizsgálat tárgyát képezo egyedek száma N, akkor mindenegyes egyed 1/N valószínuséggel fordul elo, illetve ha az egyedekegy A részhalmaza k egyedet tartalmaz, akkor annak valószínuségek/N.
• Ezzel a statisztikai sokaság valószínuségi mezové válik, azegyedekhez tartozó számértékek pedig egy X valószínuségiváltozóvá.
→ Definíció: az így kapott X eloszlását hívjuk a a statisztikaisokaság eloszlásának.
• Amennyiben több számérték is érdekel minket egyedenként, asokaság több dimenzióssá válik, és a X1,X2, . . . ,Xn együtteseloszlását nevezzük a sokaság eloszlásának.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaságSokaság eloszlása
Statisztikai sokaság eloszlása
• Ha a vizsgálat tárgyát képezo egyedek száma N, akkor mindenegyes egyed 1/N valószínuséggel fordul elo, illetve ha az egyedekegy A részhalmaza k egyedet tartalmaz, akkor annak valószínuségek/N.
• Ezzel a statisztikai sokaság valószínuségi mezové válik, azegyedekhez tartozó számértékek pedig egy X valószínuségiváltozóvá.
→ Definíció: az így kapott X eloszlását hívjuk a a statisztikaisokaság eloszlásának.
• Amennyiben több számérték is érdekel minket egyedenként, asokaság több dimenzióssá válik, és a X1,X2, . . . ,Xn együtteseloszlását nevezzük a sokaság eloszlásának.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Minta
Minta, mintavételezés
Definíció: ha a statisztikai sokaságból kiválasztunk n egyedet, akkor ahozzájuk tartozó x1, x2, ..., xn értékek egy n elemu mintát adnak.Definíció: az x1, x2, ..., xn függetlenek, ha
• visszatevéssel választottuk oket,
• (visszatevés nélkül, de a sokaság mérete gyakorlatilag végtelen).
• Ha a minta megegyezik a populációval, akkor cenzusról beszélünk.
¼¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Minta
Minta, mintavételezés
Definíció: ha a statisztikai sokaságból kiválasztunk n egyedet, akkor ahozzájuk tartozó x1, x2, ..., xn értékek egy n elemu mintát adnak.Definíció: az x1, x2, ..., xn függetlenek, ha
• visszatevéssel választottuk oket,
• (visszatevés nélkül, de a sokaság mérete gyakorlatilag végtelen).
• Ha a minta megegyezik a populációval, akkor cenzusról beszélünk.
¼¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Mintavételezés
• Véletlen mintavétel: a populáció minden tagjának ugyanakkoraesélye van a bekerülésre.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Mintavételezés
• Véletlen mintavétel: a populáció minden tagjának ugyanakkoraesélye van a bekerülésre.
• Egyszeru n hosszúságú véletlen mintavétel: minden nhosszúságú mintának ugyanakkora a kiválasztási esélye.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Mintavételezés
• Véletlen mintavétel: a populáció minden tagjának ugyanakkoraesélye van a bekerülésre.
• Egyszeru n hosszúságú véletlen mintavétel: minden nhosszúságú mintának ugyanakkora a kiválasztási esélye.
• Szisztematikus mintavétel: valamilyen kezdoponttól indulvakiválasztjuk minden K-adik elemet a populációból.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Mintavételezés
• Véletlen mintavétel: a populáció minden tagjának ugyanakkoraesélye van a bekerülésre.
• Egyszeru n hosszúságú véletlen mintavétel: minden nhosszúságú mintának ugyanakkora a kiválasztási esélye.
• Szisztematikus mintavétel: valamilyen kezdoponttól indulvakiválasztjuk minden K-adik elemet a populációból.
Problémás lehet, ha a populáció is szisztematikusan van rendezve.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Mintavételezés
• Kényelmes mintavétel: használjuk azt a mintát, amit alegkönnyebb beszerezni.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Mintavételezés
• Rétegzett mintavétel: felosztjuk a populációt rétegekre(csoportokra), melyeken belül a kísérlet szempontjából fontostulajdonságok azonosak vagy hasonlók, majd mintát veszünkmindegyik rétegbol.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Mintavételezés
• Klaszter mintavétel: felosztjuk a populációt valamilyentermészetes módon (pl. irányítószám alapján) klaszterekre,véletlenszeruen választunk a klaszterek közül, majd a kiválasztottklaszter összes tagját használjuk.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Paraméter és statisztika
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Paraméter és statisztika
Paraméter
A statisztikai sokaságot (populációt) jellemzo numerikus érték a sokáságegy paramétere.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Paraméter és statisztika
Paraméter
A statisztikai sokaságot (populációt) jellemzo numerikus érték a sokáságegy paramétere.
Statisztikai következtetés
Definíció: ha a minta alapján következtetünk valamire valamilyenvalószínuséggel, az statisztikai következtetés, vagy rövidenstatisztika. Ezt szokták még becslésnek is nevezni.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Paraméter és statisztika
Paraméter
A statisztikai sokaságot (populációt) jellemzo numerikus érték a sokáságegy paramétere.
Statisztikai következtetés
Definíció: ha a minta alapján következtetünk valamire valamilyenvalószínuséggel, az statisztikai következtetés, vagy rövidenstatisztika. Ezt szokták még becslésnek is nevezni.
Példa
• A magyarországi lakosok magasságának várható értéke egyparaméter,
• és pl. egy 1000 fos mintán a magasságok átlaga az egy ezzelkapcsolatos statisztika.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Paraméter és statisztika
populáció Ð→ minta
↕ ↕
paraméter ←Ð statisztika
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaságParaméteres becslés
Paraméteres és nem paraméteres becslések
Definíció: egy statisztikai következtetés paraméteres becslés, haismerjük a X eloszlásának típusát, és ez alapján az eloszlás valamelyparaméterére következtetünk.(Pl. tudjuk, hogy binomiális, és meg akarjuk becsülni p-t).Ha nem ismerjük az eloszlás típusát, akkor nem paraméteres becslésrolbeszélünk.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaságParaméteres becslés
Paraméteres és nem paraméteres becslések
Definíció: egy statisztikai következtetés paraméteres becslés, haismerjük a X eloszlásának típusát, és ez alapján az eloszlás valamelyparaméterére következtetünk.(Pl. tudjuk, hogy binomiális, és meg akarjuk becsülni p-t).Ha nem ismerjük az eloszlás típusát, akkor nem paraméteres becslésrolbeszélünk.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaságParaméteres becslés
Paraméteres és nem paraméteres becslések
Definíció: egy statisztikai következtetés paraméteres becslés, haismerjük a X eloszlásának típusát, és ez alapján az eloszlás valamelyparaméterére következtetünk.(Pl. tudjuk, hogy binomiális, és meg akarjuk becsülni p-t).Ha nem ismerjük az eloszlás típusát, akkor nem paraméteres becslésrolbeszélünk.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus eloszlás
Empirikus eloszlásfüggvény
• Tegyük fel, hogy n elemu, független mintánk van, x1, x2, ..., xn
értékekkel.
→ Ezen belül minden minta elem 1/n valószínuségu. (Természetesentöbb minta elemhez is társulhat ugyanaz az x érték).
Definíció: a minta empirikus eloszlásfüggvénye:
F(x) ∶= 1n∣{i ∣ xi < x}∣ = ∑
i∶ xi<x
1n,
azaz ha összesen k olyan minta elem van, melyekre xi < x, akkorF(x) = k/n.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus eloszlás
Empirikus eloszlásfüggvény
• Tegyük fel, hogy n elemu, független mintánk van, x1, x2, ..., xn
értékekkel.
→ Ezen belül minden minta elem 1/n valószínuségu. (Természetesentöbb minta elemhez is társulhat ugyanaz az x érték).
Definíció: a minta empirikus eloszlásfüggvénye:
F(x) ∶= 1n∣{i ∣ xi < x}∣ = ∑
i∶ xi<x
1n,
azaz ha összesen k olyan minta elem van, melyekre xi < x, akkorF(x) = k/n.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus eloszlás
Empirikus eloszlásfüggvény
• Tegyük fel, hogy n elemu, független mintánk van, x1, x2, ..., xn
értékekkel.
→ Ezen belül minden minta elem 1/n valószínuségu. (Természetesentöbb minta elemhez is társulhat ugyanaz az x érték).
Definíció: a minta empirikus eloszlásfüggvénye:
F(x) ∶= 1n∣{i ∣ xi < x}∣ = ∑
i∶ xi<x
1n,
azaz ha összesen k olyan minta elem van, melyekre xi < x, akkorF(x) = k/n.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus eloszlás
Példa
• Tegyük fel, hogy a táblázatban látható cipoméreteket mértük egy 20fos csoportban. Milyen lesz a cipoméret empirikuseloszlásfüggvénye?
méret hány?38-as 139-es 240-es 441-es 442-es 743-as 2
∑ = 20
207
x
F(x)
44 42 40 38 36 0
0.2
0.4
0.6
0.8
1
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
• Mi lesz az empirikus suruségfüggvény?Mivel az empirikus eloszlás mindig diszkrét, szigorú értelemben ittis csak hisztogramról beszélhetünk suruségfüggvény helyett:
• felosztjuk az x tengelyt ∆x nagyságú intervallumokra,• intervallumonként a hisztogram konstans; értéke, h egy adott
[x, x +∆x], intervallumra:
h ⋅∆x = kn→ h = k
n∆x
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
• Mi lesz az empirikus suruségfüggvény?Mivel az empirikus eloszlás mindig diszkrét, szigorú értelemben ittis csak hisztogramról beszélhetünk suruségfüggvény helyett:
• felosztjuk az x tengelyt ∆x nagyságú intervallumokra,• intervallumonként a hisztogram konstans; értéke, h egy adott
[x, x +∆x], intervallumra:
h ⋅∆x = kn→ h = k
n∆x
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
• Mi lesz az empirikus suruségfüggvény?Mivel az empirikus eloszlás mindig diszkrét, szigorú értelemben ittis csak hisztogramról beszélhetünk suruségfüggvény helyett:
• felosztjuk az x tengelyt ∆x nagyságú intervallumokra,• intervallumonként a hisztogram konstans; értéke, h egy adott
[x, x +∆x], intervallumra:
h ⋅∆x = kn→ h = k
n∆x
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
Példa
Hogy fog kinézni a cipoméret eloszlás hisztogramja az elozo példánál?(Itt ∆x = 1 a természetes választás.)
7
20
x
h(x)
0
0.2
0.4
0.6
0.8
1
36 38 40 42 44
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
• Mi történik, ha hatványszeruen lassan cseng le a suruségfüggvény?
→ Amennyiben ρ(x) ∼ x−α , elofordulhat, hogy ha azonos méretu ∆x-ethasználunk az eloforduló x-ek teljes tartományán, akkor a nagyértékek felé a hisztogram „kilaposodik”!
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
Pl. a Magyar Wikipédia, mint hálózat fokszámeloszlásának empirikussuruségfüggvénye konstans ∆k = 1 esetén:
k
h(k)
300 250 200 150 100 50 0 0
0.1
0.2
0.3
0.4
0.5
0.7
0.6
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
Pl. a Magyar Wikipédia, mint hálózat fokszámeloszlásának empirikussuruségfüggvénye konstans ∆k = 1 esetén:
k
h(k)
0.001
0.01
0.1
1
100 10 1 0.0001
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
Pl. a Magyar Wikipédia, mint hálózat fokszámeloszlásának empirikussuruségfüggvénye konstans ∆k = 1 esetén:
k
h(k)
0.001
0.01
0.1
1
100 10 1 0.0001
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
→ Ilyenkor célszeru a konstans ∆x helyett
• vagy exponenciálisan növekvo ∆x-et használni, ez a„logarithmic binning”, (ami logaritmikus skálán tunik konstansméretunek),
• vagy eloírni egy minimális esetszámot intervallumonként, ésezen kritérium szerint beállítani egy dinamikusan változó∆x-et.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
→ Ilyenkor célszeru a konstans ∆x helyett
• vagy exponenciálisan növekvo ∆x-et használni, ez a„logarithmic binning”, (ami logaritmikus skálán tunik konstansméretunek),
• vagy eloírni egy minimális esetszámot intervallumonként, ésezen kritérium szerint beállítani egy dinamikusan változó∆x-et.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
A Magyar Wikipédia, mint hálózat fokszámeloszlásának empirikussuruségfüggvénye exponenciálisan növekvo ∆k esetén:
k
h(k)
1
1e−05
1e−06
0.0001
0.001
0.01
0.1
1
10
10 100
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
Megjegyzés: ha csak a hatványszeru lecsengés érdekel minket (pl. ahatványkitevo), akkor azt az empirikus eloszlásfüggvény is megmutatja,(és ott nem kell a ∆x-ekkel veszodni):
k
1−F(k)~k
1−F(k)
−α+1
0.0001
0.001
0.01
0.1
1
1 10 100
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
Empirikus várható érték
Definíció: Az empirikus várható érték a minta átlagával azonos:
x ∶= x1 + x2 +⋯ + xn
n= 1
n
n
∑i=1
xi.
A nagy számok törvényei alapján xPÐ→ ⟨X⟩,
(illetve ha ⟨X4⟩ korlátos, akkor eros értelemben is konvergál).
Empirikus szórásnégyzet
Definíció: Az empirikus szórásnégyzet az empirikus átlagtól valónégyzetes eltérés átlaga:
S2 ∶= (x1 − x)2 + (x2 − x)2 +⋯ + (xn − x)2
n= 1
n
n
∑i=1
(xi − x)2.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
Empirikus várható érték
Definíció: Az empirikus várható érték a minta átlagával azonos:
x ∶= x1 + x2 +⋯ + xn
n= 1
n
n
∑i=1
xi.
A nagy számok törvényei alapján xPÐ→ ⟨X⟩,
(illetve ha ⟨X4⟩ korlátos, akkor eros értelemben is konvergál).
Empirikus szórásnégyzet
Definíció: Az empirikus szórásnégyzet az empirikus átlagtól valónégyzetes eltérés átlaga:
S2 ∶= (x1 − x)2 + (x2 − x)2 +⋯ + (xn − x)2
n= 1
n
n
∑i=1
(xi − x)2.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
Empirikus várható érték
Definíció: Az empirikus várható érték a minta átlagával azonos:
x ∶= x1 + x2 +⋯ + xn
n= 1
n
n
∑i=1
xi.
A nagy számok törvényei alapján xPÐ→ ⟨X⟩,
(illetve ha ⟨X4⟩ korlátos, akkor eros értelemben is konvergál).
Empirikus szórásnégyzet
Definíció: Az empirikus szórásnégyzet az empirikus átlagtól valónégyzetes eltérés átlaga:
S2 ∶= (x1 − x)2 + (x2 − x)2 +⋯ + (xn − x)2
n= 1
n
n
∑i=1
(xi − x)2.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
• Mi az empirikus szórásnégyzet várható értéke?
Empirikus szórásnégyzet várható értéke ¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
• Mi az empirikus szórásnégyzet várható értéke?
→ Korábban a szórás tárgyalásánál már levezettük,
⟨S2⟩ = n − 1n
σ2
Empirikus szórásnégyzet várható értéke ¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
• Mi az empirikus szórásnégyzet várható értéke?
→ Korábban a szórás tárgyalásánál már levezettük,
⟨S2⟩ = n − 1n
σ2
Korrigált empirikus szórásnégyzet
A fentiek alapján a korrigált empirikus szórásnégyzet:
S∗2 ∶= nn − 1
S2 = 1n − 1
n
∑i=1
(xi − x)2.
Empirikus szórásnégyzet várható értéke ¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
• Mi az empirikus szórásnégyzet várható értéke?
→ Korábban a szórás tárgyalásánál már levezettük,
⟨S2⟩ = n − 1n
σ2
Korrigált empirikus szórásnégyzet
A fentiek alapján a korrigált empirikus szórásnégyzet:
S∗2 ∶= nn − 1
S2 = 1n − 1
n
∑i=1
(xi − x)2.
Ennek várható értéke már megegyezik a sokaság szórásnégyzetével,
⟨S∗2⟩ = nn − 1
⟨S2⟩ = σ2.
Empirikus szórásnégyzet várható értéke ¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus kvantilisek
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus kvantilisek
• Hogyan lehetne pl. a kvartiliseket megbecsülni a minta alapján?
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus kvantilisek
• Hogyan lehetne pl. a kvartiliseket megbecsülni a minta alapján?
- Rendezzük a mintákat érték alapján,
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus kvantilisek
• Hogyan lehetne pl. a kvartiliseket megbecsülni a minta alapján?
- Rendezzük a mintákat érték alapján,- és a mintaelemek elso negyedénél lesz az alsó kvartilis,
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus kvantilisek
• Hogyan lehetne pl. a kvartiliseket megbecsülni a minta alapján?
- Rendezzük a mintákat érték alapján,- és a mintaelemek elso negyedénél lesz az alsó kvartilis,- (a felénél van a medián),
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus kvantilisek
• Hogyan lehetne pl. a kvartiliseket megbecsülni a minta alapján?
- Rendezzük a mintákat érték alapján,- és a mintaelemek elso negyedénél lesz az alsó kvartilis,- (a felénél van a medián),- és a háromnegyedénél a felso kvartilis.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Boxplot
• Egy adathalmaz 5-szám összesítoje:
1) a minimum,2) az alsó kvartilis, Q1,3) a medián, Q2,4) a felso kvartilis Q3,5) a maximum.
• Ezeket egy ún. boxplot-ban szokás összefoglalni:
• Az adathalmaz terjedelme (angolul range) a maximum és minimumközti különbség.
• Az interkvartilis terjedelem (IQR): Q3 −Q1.¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Boxplot
A boxplot néhány eloszlásfajta esetén:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Boxplot
A boxplot néhány eloszlásfajta esetén:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Outlier
• A kiugró értékeket hívjuk outlier-nek:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Outlier
• A kiugró értékeket hívjuk outlier-nek:
- outlier, ha Q3-at meghaladja az IQR másfélszeresével,- outlier, ha Q1-nél több mint IQR másfélszeresével kisebb.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Outlier
• A kiugró értékeket hívjuk outlier-nek:
- outlier, ha Q3-at meghaladja az IQR másfélszeresével,- outlier, ha Q1-nél több mint IQR másfélszeresével kisebb.
• Az outlier-eknek drámai hatása lehet az átlagra és a szórásra.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Outlier
• A kiugró értékeket hívjuk outlier-nek:
- outlier, ha Q3-at meghaladja az IQR másfélszeresével,- outlier, ha Q1-nél több mint IQR másfélszeresével kisebb.
• Az outlier-eknek drámai hatása lehet az átlagra és a szórásra.
• Ezeket általában külön csillaggal jelöljük, és a maradék adatokracsinálunk box-plotot.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Boxplot
A boxplot akkor igazán érdekes, ha több mintát hasonlítunk összeegymással:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Boxplot
A boxplot akkor igazán érdekes, ha több mintát hasonlítunk összeegymással:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Boxplot
A boxplot akkor igazán érdekes, ha több mintát hasonlítunk összeegymással:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Boxplot
A boxplot akkor igazán érdekes, ha több mintát hasonlítunk összeegymással:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Különösen fontos az az eset, amikor a statisztikai sokaságnormális eloszlású, ami azt jelenti, hogy X eloszlása normális,X ∼ N (µ,σ).
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Különösen fontos az az eset, amikor a statisztikai sokaságnormális eloszlású, ami azt jelenti, hogy X eloszlása normális,X ∼ N (µ,σ).
• Természetesen ilyenkor az xi mintaelemekre is tekinthetünk úgy,mint µ várható értéku és σ szórású normális eloszlású függetlenváltozókra, xi ∼ N (µ,σ).
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz x eloszlása?
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz x eloszlása?Mivel a normális eloszlás stabil,
n
∑i=1
xi ∈ N (nµ,√
nσ), x = 1n
n
∑i=1
xi
→ x ∈ N (µ, σ√n)
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz S2 eloszlása?
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz S2 eloszlása?
S2 = 1n
n
∑i=1
(xi − x)2 = 1n
n
∑i=1
⎛⎝
xi −1n
n
∑j=1
xj⎞⎠
2
=
1n
n
∑i=1
⎡⎢⎢⎢⎢⎣x2
i −2xi
n
n
∑j=1
xj +1n2
⎛⎝
n
∑j=1
xj⎞⎠
2⎤⎥⎥⎥⎥⎦=
1n
n
∑i=1
x2i −
2n2
n
∑i,j=1
xixj +1n2
⎛⎝
n
∑j=1
x2j + 2∑
j<kxjxk
⎞⎠=
1n
n
∑i=1
x2i −
2n2
⎛⎝
n
∑i=1
x2i + 2∑
i<jxixj
⎞⎠+ 1
n2
⎛⎝
n
∑j=1
x2j + 2∑
j<kxjxk
⎞⎠=
(1n− 1
n2)
n
∑i=1
x2i −
2n2 ∑
i<jxixj =
n − 1n
1n
n
∑i=1
x2i −
2n2 ∑
i<jxixj
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz S2 eloszlása?
S2 = n − 1n
1n
n
∑i=1
x2i −
2n2 ∑
i<jxixj
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz S2 eloszlása?
S2 = n − 1n
1n
n
∑i=1
x2i −
2n2 ∑
i<jxixj
Bevezetünk egy új változót, melynek eloszlása standard normális,
zi =xi − µσ
xi = µ + σzi, zi ∈ N (0, 1),
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz S2 eloszlása?
S2 = n − 1n
1n
n
∑i=1
x2i −
2n2 ∑
i<jxixj
Bevezetünk egy új változót, melynek eloszlása standard normális,
zi =xi − µσ
xi = µ + σzi, zi ∈ N (0, 1),ezzel
S2 = n − 1n
1n
n
∑i=1
(µ2 + 2µσzi + σ2z2i ) −
2n2 ∑
i<j(µ2 + µσzi + µσzj + σ2zjzj) =
n − 1n
µ2 + n − 1n
2nµσ
n
∑i=1
zi +n − 1
n1nσ2
n
∑i=1
z2i
− 2n2
n(n − 1)2
µ2 − 2n2
(n − 1)µσn
∑i=1
zi −2n2σ2∑
i<jzizj
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz S2 eloszlása?
S2 = n − 1n
1n
n
∑i=1
x2i −
2n2 ∑
i<jxixj
Bevezetünk egy új változót, melynek eloszlása standard normális,
zi =xi − µσ
xi = µ + σzi, zi ∈ N (0, 1),ezzel
S2 = σ2 n − 1n
1n
n
∑i=1
z2i − σ2 2
n2 ∑i<j
zizj
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz S2 eloszlása?
S2 = n − 1n
1n
n
∑i=1
x2i −
2n2 ∑
i<jxixj
Bevezetünk egy új változót, melynek eloszlása standard normális,
zi =xi − µσ
xi = µ + σzi, zi ∈ N (0, 1),ezzel
S2 = σ2 n − 1n
1n
n
∑i=1
z2i − σ2 2
n2 ∑i<j
zizj
Bevezetünk még egy új változót, y ∶= nS2
σ2 , melyre
y = n − 1n
n
∑i=1
z2i −
2n∑i<j
zjzj = (1 − 1n)
n
∑i=1
z2i −
2n∑i<j
zizj.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az y változó suruségfüggvénye és karakterisztikus függvénye:
ρ(y) = ∬ ⋯∫ dz1⋯dznδ⎛⎝
y − (1 − 1n)
n
∑i=1
z2i −
2n∑i<j
zizj⎞⎠×
× 1√2π
e−z212
1√2π
e−z222 ⋯ 1√
2πe−
z2n2
ϕy(t) =∞
∫−∞
ρ(y)eitydy =∬ ⋯∫dz1⋯dzn
(2π) n2
eit(1− 1
n )n∑i=1
z2i − 2it
n ∑i<jzizj− 1
2
n∑i=1
z2i
Az exponensben lévo kifejezés felfogható úgy, mint egy mátrixszendvicselés:
it (1 − 1n)
n
∑i=1
z2i −
2itn∑i<j
zizj −12
n
∑i=1
z2i = −zAz
A =⎛⎜⎜⎜⎝
12 − it (1 − 1
n)itn
itn ⋯
itn
12 − it (1 − 1
n)itn ⋯
itn
itn
12 − it (1 − 1
n) ⋯⋮ ⋮ ⋮ ⋱
⎞⎟⎟⎟⎠
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az y változó suruségfüggvénye és karakterisztikus függvénye:
ρ(y) = ∬ ⋯∫ dz1⋯dznδ⎛⎝
y − (1 − 1n)
n
∑i=1
z2i −
2n∑i<j
zizj⎞⎠×
× 1√2π
e−z212
1√2π
e−z222 ⋯ 1√
2πe−
z2n2
ϕy(t) =∞
∫−∞
ρ(y)eitydy =∬ ⋯∫dz1⋯dzn
(2π) n2
eit(1− 1
n )n∑i=1
z2i − 2it
n ∑i<jzizj− 1
2
n∑i=1
z2i
Az exponensben lévo kifejezés felfogható úgy, mint egy mátrixszendvicselés:
it (1 − 1n)
n
∑i=1
z2i −
2itn∑i<j
zizj −12
n
∑i=1
z2i = −zAz
A =⎛⎜⎜⎜⎝
12 − it (1 − 1
n)itn
itn ⋯
itn
12 − it (1 − 1
n)itn ⋯
itn
itn
12 − it (1 − 1
n) ⋯⋮ ⋮ ⋮ ⋱
⎞⎟⎟⎟⎠
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Ezzel a ϕy(t) karakterisztikus függvény:
ϕy(t) =∬ ⋯∫dz1⋯dzn
(2π) n2
e−zAz = 1(2π) n
2
√πn
det A,
hiszen A saját rendszerére áttérve
Avi = λivi, det A =n
∏i=1λi,
∞
∫−∞
e−αx2=√π
α
ϕy(t) =∬ ⋯∫du1⋯dun
(2π) n2
e−
n∑i=1λiu
2i =
∞
∫−∞
du1√2π
e−λ1u21 ×
∞
∫−∞
du2√2π
e−λ2u22 ×⋯ ×
∞
∫−∞
dun√2π
e−λnu2n =
n
∏i=1
1√2π
√π
λi.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Ezzel a ϕy(t) karakterisztikus függvény:
ϕy(t) =∬ ⋯∫dz1⋯dzn
(2π) n2
e−zAz = 1(2π) n
2
√πn
det A,
hiszen A saját rendszerére áttérve
Avi = λivi, det A =n
∏i=1λi,
∞
∫−∞
e−αx2=√π
α
ϕy(t) =∬ ⋯∫du1⋯dun
(2π) n2
e−
n∑i=1λiu
2i =
∞
∫−∞
du1√2π
e−λ1u21 ×
∞
∫−∞
du2√2π
e−λ2u22 ×⋯ ×
∞
∫−∞
dun√2π
e−λnu2n =
n
∏i=1
1√2π
√π
λi.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az A determinánsának meghatározásához eloször felbontjuk:
A = (12− it)
⎛⎜⎜⎜⎜⎜⎝
1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
+ itn
⎛⎜⎜⎜⎜⎜⎝
1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
Ez alapján egy tetszoleges v =⎛⎜⎝
v1
⋮vn
⎞⎟⎠
esetén
Av = (12− it) v + it
n
n
∑i=1
vi
⎛⎜⎝
1⋮1
⎞⎟⎠.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az A determinánsának meghatározásához eloször felbontjuk:
A = (12− it)
⎛⎜⎜⎜⎜⎜⎝
1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
+ itn
⎛⎜⎜⎜⎜⎜⎝
1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
Ez alapján egy tetszoleges v =⎛⎜⎝
v1
⋮vn
⎞⎟⎠
esetén
Av = (12− it) v + it
n
n
∑i=1
vi
⎛⎜⎝
1⋮1
⎞⎟⎠.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az A determinánsának meghatározásához eloször felbontjuk:
A = (12− it)
⎛⎜⎜⎜⎜⎜⎝
1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
+ itn
⎛⎜⎜⎜⎜⎜⎝
1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
Ez alapján egy tetszoleges v =⎛⎜⎝
v1
⋮vn
⎞⎟⎠
esetén
Av = (12− it) v + it
n
n
∑i=1
vi
⎛⎜⎝
1⋮1
⎞⎟⎠.
Az A sajátvektorai:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az A determinánsának meghatározásához eloször felbontjuk:
A = (12− it)
⎛⎜⎜⎜⎜⎜⎝
1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
+ itn
⎛⎜⎜⎜⎜⎜⎝
1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
Ez alapján egy tetszoleges v =⎛⎜⎝
v1
⋮vn
⎞⎟⎠
esetén
Av = (12− it) v + it
n
n
∑i=1
vi
⎛⎜⎝
1⋮1
⎞⎟⎠.
Az A sajátvektorai:
• Han∑i=1
vi = 0 teljesül, akkor ezen belül v tetszoleges lehet, azaz ez
egy n − 1 dimenziós altér n − 1 darab λ = ( 12 − it) sajátértékkel.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az A determinánsának meghatározásához eloször felbontjuk:
A = (12− it)
⎛⎜⎜⎜⎜⎜⎝
1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
+ itn
⎛⎜⎜⎜⎜⎜⎝
1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
Ez alapján egy tetszoleges v =⎛⎜⎝
v1
⋮vn
⎞⎟⎠
esetén
Av = (12− it) v + it
n
n
∑i=1
vi
⎛⎜⎝
1⋮1
⎞⎟⎠.
Az A sajátvektorja:
• Han∑i=1
vi ≠ 0 akkor a sajátvektor v =⎛⎜⎝
1⋮1
⎞⎟⎠
, a sajátérték
λ = (12− it) + it
nn = 1
2¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az A determinánsának meghatározásához eloször felbontjuk:
A = (12− it)
⎛⎜⎜⎜⎜⎜⎝
1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
+ itn
⎛⎜⎜⎜⎜⎜⎝
1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
Ez alapján egy tetszoleges v =⎛⎜⎝
v1
⋮vn
⎞⎟⎠
esetén
Av = (12− it) v + it
n
n
∑i=1
vi
⎛⎜⎝
1⋮1
⎞⎟⎠.
Az A determinánsa:
det A = 12⋅ (1
2− it)
n−1
.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
A ϕy(t) karakterisztikus függvény:
ϕy(t) = 1(2π) n
2
√πn
det A= 1
(2π) n2
¿ÁÁÀ πn
12 ⋅ (
12 − it)n−1 = 1
(1 − 2it) n−12.
→ Ez egy n − 1 szabadsági fokú χ2 eloszlás karakterisztikus függvénye!
→ ρ(y) = yn−3
2
2n−1
2 Γ ( n−12 )
e−y2 ,
Az empirikus szórásnégyzet eloszlása
A fentiek alapján az S2 eloszlása egy átskálázott, n − 1 szabadsági fokúχ2 eloszlás, hiszen S2 = σ2y
n
χ2 -eloszlás karakterisztikus függvénye Konfidencia–intervallum ¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Az S2 eloszlása, ρ(y) transzformálásával:
ρS2(x) = ρχ2n−1
( nxσ2
) nσ2
= nσ2
( nxσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−nx
2σ2 ,
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Az S2 eloszlása, ρ(y) transzformálásával:
ρS2(x) = ρχ2n−1
( nxσ2
) nσ2
= nσ2
( nxσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−nx
2σ2 ,
• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Az S2 eloszlása, ρ(y) transzformálásával:
ρS2(x) = ρχ2n−1
( nxσ2
) nσ2
= nσ2
( nxσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−nx
2σ2 ,
• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:
- Az y = nS2
σ2 változó eloszlása χ2n−1, ezért a várható értéke
⟨y⟩ = n − 1.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Az S2 eloszlása, ρ(y) transzformálásával:
ρS2(x) = ρχ2n−1
( nxσ2
) nσ2
= nσ2
( nxσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−nx
2σ2 ,
• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:
- Az y = nS2
σ2 változó eloszlása χ2n−1, ezért a várható értéke
⟨y⟩ = n − 1.- Ez alapján S2 = σ2y
n várható értéke ⟨S2⟩ = n−1n σ
2, ami teljesenkonzisztens a korábban levezetett eredménnyel.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Az S2 eloszlása, ρ(y) transzformálásával:
ρS2(x) = ρχ2n−1
( nxσ2
) nσ2
= nσ2
( nxσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−nx
2σ2 ,
• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:
- Az y = nS2
σ2 változó eloszlása χ2n−1, ezért a várható értéke
⟨y⟩ = n − 1.- Ez alapján S2 = σ2y
n várható értéke ⟨S2⟩ = n−1n σ
2, ami teljesenkonzisztens a korábban levezetett eredménnyel.
• Viszont a χ2 eloszlásra vonatkozó ismereteink alapján most már S2
szórásnégyzetét is meg tudjuk adni:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Az S2 eloszlása, ρ(y) transzformálásával:
ρS2(x) = ρχ2n−1
( nxσ2
) nσ2
= nσ2
( nxσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−nx
2σ2 ,
• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:
- Az y = nS2
σ2 változó eloszlása χ2n−1, ezért a várható értéke
⟨y⟩ = n − 1.- Ez alapján S2 = σ2y
n várható értéke ⟨S2⟩ = n−1n σ
2, ami teljesenkonzisztens a korábban levezetett eredménnyel.
• Viszont a χ2 eloszlásra vonatkozó ismereteink alapján most már S2
szórásnégyzetét is meg tudjuk adni:
- Az y szórásnégyzete V(y) = V(χ2n−1) = 2(n − 1).
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Az S2 eloszlása, ρ(y) transzformálásával:
ρS2(x) = ρχ2n−1
( nxσ2
) nσ2
= nσ2
( nxσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−nx
2σ2 ,
• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:
- Az y = nS2
σ2 változó eloszlása χ2n−1, ezért a várható értéke
⟨y⟩ = n − 1.- Ez alapján S2 = σ2y
n várható értéke ⟨S2⟩ = n−1n σ
2, ami teljesenkonzisztens a korábban levezetett eredménnyel.
• Viszont a χ2 eloszlásra vonatkozó ismereteink alapján most már S2
szórásnégyzetét is meg tudjuk adni:
- Az y szórásnégyzete V(y) = V(χ2n−1) = 2(n − 1).
- Ez alapján
V(S2) = 2(n − 1)σ4
n2.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Mi a helyzet a korrigált empirikus szórásnégyzettel?
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Mi a helyzet a korrigált empirikus szórásnégyzettel?
→ A definíció alapján S∗2 = nn−1 S2 = σ2y
n−1 , ezért
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Mi a helyzet a korrigált empirikus szórásnégyzettel?
→ A definíció alapján S∗2 = nn−1 S2 = σ2y
n−1 , ezért
- a suruségfüggvény
ρS∗2(x) = ρχ2n−1
((n − 1)xσ2
) (n − 1)σ2
= n − 1σ2
( (n−1)xσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−(n−1)x
2σ2 ,
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Mi a helyzet a korrigált empirikus szórásnégyzettel?
→ A definíció alapján S∗2 = nn−1 S2 = σ2y
n−1 , ezért
- a suruségfüggvény
ρS∗2(x) = ρχ2n−1
((n − 1)xσ2
) (n − 1)σ2
= n − 1σ2
( (n−1)xσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−(n−1)x
2σ2 ,
- a várható érték ⟨S∗2⟩ = σ2
n−1 ⟨χ2n−1⟩ = σ2,
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Mi a helyzet a korrigált empirikus szórásnégyzettel?
→ A definíció alapján S∗2 = nn−1 S2 = σ2y
n−1 , ezért
- a suruségfüggvény
ρS∗2(x) = ρχ2n−1
((n − 1)xσ2
) (n − 1)σ2
= n − 1σ2
( (n−1)xσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−(n−1)x
2σ2 ,
- a várható érték ⟨S∗2⟩ = σ2
n−1 ⟨χ2n−1⟩ = σ2,
- és a szórás
V(S∗2) = σ4
(n − 1)2V(χ2
n−1) =2(n − 1)σ4
(n − 1)2= 2σ4
n − 1.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Mi a helyzet a korrigált empirikus szórásnégyzettel?
→ A definíció alapján S∗2 = nn−1 S2 = σ2y
n−1 , ezért
- a suruségfüggvény
ρS∗2(x) = ρχ2n−1
((n − 1)xσ2
) (n − 1)σ2
= n − 1σ2
( (n−1)xσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−(n−1)x
2σ2 ,
- a várható érték ⟨S∗2⟩ = σ2
n−1 ⟨χ2n−1⟩ = σ2,
- és a szórás
V(S∗2) = σ4
(n − 1)2V(χ2
n−1) =2(n − 1)σ4
(n − 1)2= 2σ4
n − 1.
• Azt kaptuk, hogy a korrigált empirikus szórásnégyzet szórásais csökken a mintaszámmal, mégpedig úgy mint 1/(n − 1).
¼