Valószínuségszámítás és statisztika a...

Preview:

Citation preview

Valószínuségszámítás és statisztika afizikában

2019. május 3.

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adat, minta, statisztikus sokaság

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Statisztikai vizsgálat

Egy statisztikai vizsgálat során

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Statisztikai vizsgálat

Egy statisztikai vizsgálat során

• vannak adataink valamirol,

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Statisztikai vizsgálat

Egy statisztikai vizsgálat során

• vannak adataink valamirol,

• és ezek alapján próbálunk következtetéseket levonni.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Statisztikai vizsgálat

Egy statisztikai vizsgálat során

• vannak adataink valamirol,

• és ezek alapján próbálunk következtetéseket levonni.

• Az esetek dönto többségében ezek a következtetések vagy egyparaméter értékére, vagy egy esemény valószínuségérevonatkoznak.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

ADATOK

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adattípusok

• Kvantitatív adatok: méréseket vagy leszámlálásokat jellemzoszámok.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adattípusok

• Kvantitatív adatok: méréseket vagy leszámlálásokat jellemzoszámok.

• Kvalitatív adatok: kategóriákra bonthatók, melyeket valamilyennemnumerikus jellemzok alapján különböztetünk meg, pl. férfi/no.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adattípusok

• A kvantitatív adattípust tovább bonthatjuk:

- diszkrét: amikor a lehetséges adatok száma véges vagymegszámlálható. (Pl. tyúkok által tojt tojások száma).

- folytonos: amikor az adat végtelen sok lehetséges értéketvehet fel egy folytonos skálán. (Pl. a tehén által naponta adotttej mennyisége literben).

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

AdattípusokA mérések szintje

Egy másik lehetoség az adatok jellemzésére, hogy megadjuk aszintjüket.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

AdattípusokA mérések szintje

• Nominális szintu mérés: elnevezéseket, címkéket, vagykategóriákat tartalmazó adatok, melyeket nem lehet valami szerintrendezni.Pl.: kérdoíves válasznál igen, nem, nem tudom.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

AdattípusokA mérések szintje

• Nominális szintu mérés: elnevezéseket, címkéket, vagykategóriákat tartalmazó adatok, melyeket nem lehet valami szerintrendezni.Pl.: kérdoíves válasznál igen, nem, nem tudom.

• Ordinális szintu mérés: olyan adatok, melyeket lehet rendezni, deaz adatok közti különbségeknek nincs értelmük, vagy nem lehetmeghatározni.Pl.: egyetemek sorrendje, érdemjegyek mint jeles, jó, közepes, stb.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

AdattípusokA mérések szintje

• Nominális szintu mérés: elnevezéseket, címkéket, vagykategóriákat tartalmazó adatok, melyeket nem lehet valami szerintrendezni.Pl.: kérdoíves válasznál igen, nem, nem tudom.

• Ordinális szintu mérés: olyan adatok, melyeket lehet rendezni, deaz adatok közti különbségeknek nincs értelmük, vagy nem lehetmeghatározni.Pl.: egyetemek sorrendje, érdemjegyek mint jeles, jó, közepes, stb.

• Intervallum szintu mérés: rendezheto adatok, melyeknél akülönbségeknek is van értelmük, de nincs természetes nullpont(ami pl. valamilyen mennyiség nemlétét jelezné), és emiatt azarányoknak nincs értelme.Pl.: évek mint 1848 vagy 1526, beérkezési idok egy kísérletnél, stb.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

AdattípusokA mérések szintje

• Nominális szintu mérés: elnevezéseket, címkéket, vagykategóriákat tartalmazó adatok, melyeket nem lehet valami szerintrendezni.Pl.: kérdoíves válasznál igen, nem, nem tudom.

• Ordinális szintu mérés: olyan adatok, melyeket lehet rendezni, deaz adatok közti különbségeknek nincs értelmük, vagy nem lehetmeghatározni.Pl.: egyetemek sorrendje, érdemjegyek mint jeles, jó, közepes, stb.

• Intervallum szintu mérés: rendezheto adatok, melyeknél akülönbségeknek is van értelmük, de nincs természetes nullpont(ami pl. valamilyen mennyiség nemlétét jelezné), és emiatt azarányoknak nincs értelme.Pl.: évek mint 1848 vagy 1526, beérkezési idok egy kísérletnél, stb.

• Arány szintu mérés: az adatok rendezhetok, a különbségnek vanértelme és van természetes nullpont, ami azt jelzi, hogy az adottmérendo mennyiség nincs jelen. Ekkor az arányoknak is vanértelmePl.: árak (a 0Ft azt jelenti, hogy az adott termék vagy szolgáltatásnem kerül semmibe). ¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adatgyujtés

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adatgyujtés

Tipikus problémák adatgyujtésnél:

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adatgyujtés

Tipikus problémák adatgyujtésnél:

• Kis minták.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adatgyujtés

Tipikus problémák adatgyujtésnél:

• Kis minták.

• Kérdések sorrendjétol függ a válasz:

- Ön mit mondana, a közlekedési vagy az ipari légszennyezésmagasabb? (45% - 27%)

- Ön mit mondana, az ipari vagy a közlekedési légszennyezésmagasabb? (24% - 57%)

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adatgyujtés

Tipikus problémák adatgyujtésnél:

• Kis minták.

• Kérdések sorrendjétol függ a válasz:

- Ön mit mondana, a közlekedési vagy az ipari légszennyezésmagasabb? (45% - 27%)

- Ön mit mondana, az ipari vagy a közlekedési légszennyezésmagasabb? (24% - 57%)

• Közvélemény-kutatásnál a nem válaszolók. (Általában különböznekazoktól, akik válaszolnak).

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adatgyujtés

Tipikus problémák adatgyujtésnél:

• Kis minták.

• Kérdések sorrendjétol függ a válasz:

- Ön mit mondana, a közlekedési vagy az ipari légszennyezésmagasabb? (45% - 27%)

- Ön mit mondana, az ipari vagy a közlekedési légszennyezésmagasabb? (24% - 57%)

• Közvélemény-kutatásnál a nem válaszolók. (Általában különböznekazoktól, akik válaszolnak).

• Érdekelt adatgyujtok (pl. gyógyszercégek).

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adatgyujtés

Tipikus problémák adatgyujtésnél:

• Kis minták.

• Kérdések sorrendjétol függ a válasz:

- Ön mit mondana, a közlekedési vagy az ipari légszennyezésmagasabb? (45% - 27%)

- Ön mit mondana, az ipari vagy a közlekedési légszennyezésmagasabb? (24% - 57%)

• Közvélemény-kutatásnál a nem válaszolók. (Általában különböznekazoktól, akik válaszolnak).

• Érdekelt adatgyujtok (pl. gyógyszercégek).

• Önkényes szelekció a figyelembe vett adatok között.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adatgyujtés

Adatgyujtés fajtái:

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adatgyujtés

Adatgyujtés fajtái:• Megfigyeléses vizsgálat (observational study): bizonyos jellemzo

tulajdonságok megfigyelése és mérése anélkül, hogymegváltoztatnánk a vizsgálat tárgyát/alanyát.Pl.: csillagászati/asztrofizikai megfigyelések.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adatgyujtés

Adatgyujtés fajtái:• Megfigyeléses vizsgálat (observational study): bizonyos jellemzo

tulajdonságok megfigyelése és mérése anélkül, hogymegváltoztatnánk a vizsgálat tárgyát/alanyát.Pl.: csillagászati/asztrofizikai megfigyelések.

• Kísérlet (experiment): valamilyen kezelést végzünk és utánamegfigyeljük a hatásait a kísérlet tárgyán/alanyán.Pl.: klinikai gyógyszervizsgálat, részecske ütköztetések aCERN-ben.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adatgyujtés

Adatgyujtés fajtái:• Megfigyeléses vizsgálat (observational study): bizonyos jellemzo

tulajdonságok megfigyelése és mérése anélkül, hogymegváltoztatnánk a vizsgálat tárgyát/alanyát.Pl.: csillagászati/asztrofizikai megfigyelések.

• Kísérlet (experiment): valamilyen kezelést végzünk és utánamegfigyeljük a hatásait a kísérlet tárgyán/alanyán.Pl.: klinikai gyógyszervizsgálat, részecske ütköztetések aCERN-ben.

• Utólagos vizsgálat (retrospective study): múltbéli adatokathasználunk (amik nem is feltétlenül az általunk vizsgált kérdésszempontjából lettek rögzítve).Pl.: autóbalesetben meghaltak és másban meghaltakösszehasonlítása.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adatgyujtés

Adatgyujtés fajtái:• Megfigyeléses vizsgálat (observational study): bizonyos jellemzo

tulajdonságok megfigyelése és mérése anélkül, hogymegváltoztatnánk a vizsgálat tárgyát/alanyát.Pl.: csillagászati/asztrofizikai megfigyelések.

• Kísérlet (experiment): valamilyen kezelést végzünk és utánamegfigyeljük a hatásait a kísérlet tárgyán/alanyán.Pl.: klinikai gyógyszervizsgálat, részecske ütköztetések aCERN-ben.

• Utólagos vizsgálat (retrospective study): múltbéli adatokathasználunk (amik nem is feltétlenül az általunk vizsgált kérdésszempontjából lettek rögzítve).Pl.: autóbalesetben meghaltak és másban meghaltakösszehasonlítása.

• Elore tervezett vizsgálat (prospective study): az adatokat ajövoben gyujtjük olyan csoportokból, melyek valamilyen közösfaktorban megegyeznek.Pl.: a mobilt használó és nem használó vezetok csoportjainakösszehasonlítása. ¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Adatgyujtés

• Vak és duplán vak vizsgálat: a vizsgálat alanya nem tudja, hogykezelést kap vagy placebót, duplán vak esetben a kísérletezo semtudja.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

AdatgyujtésZavar

• Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletetvégzo nem tudja megkülönböztetni az egyes faktorokat.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

AdatgyujtésZavar

• Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletetvégzo nem tudja megkülönböztetni az egyes faktorokat.

Pl.: Indén mindenkitol levonunk 1 pontot, ha nem jelenik meg azeloadáson, javul-e a részvételi arány? Tfh., hogy javul. De lehet,hogy tavaly reggel 8-kor volt az eloadás, és azért nem jártak. A kétfaktor nem különböztetheto meg.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

AdatgyujtésZavar

• Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletetvégzo nem tudja megkülönböztetni az egyes faktorokat.

Pl.: Indén mindenkitol levonunk 1 pontot, ha nem jelenik meg azeloadáson, javul-e a részvételi arány? Tfh., hogy javul. De lehet,hogy tavaly reggel 8-kor volt az eloadás, és azért nem jártak. A kétfaktor nem különböztetheto meg.

• A kísérletet lehetoleg úgy kell megtervezni, hogy ne lépjen fel zavar.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

AdatgyujtésBlokkosítás

A zavar elkerülését segítheti a blokkosítás:

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

AdatgyujtésBlokkosítás

A zavar elkerülését segítheti a blokkosítás:

• Felosztjuk a populációt olyan alcsoportokra, melyekben a kísérletszempontjából fontos tulajdonságok megegyeznek.

• Mindegyik blokkban véletlenszeruen választjuk ki a kezelteket.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

AdatgyujtésBlokkosítás

A zavar elkerülését segítheti a blokkosítás:

• Felosztjuk a populációt olyan alcsoportokra, melyekben a kísérletszempontjából fontos tulajdonságok megegyeznek.

• Mindegyik blokkban véletlenszeruen választjuk ki a kezelteket.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

AdatgyujtésBlokkosítás

A zavar elkerülését segítheti a blokkosítás:

• Felosztjuk a populációt olyan alcsoportokra, melyekben a kísérletszempontjából fontos tulajdonságok megegyeznek.

• Mindegyik blokkban véletlenszeruen választjuk ki a kezelteket.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

AdatgyujtésRandomizált és kontrollált

• Egy elterjedt módszer a teljesenrandomizált (véletlenszerusített)elrendezés:Véletlenszeruen választjuk ki azokat, akikkezelést kapnak

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

AdatgyujtésRandomizált és kontrollált

• Egy elterjedt módszer a teljesenrandomizált (véletlenszerusített)elrendezés:Véletlenszeruen választjuk ki azokat, akikkezelést kapnak

• Egy másik megközelítés a szigorúankontrollált elrendezés:Nagyon körültekintoen kiválasztott egyedek,pl. ha vérnyomáscsökkentot tesztelünk és azegyik blokkban van egy 30 éves túlsúlyos,cigarettázó férfi, aki szereti a sós és zsírosételeket, akkor a másik blokkba is teszünkilyet.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

STATISZTIKUS SOKASÁG ÉS MINTA

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Statisztikus sokaság

Statisztikus sokaság

Definíció: a statisztikai vizsgálat tárgyát képezo egyedek összességét ahozzájuk tartozó (szempontunkból érdekes) adatokkal együtt egystatisztikai sokaságnak vagy populációnak hívjuk.

Példák

• Magyarországi lakosok testmagassága, életkora, vérnyomása, stb.

• Folyó vízállása, közutak vagy routerek terheltsége, tozsdeiárfolyam, stb.

• Telefonbeszélgetések hossza, hívások közti várakozási ido,kozmikus részecskék észlelése, stb.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Statisztikus sokaság

Statisztikus sokaság

Definíció: a statisztikai vizsgálat tárgyát képezo egyedek összességét ahozzájuk tartozó (szempontunkból érdekes) adatokkal együtt egystatisztikai sokaságnak vagy populációnak hívjuk.

Példák

• Magyarországi lakosok testmagassága, életkora, vérnyomása, stb.

• Folyó vízállása, közutak vagy routerek terheltsége, tozsdeiárfolyam, stb.

• Telefonbeszélgetések hossza, hívások közti várakozási ido,kozmikus részecskék észlelése, stb.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Statisztikus sokaság

Statisztikus sokaság

Definíció: a statisztikai vizsgálat tárgyát képezo egyedek összességét ahozzájuk tartozó (szempontunkból érdekes) adatokkal együtt egystatisztikai sokaságnak vagy populációnak hívjuk.

Példák

• Magyarországi lakosok testmagassága, életkora, vérnyomása, stb.

• Folyó vízállása, közutak vagy routerek terheltsége, tozsdeiárfolyam, stb.

• Telefonbeszélgetések hossza, hívások közti várakozási ido,kozmikus részecskék észlelése, stb.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Statisztikus sokaságSokaság eloszlása

Statisztikai sokaság eloszlása

• Ha a vizsgálat tárgyát képezo egyedek száma N, akkor mindenegyes egyed 1/N valószínuséggel fordul elo, illetve ha az egyedekegy A részhalmaza k egyedet tartalmaz, akkor annak valószínuségek/N.

• Ezzel a statisztikai sokaság valószínuségi mezové válik, azegyedekhez tartozó számértékek pedig egy X valószínuségiváltozóvá.

→ Definíció: az így kapott X eloszlását hívjuk a a statisztikaisokaság eloszlásának.

• Amennyiben több számérték is érdekel minket egyedenként, asokaság több dimenzióssá válik, és a X1,X2, . . . ,Xn együtteseloszlását nevezzük a sokaság eloszlásának.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Statisztikus sokaságSokaság eloszlása

Statisztikai sokaság eloszlása

• Ha a vizsgálat tárgyát képezo egyedek száma N, akkor mindenegyes egyed 1/N valószínuséggel fordul elo, illetve ha az egyedekegy A részhalmaza k egyedet tartalmaz, akkor annak valószínuségek/N.

• Ezzel a statisztikai sokaság valószínuségi mezové válik, azegyedekhez tartozó számértékek pedig egy X valószínuségiváltozóvá.

→ Definíció: az így kapott X eloszlását hívjuk a a statisztikaisokaság eloszlásának.

• Amennyiben több számérték is érdekel minket egyedenként, asokaság több dimenzióssá válik, és a X1,X2, . . . ,Xn együtteseloszlását nevezzük a sokaság eloszlásának.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Statisztikus sokaságSokaság eloszlása

Statisztikai sokaság eloszlása

• Ha a vizsgálat tárgyát képezo egyedek száma N, akkor mindenegyes egyed 1/N valószínuséggel fordul elo, illetve ha az egyedekegy A részhalmaza k egyedet tartalmaz, akkor annak valószínuségek/N.

• Ezzel a statisztikai sokaság valószínuségi mezové válik, azegyedekhez tartozó számértékek pedig egy X valószínuségiváltozóvá.

→ Definíció: az így kapott X eloszlását hívjuk a a statisztikaisokaság eloszlásának.

• Amennyiben több számérték is érdekel minket egyedenként, asokaság több dimenzióssá válik, és a X1,X2, . . . ,Xn együtteseloszlását nevezzük a sokaság eloszlásának.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Statisztikus sokaságSokaság eloszlása

Statisztikai sokaság eloszlása

• Ha a vizsgálat tárgyát képezo egyedek száma N, akkor mindenegyes egyed 1/N valószínuséggel fordul elo, illetve ha az egyedekegy A részhalmaza k egyedet tartalmaz, akkor annak valószínuségek/N.

• Ezzel a statisztikai sokaság valószínuségi mezové válik, azegyedekhez tartozó számértékek pedig egy X valószínuségiváltozóvá.

→ Definíció: az így kapott X eloszlását hívjuk a a statisztikaisokaság eloszlásának.

• Amennyiben több számérték is érdekel minket egyedenként, asokaság több dimenzióssá válik, és a X1,X2, . . . ,Xn együtteseloszlását nevezzük a sokaság eloszlásának.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Minta

Minta, mintavételezés

Definíció: ha a statisztikai sokaságból kiválasztunk n egyedet, akkor ahozzájuk tartozó x1, x2, ..., xn értékek egy n elemu mintát adnak.Definíció: az x1, x2, ..., xn függetlenek, ha

• visszatevéssel választottuk oket,

• (visszatevés nélkül, de a sokaság mérete gyakorlatilag végtelen).

• Ha a minta megegyezik a populációval, akkor cenzusról beszélünk.

¼¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Minta

Minta, mintavételezés

Definíció: ha a statisztikai sokaságból kiválasztunk n egyedet, akkor ahozzájuk tartozó x1, x2, ..., xn értékek egy n elemu mintát adnak.Definíció: az x1, x2, ..., xn függetlenek, ha

• visszatevéssel választottuk oket,

• (visszatevés nélkül, de a sokaság mérete gyakorlatilag végtelen).

• Ha a minta megegyezik a populációval, akkor cenzusról beszélünk.

¼¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Mintavételezés

• Véletlen mintavétel: a populáció minden tagjának ugyanakkoraesélye van a bekerülésre.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Mintavételezés

• Véletlen mintavétel: a populáció minden tagjának ugyanakkoraesélye van a bekerülésre.

• Egyszeru n hosszúságú véletlen mintavétel: minden nhosszúságú mintának ugyanakkora a kiválasztási esélye.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Mintavételezés

• Véletlen mintavétel: a populáció minden tagjának ugyanakkoraesélye van a bekerülésre.

• Egyszeru n hosszúságú véletlen mintavétel: minden nhosszúságú mintának ugyanakkora a kiválasztási esélye.

• Szisztematikus mintavétel: valamilyen kezdoponttól indulvakiválasztjuk minden K-adik elemet a populációból.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Mintavételezés

• Véletlen mintavétel: a populáció minden tagjának ugyanakkoraesélye van a bekerülésre.

• Egyszeru n hosszúságú véletlen mintavétel: minden nhosszúságú mintának ugyanakkora a kiválasztási esélye.

• Szisztematikus mintavétel: valamilyen kezdoponttól indulvakiválasztjuk minden K-adik elemet a populációból.

Problémás lehet, ha a populáció is szisztematikusan van rendezve.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Mintavételezés

• Kényelmes mintavétel: használjuk azt a mintát, amit alegkönnyebb beszerezni.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Mintavételezés

• Rétegzett mintavétel: felosztjuk a populációt rétegekre(csoportokra), melyeken belül a kísérlet szempontjából fontostulajdonságok azonosak vagy hasonlók, majd mintát veszünkmindegyik rétegbol.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Mintavételezés

• Klaszter mintavétel: felosztjuk a populációt valamilyentermészetes módon (pl. irányítószám alapján) klaszterekre,véletlenszeruen választunk a klaszterek közül, majd a kiválasztottklaszter összes tagját használjuk.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Paraméter és statisztika

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Paraméter és statisztika

Paraméter

A statisztikai sokaságot (populációt) jellemzo numerikus érték a sokáságegy paramétere.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Paraméter és statisztika

Paraméter

A statisztikai sokaságot (populációt) jellemzo numerikus érték a sokáságegy paramétere.

Statisztikai következtetés

Definíció: ha a minta alapján következtetünk valamire valamilyenvalószínuséggel, az statisztikai következtetés, vagy rövidenstatisztika. Ezt szokták még becslésnek is nevezni.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Paraméter és statisztika

Paraméter

A statisztikai sokaságot (populációt) jellemzo numerikus érték a sokáságegy paramétere.

Statisztikai következtetés

Definíció: ha a minta alapján következtetünk valamire valamilyenvalószínuséggel, az statisztikai következtetés, vagy rövidenstatisztika. Ezt szokták még becslésnek is nevezni.

Példa

• A magyarországi lakosok magasságának várható értéke egyparaméter,

• és pl. egy 1000 fos mintán a magasságok átlaga az egy ezzelkapcsolatos statisztika.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Paraméter és statisztika

populáció Ð→ minta

↕ ↕

paraméter ←Ð statisztika

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Statisztikus sokaságParaméteres becslés

Paraméteres és nem paraméteres becslések

Definíció: egy statisztikai következtetés paraméteres becslés, haismerjük a X eloszlásának típusát, és ez alapján az eloszlás valamelyparaméterére következtetünk.(Pl. tudjuk, hogy binomiális, és meg akarjuk becsülni p-t).Ha nem ismerjük az eloszlás típusát, akkor nem paraméteres becslésrolbeszélünk.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Statisztikus sokaságParaméteres becslés

Paraméteres és nem paraméteres becslések

Definíció: egy statisztikai következtetés paraméteres becslés, haismerjük a X eloszlásának típusát, és ez alapján az eloszlás valamelyparaméterére következtetünk.(Pl. tudjuk, hogy binomiális, és meg akarjuk becsülni p-t).Ha nem ismerjük az eloszlás típusát, akkor nem paraméteres becslésrolbeszélünk.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Statisztikus sokaságParaméteres becslés

Paraméteres és nem paraméteres becslések

Definíció: egy statisztikai következtetés paraméteres becslés, haismerjük a X eloszlásának típusát, és ez alapján az eloszlás valamelyparaméterére következtetünk.(Pl. tudjuk, hogy binomiális, és meg akarjuk becsülni p-t).Ha nem ismerjük az eloszlás típusát, akkor nem paraméteres becslésrolbeszélünk.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus eloszlás

Empirikus eloszlásfüggvény

• Tegyük fel, hogy n elemu, független mintánk van, x1, x2, ..., xn

értékekkel.

→ Ezen belül minden minta elem 1/n valószínuségu. (Természetesentöbb minta elemhez is társulhat ugyanaz az x érték).

Definíció: a minta empirikus eloszlásfüggvénye:

F(x) ∶= 1n∣{i ∣ xi < x}∣ = ∑

i∶ xi<x

1n,

azaz ha összesen k olyan minta elem van, melyekre xi < x, akkorF(x) = k/n.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus eloszlás

Empirikus eloszlásfüggvény

• Tegyük fel, hogy n elemu, független mintánk van, x1, x2, ..., xn

értékekkel.

→ Ezen belül minden minta elem 1/n valószínuségu. (Természetesentöbb minta elemhez is társulhat ugyanaz az x érték).

Definíció: a minta empirikus eloszlásfüggvénye:

F(x) ∶= 1n∣{i ∣ xi < x}∣ = ∑

i∶ xi<x

1n,

azaz ha összesen k olyan minta elem van, melyekre xi < x, akkorF(x) = k/n.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus eloszlás

Empirikus eloszlásfüggvény

• Tegyük fel, hogy n elemu, független mintánk van, x1, x2, ..., xn

értékekkel.

→ Ezen belül minden minta elem 1/n valószínuségu. (Természetesentöbb minta elemhez is társulhat ugyanaz az x érték).

Definíció: a minta empirikus eloszlásfüggvénye:

F(x) ∶= 1n∣{i ∣ xi < x}∣ = ∑

i∶ xi<x

1n,

azaz ha összesen k olyan minta elem van, melyekre xi < x, akkorF(x) = k/n.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus eloszlás

Példa

• Tegyük fel, hogy a táblázatban látható cipoméreteket mértük egy 20fos csoportban. Milyen lesz a cipoméret empirikuseloszlásfüggvénye?

méret hány?38-as 139-es 240-es 441-es 442-es 743-as 2

∑ = 20

207

x

F(x)

44 42 40 38 36 0

0.2

0.4

0.6

0.8

1

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus suruségfüggvény

• Mi lesz az empirikus suruségfüggvény?Mivel az empirikus eloszlás mindig diszkrét, szigorú értelemben ittis csak hisztogramról beszélhetünk suruségfüggvény helyett:

• felosztjuk az x tengelyt ∆x nagyságú intervallumokra,• intervallumonként a hisztogram konstans; értéke, h egy adott

[x, x +∆x], intervallumra:

h ⋅∆x = kn→ h = k

n∆x

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus suruségfüggvény

• Mi lesz az empirikus suruségfüggvény?Mivel az empirikus eloszlás mindig diszkrét, szigorú értelemben ittis csak hisztogramról beszélhetünk suruségfüggvény helyett:

• felosztjuk az x tengelyt ∆x nagyságú intervallumokra,• intervallumonként a hisztogram konstans; értéke, h egy adott

[x, x +∆x], intervallumra:

h ⋅∆x = kn→ h = k

n∆x

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus suruségfüggvény

• Mi lesz az empirikus suruségfüggvény?Mivel az empirikus eloszlás mindig diszkrét, szigorú értelemben ittis csak hisztogramról beszélhetünk suruségfüggvény helyett:

• felosztjuk az x tengelyt ∆x nagyságú intervallumokra,• intervallumonként a hisztogram konstans; értéke, h egy adott

[x, x +∆x], intervallumra:

h ⋅∆x = kn→ h = k

n∆x

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus suruségfüggvény

Példa

Hogy fog kinézni a cipoméret eloszlás hisztogramja az elozo példánál?(Itt ∆x = 1 a természetes választás.)

7

20

x

h(x)

0

0.2

0.4

0.6

0.8

1

36 38 40 42 44

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus suruségfüggvény

• Mi történik, ha hatványszeruen lassan cseng le a suruségfüggvény?

→ Amennyiben ρ(x) ∼ x−α , elofordulhat, hogy ha azonos méretu ∆x-ethasználunk az eloforduló x-ek teljes tartományán, akkor a nagyértékek felé a hisztogram „kilaposodik”!

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus suruségfüggvény

Pl. a Magyar Wikipédia, mint hálózat fokszámeloszlásának empirikussuruségfüggvénye konstans ∆k = 1 esetén:

k

h(k)

300 250 200 150 100 50 0 0

0.1

0.2

0.3

0.4

0.5

0.7

0.6

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus suruségfüggvény

Pl. a Magyar Wikipédia, mint hálózat fokszámeloszlásának empirikussuruségfüggvénye konstans ∆k = 1 esetén:

k

h(k)

0.001

0.01

0.1

1

100 10 1 0.0001

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus suruségfüggvény

Pl. a Magyar Wikipédia, mint hálózat fokszámeloszlásának empirikussuruségfüggvénye konstans ∆k = 1 esetén:

k

h(k)

0.001

0.01

0.1

1

100 10 1 0.0001

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus suruségfüggvény

→ Ilyenkor célszeru a konstans ∆x helyett

• vagy exponenciálisan növekvo ∆x-et használni, ez a„logarithmic binning”, (ami logaritmikus skálán tunik konstansméretunek),

• vagy eloírni egy minimális esetszámot intervallumonként, ésezen kritérium szerint beállítani egy dinamikusan változó∆x-et.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus suruségfüggvény

→ Ilyenkor célszeru a konstans ∆x helyett

• vagy exponenciálisan növekvo ∆x-et használni, ez a„logarithmic binning”, (ami logaritmikus skálán tunik konstansméretunek),

• vagy eloírni egy minimális esetszámot intervallumonként, ésezen kritérium szerint beállítani egy dinamikusan változó∆x-et.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus suruségfüggvény

A Magyar Wikipédia, mint hálózat fokszámeloszlásának empirikussuruségfüggvénye exponenciálisan növekvo ∆k esetén:

k

h(k)

1

1e−05

1e−06

0.0001

0.001

0.01

0.1

1

10

10 100

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus suruségfüggvény

Megjegyzés: ha csak a hatványszeru lecsengés érdekel minket (pl. ahatványkitevo), akkor azt az empirikus eloszlásfüggvény is megmutatja,(és ott nem kell a ∆x-ekkel veszodni):

k

1−F(k)~k

1−F(k)

−α+1

0.0001

0.001

0.01

0.1

1

1 10 100

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus várható érték és szórás

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus várható érték és szórás

Empirikus várható érték

Definíció: Az empirikus várható érték a minta átlagával azonos:

x ∶= x1 + x2 +⋯ + xn

n= 1

n

n

∑i=1

xi.

A nagy számok törvényei alapján xPÐ→ ⟨X⟩,

(illetve ha ⟨X4⟩ korlátos, akkor eros értelemben is konvergál).

Empirikus szórásnégyzet

Definíció: Az empirikus szórásnégyzet az empirikus átlagtól valónégyzetes eltérés átlaga:

S2 ∶= (x1 − x)2 + (x2 − x)2 +⋯ + (xn − x)2

n= 1

n

n

∑i=1

(xi − x)2.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus várható érték és szórás

Empirikus várható érték

Definíció: Az empirikus várható érték a minta átlagával azonos:

x ∶= x1 + x2 +⋯ + xn

n= 1

n

n

∑i=1

xi.

A nagy számok törvényei alapján xPÐ→ ⟨X⟩,

(illetve ha ⟨X4⟩ korlátos, akkor eros értelemben is konvergál).

Empirikus szórásnégyzet

Definíció: Az empirikus szórásnégyzet az empirikus átlagtól valónégyzetes eltérés átlaga:

S2 ∶= (x1 − x)2 + (x2 − x)2 +⋯ + (xn − x)2

n= 1

n

n

∑i=1

(xi − x)2.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus várható érték és szórás

Empirikus várható érték

Definíció: Az empirikus várható érték a minta átlagával azonos:

x ∶= x1 + x2 +⋯ + xn

n= 1

n

n

∑i=1

xi.

A nagy számok törvényei alapján xPÐ→ ⟨X⟩,

(illetve ha ⟨X4⟩ korlátos, akkor eros értelemben is konvergál).

Empirikus szórásnégyzet

Definíció: Az empirikus szórásnégyzet az empirikus átlagtól valónégyzetes eltérés átlaga:

S2 ∶= (x1 − x)2 + (x2 − x)2 +⋯ + (xn − x)2

n= 1

n

n

∑i=1

(xi − x)2.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus várható érték és szórás

• Mi az empirikus szórásnégyzet várható értéke?

Empirikus szórásnégyzet várható értéke ¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus várható érték és szórás

• Mi az empirikus szórásnégyzet várható értéke?

→ Korábban a szórás tárgyalásánál már levezettük,

⟨S2⟩ = n − 1n

σ2

Empirikus szórásnégyzet várható értéke ¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus várható érték és szórás

• Mi az empirikus szórásnégyzet várható értéke?

→ Korábban a szórás tárgyalásánál már levezettük,

⟨S2⟩ = n − 1n

σ2

Korrigált empirikus szórásnégyzet

A fentiek alapján a korrigált empirikus szórásnégyzet:

S∗2 ∶= nn − 1

S2 = 1n − 1

n

∑i=1

(xi − x)2.

Empirikus szórásnégyzet várható értéke ¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus várható érték és szórás

• Mi az empirikus szórásnégyzet várható értéke?

→ Korábban a szórás tárgyalásánál már levezettük,

⟨S2⟩ = n − 1n

σ2

Korrigált empirikus szórásnégyzet

A fentiek alapján a korrigált empirikus szórásnégyzet:

S∗2 ∶= nn − 1

S2 = 1n − 1

n

∑i=1

(xi − x)2.

Ennek várható értéke már megegyezik a sokaság szórásnégyzetével,

⟨S∗2⟩ = nn − 1

⟨S2⟩ = σ2.

Empirikus szórásnégyzet várható értéke ¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus kvantilisek

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus kvantilisek

• Hogyan lehetne pl. a kvartiliseket megbecsülni a minta alapján?

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus kvantilisek

• Hogyan lehetne pl. a kvartiliseket megbecsülni a minta alapján?

- Rendezzük a mintákat érték alapján,

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus kvantilisek

• Hogyan lehetne pl. a kvartiliseket megbecsülni a minta alapján?

- Rendezzük a mintákat érték alapján,- és a mintaelemek elso negyedénél lesz az alsó kvartilis,

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus kvantilisek

• Hogyan lehetne pl. a kvartiliseket megbecsülni a minta alapján?

- Rendezzük a mintákat érték alapján,- és a mintaelemek elso negyedénél lesz az alsó kvartilis,- (a felénél van a medián),

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Empirikus kvantilisek

• Hogyan lehetne pl. a kvartiliseket megbecsülni a minta alapján?

- Rendezzük a mintákat érték alapján,- és a mintaelemek elso negyedénél lesz az alsó kvartilis,- (a felénél van a medián),- és a háromnegyedénél a felso kvartilis.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Boxplot

• Egy adathalmaz 5-szám összesítoje:

1) a minimum,2) az alsó kvartilis, Q1,3) a medián, Q2,4) a felso kvartilis Q3,5) a maximum.

• Ezeket egy ún. boxplot-ban szokás összefoglalni:

• Az adathalmaz terjedelme (angolul range) a maximum és minimumközti különbség.

• Az interkvartilis terjedelem (IQR): Q3 −Q1.¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Boxplot

A boxplot néhány eloszlásfajta esetén:

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Boxplot

A boxplot néhány eloszlásfajta esetén:

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Outlier

• A kiugró értékeket hívjuk outlier-nek:

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Outlier

• A kiugró értékeket hívjuk outlier-nek:

- outlier, ha Q3-at meghaladja az IQR másfélszeresével,- outlier, ha Q1-nél több mint IQR másfélszeresével kisebb.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Outlier

• A kiugró értékeket hívjuk outlier-nek:

- outlier, ha Q3-at meghaladja az IQR másfélszeresével,- outlier, ha Q1-nél több mint IQR másfélszeresével kisebb.

• Az outlier-eknek drámai hatása lehet az átlagra és a szórásra.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Outlier

• A kiugró értékeket hívjuk outlier-nek:

- outlier, ha Q3-at meghaladja az IQR másfélszeresével,- outlier, ha Q1-nél több mint IQR másfélszeresével kisebb.

• Az outlier-eknek drámai hatása lehet az átlagra és a szórásra.

• Ezeket általában külön csillaggal jelöljük, és a maradék adatokracsinálunk box-plotot.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Boxplot

A boxplot akkor igazán érdekes, ha több mintát hasonlítunk összeegymással:

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Boxplot

A boxplot akkor igazán érdekes, ha több mintát hasonlítunk összeegymással:

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Boxplot

A boxplot akkor igazán érdekes, ha több mintát hasonlítunk összeegymással:

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Boxplot

A boxplot akkor igazán érdekes, ha több mintát hasonlítunk összeegymással:

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

• Különösen fontos az az eset, amikor a statisztikai sokaságnormális eloszlású, ami azt jelenti, hogy X eloszlása normális,X ∼ N (µ,σ).

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

• Különösen fontos az az eset, amikor a statisztikai sokaságnormális eloszlású, ami azt jelenti, hogy X eloszlása normális,X ∼ N (µ,σ).

• Természetesen ilyenkor az xi mintaelemekre is tekinthetünk úgy,mint µ várható értéku és σ szórású normális eloszlású függetlenváltozókra, xi ∼ N (µ,σ).

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Tegyük fel tehát, hogy xi ∼ N (µ,σ).

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Tegyük fel tehát, hogy xi ∼ N (µ,σ).

→ Mi lesz x eloszlása?

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Tegyük fel tehát, hogy xi ∼ N (µ,σ).

→ Mi lesz x eloszlása?Mivel a normális eloszlás stabil,

n

∑i=1

xi ∈ N (nµ,√

nσ), x = 1n

n

∑i=1

xi

→ x ∈ N (µ, σ√n)

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Tegyük fel tehát, hogy xi ∼ N (µ,σ).

→ Mi lesz S2 eloszlása?

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Tegyük fel tehát, hogy xi ∼ N (µ,σ).

→ Mi lesz S2 eloszlása?

S2 = 1n

n

∑i=1

(xi − x)2 = 1n

n

∑i=1

⎛⎝

xi −1n

n

∑j=1

xj⎞⎠

2

=

1n

n

∑i=1

⎡⎢⎢⎢⎢⎣x2

i −2xi

n

n

∑j=1

xj +1n2

⎛⎝

n

∑j=1

xj⎞⎠

2⎤⎥⎥⎥⎥⎦=

1n

n

∑i=1

x2i −

2n2

n

∑i,j=1

xixj +1n2

⎛⎝

n

∑j=1

x2j + 2∑

j<kxjxk

⎞⎠=

1n

n

∑i=1

x2i −

2n2

⎛⎝

n

∑i=1

x2i + 2∑

i<jxixj

⎞⎠+ 1

n2

⎛⎝

n

∑j=1

x2j + 2∑

j<kxjxk

⎞⎠=

(1n− 1

n2)

n

∑i=1

x2i −

2n2 ∑

i<jxixj =

n − 1n

1n

n

∑i=1

x2i −

2n2 ∑

i<jxixj

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Tegyük fel tehát, hogy xi ∼ N (µ,σ).

→ Mi lesz S2 eloszlása?

S2 = n − 1n

1n

n

∑i=1

x2i −

2n2 ∑

i<jxixj

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Tegyük fel tehát, hogy xi ∼ N (µ,σ).

→ Mi lesz S2 eloszlása?

S2 = n − 1n

1n

n

∑i=1

x2i −

2n2 ∑

i<jxixj

Bevezetünk egy új változót, melynek eloszlása standard normális,

zi =xi − µσ

xi = µ + σzi, zi ∈ N (0, 1),

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Tegyük fel tehát, hogy xi ∼ N (µ,σ).

→ Mi lesz S2 eloszlása?

S2 = n − 1n

1n

n

∑i=1

x2i −

2n2 ∑

i<jxixj

Bevezetünk egy új változót, melynek eloszlása standard normális,

zi =xi − µσ

xi = µ + σzi, zi ∈ N (0, 1),ezzel

S2 = n − 1n

1n

n

∑i=1

(µ2 + 2µσzi + σ2z2i ) −

2n2 ∑

i<j(µ2 + µσzi + µσzj + σ2zjzj) =

n − 1n

µ2 + n − 1n

2nµσ

n

∑i=1

zi +n − 1

n1nσ2

n

∑i=1

z2i

− 2n2

n(n − 1)2

µ2 − 2n2

(n − 1)µσn

∑i=1

zi −2n2σ2∑

i<jzizj

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Tegyük fel tehát, hogy xi ∼ N (µ,σ).

→ Mi lesz S2 eloszlása?

S2 = n − 1n

1n

n

∑i=1

x2i −

2n2 ∑

i<jxixj

Bevezetünk egy új változót, melynek eloszlása standard normális,

zi =xi − µσ

xi = µ + σzi, zi ∈ N (0, 1),ezzel

S2 = σ2 n − 1n

1n

n

∑i=1

z2i − σ2 2

n2 ∑i<j

zizj

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Tegyük fel tehát, hogy xi ∼ N (µ,σ).

→ Mi lesz S2 eloszlása?

S2 = n − 1n

1n

n

∑i=1

x2i −

2n2 ∑

i<jxixj

Bevezetünk egy új változót, melynek eloszlása standard normális,

zi =xi − µσ

xi = µ + σzi, zi ∈ N (0, 1),ezzel

S2 = σ2 n − 1n

1n

n

∑i=1

z2i − σ2 2

n2 ∑i<j

zizj

Bevezetünk még egy új változót, y ∶= nS2

σ2 , melyre

y = n − 1n

n

∑i=1

z2i −

2n∑i<j

zjzj = (1 − 1n)

n

∑i=1

z2i −

2n∑i<j

zizj.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Az y változó suruségfüggvénye és karakterisztikus függvénye:

ρ(y) = ∬ ⋯∫ dz1⋯dznδ⎛⎝

y − (1 − 1n)

n

∑i=1

z2i −

2n∑i<j

zizj⎞⎠×

× 1√2π

e−z212

1√2π

e−z222 ⋯ 1√

2πe−

z2n2

ϕy(t) =∞

∫−∞

ρ(y)eitydy =∬ ⋯∫dz1⋯dzn

(2π) n2

eit(1− 1

n )n∑i=1

z2i − 2it

n ∑i<jzizj− 1

2

n∑i=1

z2i

Az exponensben lévo kifejezés felfogható úgy, mint egy mátrixszendvicselés:

it (1 − 1n)

n

∑i=1

z2i −

2itn∑i<j

zizj −12

n

∑i=1

z2i = −zAz

A =⎛⎜⎜⎜⎝

12 − it (1 − 1

n)itn

itn ⋯

itn

12 − it (1 − 1

n)itn ⋯

itn

itn

12 − it (1 − 1

n) ⋯⋮ ⋮ ⋮ ⋱

⎞⎟⎟⎟⎠

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Az y változó suruségfüggvénye és karakterisztikus függvénye:

ρ(y) = ∬ ⋯∫ dz1⋯dznδ⎛⎝

y − (1 − 1n)

n

∑i=1

z2i −

2n∑i<j

zizj⎞⎠×

× 1√2π

e−z212

1√2π

e−z222 ⋯ 1√

2πe−

z2n2

ϕy(t) =∞

∫−∞

ρ(y)eitydy =∬ ⋯∫dz1⋯dzn

(2π) n2

eit(1− 1

n )n∑i=1

z2i − 2it

n ∑i<jzizj− 1

2

n∑i=1

z2i

Az exponensben lévo kifejezés felfogható úgy, mint egy mátrixszendvicselés:

it (1 − 1n)

n

∑i=1

z2i −

2itn∑i<j

zizj −12

n

∑i=1

z2i = −zAz

A =⎛⎜⎜⎜⎝

12 − it (1 − 1

n)itn

itn ⋯

itn

12 − it (1 − 1

n)itn ⋯

itn

itn

12 − it (1 − 1

n) ⋯⋮ ⋮ ⋮ ⋱

⎞⎟⎟⎟⎠

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Ezzel a ϕy(t) karakterisztikus függvény:

ϕy(t) =∬ ⋯∫dz1⋯dzn

(2π) n2

e−zAz = 1(2π) n

2

√πn

det A,

hiszen A saját rendszerére áttérve

Avi = λivi, det A =n

∏i=1λi,

∫−∞

e−αx2=√π

α

ϕy(t) =∬ ⋯∫du1⋯dun

(2π) n2

e−

n∑i=1λiu

2i =

∫−∞

du1√2π

e−λ1u21 ×

∫−∞

du2√2π

e−λ2u22 ×⋯ ×

∫−∞

dun√2π

e−λnu2n =

n

∏i=1

1√2π

√π

λi.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Ezzel a ϕy(t) karakterisztikus függvény:

ϕy(t) =∬ ⋯∫dz1⋯dzn

(2π) n2

e−zAz = 1(2π) n

2

√πn

det A,

hiszen A saját rendszerére áttérve

Avi = λivi, det A =n

∏i=1λi,

∫−∞

e−αx2=√π

α

ϕy(t) =∬ ⋯∫du1⋯dun

(2π) n2

e−

n∑i=1λiu

2i =

∫−∞

du1√2π

e−λ1u21 ×

∫−∞

du2√2π

e−λ2u22 ×⋯ ×

∫−∞

dun√2π

e−λnu2n =

n

∏i=1

1√2π

√π

λi.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Az A determinánsának meghatározásához eloször felbontjuk:

A = (12− it)

⎛⎜⎜⎜⎜⎜⎝

1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1

⎞⎟⎟⎟⎟⎟⎠

+ itn

⎛⎜⎜⎜⎜⎜⎝

1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1

⎞⎟⎟⎟⎟⎟⎠

Ez alapján egy tetszoleges v =⎛⎜⎝

v1

⋮vn

⎞⎟⎠

esetén

Av = (12− it) v + it

n

n

∑i=1

vi

⎛⎜⎝

1⋮1

⎞⎟⎠.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Az A determinánsának meghatározásához eloször felbontjuk:

A = (12− it)

⎛⎜⎜⎜⎜⎜⎝

1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1

⎞⎟⎟⎟⎟⎟⎠

+ itn

⎛⎜⎜⎜⎜⎜⎝

1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1

⎞⎟⎟⎟⎟⎟⎠

Ez alapján egy tetszoleges v =⎛⎜⎝

v1

⋮vn

⎞⎟⎠

esetén

Av = (12− it) v + it

n

n

∑i=1

vi

⎛⎜⎝

1⋮1

⎞⎟⎠.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Az A determinánsának meghatározásához eloször felbontjuk:

A = (12− it)

⎛⎜⎜⎜⎜⎜⎝

1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1

⎞⎟⎟⎟⎟⎟⎠

+ itn

⎛⎜⎜⎜⎜⎜⎝

1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1

⎞⎟⎟⎟⎟⎟⎠

Ez alapján egy tetszoleges v =⎛⎜⎝

v1

⋮vn

⎞⎟⎠

esetén

Av = (12− it) v + it

n

n

∑i=1

vi

⎛⎜⎝

1⋮1

⎞⎟⎠.

Az A sajátvektorai:

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Az A determinánsának meghatározásához eloször felbontjuk:

A = (12− it)

⎛⎜⎜⎜⎜⎜⎝

1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1

⎞⎟⎟⎟⎟⎟⎠

+ itn

⎛⎜⎜⎜⎜⎜⎝

1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1

⎞⎟⎟⎟⎟⎟⎠

Ez alapján egy tetszoleges v =⎛⎜⎝

v1

⋮vn

⎞⎟⎠

esetén

Av = (12− it) v + it

n

n

∑i=1

vi

⎛⎜⎝

1⋮1

⎞⎟⎠.

Az A sajátvektorai:

• Han∑i=1

vi = 0 teljesül, akkor ezen belül v tetszoleges lehet, azaz ez

egy n − 1 dimenziós altér n − 1 darab λ = ( 12 − it) sajátértékkel.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Az A determinánsának meghatározásához eloször felbontjuk:

A = (12− it)

⎛⎜⎜⎜⎜⎜⎝

1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1

⎞⎟⎟⎟⎟⎟⎠

+ itn

⎛⎜⎜⎜⎜⎜⎝

1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1

⎞⎟⎟⎟⎟⎟⎠

Ez alapján egy tetszoleges v =⎛⎜⎝

v1

⋮vn

⎞⎟⎠

esetén

Av = (12− it) v + it

n

n

∑i=1

vi

⎛⎜⎝

1⋮1

⎞⎟⎠.

Az A sajátvektorja:

• Han∑i=1

vi ≠ 0 akkor a sajátvektor v =⎛⎜⎝

1⋮1

⎞⎟⎠

, a sajátérték

λ = (12− it) + it

nn = 1

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

Az A determinánsának meghatározásához eloször felbontjuk:

A = (12− it)

⎛⎜⎜⎜⎜⎜⎝

1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1

⎞⎟⎟⎟⎟⎟⎠

+ itn

⎛⎜⎜⎜⎜⎜⎝

1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1

⎞⎟⎟⎟⎟⎟⎠

Ez alapján egy tetszoleges v =⎛⎜⎝

v1

⋮vn

⎞⎟⎠

esetén

Av = (12− it) v + it

n

n

∑i=1

vi

⎛⎜⎝

1⋮1

⎞⎟⎠.

Az A determinánsa:

det A = 12⋅ (1

2− it)

n−1

.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

A ϕy(t) karakterisztikus függvény:

ϕy(t) = 1(2π) n

2

√πn

det A= 1

(2π) n2

¿ÁÁÀ πn

12 ⋅ (

12 − it)n−1 = 1

(1 − 2it) n−12.

→ Ez egy n − 1 szabadsági fokú χ2 eloszlás karakterisztikus függvénye!

→ ρ(y) = yn−3

2

2n−1

2 Γ ( n−12 )

e−y2 ,

Az empirikus szórásnégyzet eloszlása

A fentiek alapján az S2 eloszlása egy átskálázott, n − 1 szabadsági fokúχ2 eloszlás, hiszen S2 = σ2y

n

χ2 -eloszlás karakterisztikus függvénye Konfidencia–intervallum ¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

• Az S2 eloszlása, ρ(y) transzformálásával:

ρS2(x) = ρχ2n−1

( nxσ2

) nσ2

= nσ2

( nxσ2 )

n−32

2n−1

2 Γ ( n−12 )

e−nx

2σ2 ,

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

• Az S2 eloszlása, ρ(y) transzformálásával:

ρS2(x) = ρχ2n−1

( nxσ2

) nσ2

= nσ2

( nxσ2 )

n−32

2n−1

2 Γ ( n−12 )

e−nx

2σ2 ,

• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

• Az S2 eloszlása, ρ(y) transzformálásával:

ρS2(x) = ρχ2n−1

( nxσ2

) nσ2

= nσ2

( nxσ2 )

n−32

2n−1

2 Γ ( n−12 )

e−nx

2σ2 ,

• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:

- Az y = nS2

σ2 változó eloszlása χ2n−1, ezért a várható értéke

⟨y⟩ = n − 1.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

• Az S2 eloszlása, ρ(y) transzformálásával:

ρS2(x) = ρχ2n−1

( nxσ2

) nσ2

= nσ2

( nxσ2 )

n−32

2n−1

2 Γ ( n−12 )

e−nx

2σ2 ,

• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:

- Az y = nS2

σ2 változó eloszlása χ2n−1, ezért a várható értéke

⟨y⟩ = n − 1.- Ez alapján S2 = σ2y

n várható értéke ⟨S2⟩ = n−1n σ

2, ami teljesenkonzisztens a korábban levezetett eredménnyel.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

• Az S2 eloszlása, ρ(y) transzformálásával:

ρS2(x) = ρχ2n−1

( nxσ2

) nσ2

= nσ2

( nxσ2 )

n−32

2n−1

2 Γ ( n−12 )

e−nx

2σ2 ,

• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:

- Az y = nS2

σ2 változó eloszlása χ2n−1, ezért a várható értéke

⟨y⟩ = n − 1.- Ez alapján S2 = σ2y

n várható értéke ⟨S2⟩ = n−1n σ

2, ami teljesenkonzisztens a korábban levezetett eredménnyel.

• Viszont a χ2 eloszlásra vonatkozó ismereteink alapján most már S2

szórásnégyzetét is meg tudjuk adni:

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

• Az S2 eloszlása, ρ(y) transzformálásával:

ρS2(x) = ρχ2n−1

( nxσ2

) nσ2

= nσ2

( nxσ2 )

n−32

2n−1

2 Γ ( n−12 )

e−nx

2σ2 ,

• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:

- Az y = nS2

σ2 változó eloszlása χ2n−1, ezért a várható értéke

⟨y⟩ = n − 1.- Ez alapján S2 = σ2y

n várható értéke ⟨S2⟩ = n−1n σ

2, ami teljesenkonzisztens a korábban levezetett eredménnyel.

• Viszont a χ2 eloszlásra vonatkozó ismereteink alapján most már S2

szórásnégyzetét is meg tudjuk adni:

- Az y szórásnégyzete V(y) = V(χ2n−1) = 2(n − 1).

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

• Az S2 eloszlása, ρ(y) transzformálásával:

ρS2(x) = ρχ2n−1

( nxσ2

) nσ2

= nσ2

( nxσ2 )

n−32

2n−1

2 Γ ( n−12 )

e−nx

2σ2 ,

• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:

- Az y = nS2

σ2 változó eloszlása χ2n−1, ezért a várható értéke

⟨y⟩ = n − 1.- Ez alapján S2 = σ2y

n várható értéke ⟨S2⟩ = n−1n σ

2, ami teljesenkonzisztens a korábban levezetett eredménnyel.

• Viszont a χ2 eloszlásra vonatkozó ismereteink alapján most már S2

szórásnégyzetét is meg tudjuk adni:

- Az y szórásnégyzete V(y) = V(χ2n−1) = 2(n − 1).

- Ez alapján

V(S2) = 2(n − 1)σ4

n2.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

• Mi a helyzet a korrigált empirikus szórásnégyzettel?

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

• Mi a helyzet a korrigált empirikus szórásnégyzettel?

→ A definíció alapján S∗2 = nn−1 S2 = σ2y

n−1 , ezért

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

• Mi a helyzet a korrigált empirikus szórásnégyzettel?

→ A definíció alapján S∗2 = nn−1 S2 = σ2y

n−1 , ezért

- a suruségfüggvény

ρS∗2(x) = ρχ2n−1

((n − 1)xσ2

) (n − 1)σ2

= n − 1σ2

( (n−1)xσ2 )

n−32

2n−1

2 Γ ( n−12 )

e−(n−1)x

2σ2 ,

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

• Mi a helyzet a korrigált empirikus szórásnégyzettel?

→ A definíció alapján S∗2 = nn−1 S2 = σ2y

n−1 , ezért

- a suruségfüggvény

ρS∗2(x) = ρχ2n−1

((n − 1)xσ2

) (n − 1)σ2

= n − 1σ2

( (n−1)xσ2 )

n−32

2n−1

2 Γ ( n−12 )

e−(n−1)x

2σ2 ,

- a várható érték ⟨S∗2⟩ = σ2

n−1 ⟨χ2n−1⟩ = σ2,

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

• Mi a helyzet a korrigált empirikus szórásnégyzettel?

→ A definíció alapján S∗2 = nn−1 S2 = σ2y

n−1 , ezért

- a suruségfüggvény

ρS∗2(x) = ρχ2n−1

((n − 1)xσ2

) (n − 1)σ2

= n − 1σ2

( (n−1)xσ2 )

n−32

2n−1

2 Γ ( n−12 )

e−(n−1)x

2σ2 ,

- a várható érték ⟨S∗2⟩ = σ2

n−1 ⟨χ2n−1⟩ = σ2,

- és a szórás

V(S∗2) = σ4

(n − 1)2V(χ2

n−1) =2(n − 1)σ4

(n − 1)2= 2σ4

n − 1.

¼

Adat, minta,statisztikus

sokaság

AdatokAdattípusok

Adatgyujtés

Statisztikussokaság és mintaMinta

Statisztika

Empirikus eloszlás

Empirikus várhatóérték és szórás

Empirikus kvantilisek

Normális eloszlásúsokaság

Normális eloszlású sokaság

• Mi a helyzet a korrigált empirikus szórásnégyzettel?

→ A definíció alapján S∗2 = nn−1 S2 = σ2y

n−1 , ezért

- a suruségfüggvény

ρS∗2(x) = ρχ2n−1

((n − 1)xσ2

) (n − 1)σ2

= n − 1σ2

( (n−1)xσ2 )

n−32

2n−1

2 Γ ( n−12 )

e−(n−1)x

2σ2 ,

- a várható érték ⟨S∗2⟩ = σ2

n−1 ⟨χ2n−1⟩ = σ2,

- és a szórás

V(S∗2) = σ4

(n − 1)2V(χ2

n−1) =2(n − 1)σ4

(n − 1)2= 2σ4

n − 1.

• Azt kaptuk, hogy a korrigált empirikus szórásnégyzet szórásais csökken a mintaszámmal, mégpedig úgy mint 1/(n − 1).

¼

Recommended