15
Zaščita statističnih podatkov na SURS-u Andreja Smukavec Sektor za splošno metodologijo in standarde

Zaščita statističnih podatkov na SURS-u

  • Upload
    pearly

  • View
    81

  • Download
    0

Embed Size (px)

DESCRIPTION

Zaščita statističnih podatkov na SURS-u. Andreja Smukavec Sektor za splošno metodologijo in standarde. UVOD - 1. Zaščita : Andreja Smukavec, Erika Trpin, Manca Golmajer ( [email protected] ) . - PowerPoint PPT Presentation

Citation preview

Page 1: Zaščita statističnih podatkov na SURS-u

Zaščita statističnih podatkov na SURS-u

Andreja Smukavec

Sektor za splošno metodologijo in standarde

Page 2: Zaščita statističnih podatkov na SURS-u

UVOD - 1

• Zaščita: Andreja Smukavec, Erika Trpin, Manca Golmajer ([email protected]).

• Zaupnost zagotavlja Zakon o državni statistiki (2001), Zakon o dostopu do informacij javnega značaja, Zakon o varstvu osebnih podatkov in evropska uredba št. 223/2009.

• SURS želi podatke ustrezno zaščititi in hkrati izgubiti čim manj informacij.

Page 3: Zaščita statističnih podatkov na SURS-u

UVOD - 2

• Vedno večje zahteve po statističnih podatkih.• Poročevalske enote želijo, da njihovi podatki

ostanejo zaupni, zato hočemo preprečiti razkritje.

• OVP = Odbor za varstvo podatkov (zunanji zahtevki, reševanje bolj kompleksnih vprašanj).

• Dostop do mikropodatkov: varna soba, dostop z daljave, CD

• Datoteke, ki jih hočejo raziskovalci izvoziti (varna soba, dostop z daljave) preverimo.

Page 4: Zaščita statističnih podatkov na SURS-u

PODATKI ZA ZAŠČITO IN PROGRAMSKA OPREMA

1. Tabele:– frekvenčne tabele, vrednostne tabele;– τ-Argus.

2. Mikropodatki:- deindividualizirani;- namenjeni raziskovalcem (SUF);- namenjeni javnosti (PUF);

- μ-Argus.

Page 5: Zaščita statističnih podatkov na SURS-u

ZAŠČITA TABEL

Metode za zaščito tabel:

• agregacija;

• metoda manjkajočih vrednosti:

primarna zaščita (občutljive celice);

sekundarna zaščita (ščiti občutljive celice);

• druge.

Page 6: Zaščita statističnih podatkov na SURS-u

Pravila za določanje primarno občutljivih celic:• prag t:

celica je občutljiva, če k njeni vrednosti prispeva manj kot t poročevalskih enot;

• pravilo dominantnosti (n, k):

celica je občutljiva, če n poročevalskih enot prispeva k vrednosti celice več kot k %;

• p%-pravilo:

celica je občutljiva, če koalicija n vsiljivcev oceni največjo enoto z manj kot p%-no napako (ponavadi je n = 1, druga največja enota je vsiljivec);

• pravilo zahteve

Page 7: Zaščita statističnih podatkov na SURS-u

Pri zaščiti frekvenčnih tabel uporabljamo:

• prag.

Pri zaščiti vrednostnih tabel uporabljamo:

• prag in pravilo dominantnosti;

• prag in p%-pravilo;

• pravilo zahteve.

Page 8: Zaščita statističnih podatkov na SURS-u

SkupajSkupaj Reg 1Reg 1 Reg 2Reg 2 Reg 3Reg 3

SkupajSkupaj 5555 1616 2424 2525

ZaposleniZaposleni 2020 44 1010 66

SamozaposleniSamozaposleni 99 22 22 55

BrezposelniBrezposelni 2626 1010 1212 1414

SkupajSkupaj Reg1Reg1 Reg 2Reg 2 Reg 3Reg 3

SkupajSkupaj 5555 1616 2424 2525

ZaposleniZaposleni 2020 zz zz zz

SamozaposleniSamozaposleni 99 zz zz zz

BrezposelniBrezposelni 2626 1010 1212 1414

Zaščita frekvenčne tabele (prag 5)

objavaobjava

Page 9: Zaščita statističnih podatkov na SURS-u

Primer hierarhične frekvenčne tabele (prag 3) - 1

SkupajSkupaj MoškiMoški ŽenskeŽenske

SkupajSkupaj 4141 1717 2424

Regija 1Regija 1 1414 33 1111

Občina 1Občina 1 77 22 55

Občina 2Občina 2 77 11 66

Regija 2Regija 2 1717 99 88

Občina 4Občina 4 77 33 44

Občina 5Občina 5 1010 66 44

Regija 3Regija 3 1010 55 55

Občina 6Občina 6 1010 55 55

Page 10: Zaščita statističnih podatkov na SURS-u

Primer hierarhične frekvenčne tabele (prag 3) - 1

SkupajSkupaj MoškiMoški ŽenskeŽenske

SkupajSkupaj 4141 1717 2424

Regija 1Regija 1 1414 33 1111

Regija 2Regija 2 1717 99 88

Regija 3Regija 3 1010 55 55

SkupajSkupaj MoškiMoški ŽenskeŽenske

SkupajSkupaj 4141 1717 2424

Regija 1Regija 1 1414 33 1111

Regija 2Regija 2 1717 99 88

Regija 3Regija 3 1010 55 55

ALIALI

Page 11: Zaščita statističnih podatkov na SURS-u

Primer vrednostne tabeleŠtevilo zaposlenih po spolu, dejavnosti do oddelka (SKD

2008) in razredih neto plače

SkupajSkupaj Razred1Razred1 Razred2Razred2 Razred3Razred3

SkupajSkupaj 8080 3030 3737 1313

SKD1SKD1 40 [1 podj.]40 [1 podj.] 1010 2828 22

SKD2SKD2 40 [4 podj.]40 [4 podj.] 2020 99 1111

MoškiMoški 5050 2020 2525 55

SKD1SKD1 2626 55 2020 11

SKD2SKD2 2424 1515 55 44

ŽenskeŽenske 3030 1010 1212 88

SKD1SKD1 1414 55 88 11

SKD2SKD2 1616 55 44 77

Page 12: Zaščita statističnih podatkov na SURS-u

ZAŠČITA MIKROPODATKOV

Določimo:- direktne identifikatorje (odstranimo);- ključne spremenljivke (identifikacija poročevalske enote);- občutljive spremenljivke.

Metode za zaščito mikropodatkov:• dodajanje šuma;• zaokroževanje;• združevanje v (večje) razrede;• prag;• metoda manjkajočih vrednosti;• druge.

Page 13: Zaščita statističnih podatkov na SURS-u

Primer mikropodatkov, prag 2Starost Spol Kraj Poklic

28 moški Ljubljana biolog

33 moški Ljubljana kemik

35 moški Maribor biolog

30 moški Maribor kemik

24 moški Ljubljana kemik

40 moški Maribor kemik

50 moški Ljubljana biolog

31 moški Maribor kemik

31 moški Ljubljana kemik

55 moški Maribor kemik

Ključ Št. pojavov

Ljubljana – biolog 2

Ljubljana – kemik 3

Maribor – biolog 1

Maribor – kemik 4

Page 14: Zaščita statističnih podatkov na SURS-u

Primer mikropodatkov, prag 2Starost Spol Kraj Poklic

28 moški Ljubljana biolog

33 moški Ljubljana kemik

35 moški Maribor neznano

30 moški Maribor kemik

24 moški Ljubljana kemik

40 moški Maribor kemik

50 moški Ljubljana biolog

31 moški Maribor kemik

31 moški Ljubljana kemik

55 moški Maribor kemik

Page 15: Zaščita statističnih podatkov na SURS-u

LEP DAN ŠE NAPREJ VSEM SKUPAJ!