Upload
pearly
View
81
Download
0
Embed Size (px)
DESCRIPTION
Zaščita statističnih podatkov na SURS-u. Andreja Smukavec Sektor za splošno metodologijo in standarde. UVOD - 1. Zaščita : Andreja Smukavec, Erika Trpin, Manca Golmajer ( [email protected] ) . - PowerPoint PPT Presentation
Citation preview
Zaščita statističnih podatkov na SURS-u
Andreja Smukavec
Sektor za splošno metodologijo in standarde
UVOD - 1
• Zaščita: Andreja Smukavec, Erika Trpin, Manca Golmajer ([email protected]).
• Zaupnost zagotavlja Zakon o državni statistiki (2001), Zakon o dostopu do informacij javnega značaja, Zakon o varstvu osebnih podatkov in evropska uredba št. 223/2009.
• SURS želi podatke ustrezno zaščititi in hkrati izgubiti čim manj informacij.
UVOD - 2
• Vedno večje zahteve po statističnih podatkih.• Poročevalske enote želijo, da njihovi podatki
ostanejo zaupni, zato hočemo preprečiti razkritje.
• OVP = Odbor za varstvo podatkov (zunanji zahtevki, reševanje bolj kompleksnih vprašanj).
• Dostop do mikropodatkov: varna soba, dostop z daljave, CD
• Datoteke, ki jih hočejo raziskovalci izvoziti (varna soba, dostop z daljave) preverimo.
PODATKI ZA ZAŠČITO IN PROGRAMSKA OPREMA
1. Tabele:– frekvenčne tabele, vrednostne tabele;– τ-Argus.
2. Mikropodatki:- deindividualizirani;- namenjeni raziskovalcem (SUF);- namenjeni javnosti (PUF);
- μ-Argus.
ZAŠČITA TABEL
Metode za zaščito tabel:
• agregacija;
• metoda manjkajočih vrednosti:
primarna zaščita (občutljive celice);
sekundarna zaščita (ščiti občutljive celice);
• druge.
Pravila za določanje primarno občutljivih celic:• prag t:
celica je občutljiva, če k njeni vrednosti prispeva manj kot t poročevalskih enot;
• pravilo dominantnosti (n, k):
celica je občutljiva, če n poročevalskih enot prispeva k vrednosti celice več kot k %;
• p%-pravilo:
celica je občutljiva, če koalicija n vsiljivcev oceni največjo enoto z manj kot p%-no napako (ponavadi je n = 1, druga največja enota je vsiljivec);
• pravilo zahteve
Pri zaščiti frekvenčnih tabel uporabljamo:
• prag.
Pri zaščiti vrednostnih tabel uporabljamo:
• prag in pravilo dominantnosti;
• prag in p%-pravilo;
• pravilo zahteve.
SkupajSkupaj Reg 1Reg 1 Reg 2Reg 2 Reg 3Reg 3
SkupajSkupaj 5555 1616 2424 2525
ZaposleniZaposleni 2020 44 1010 66
SamozaposleniSamozaposleni 99 22 22 55
BrezposelniBrezposelni 2626 1010 1212 1414
SkupajSkupaj Reg1Reg1 Reg 2Reg 2 Reg 3Reg 3
SkupajSkupaj 5555 1616 2424 2525
ZaposleniZaposleni 2020 zz zz zz
SamozaposleniSamozaposleni 99 zz zz zz
BrezposelniBrezposelni 2626 1010 1212 1414
⇓
Zaščita frekvenčne tabele (prag 5)
objavaobjava
Primer hierarhične frekvenčne tabele (prag 3) - 1
SkupajSkupaj MoškiMoški ŽenskeŽenske
SkupajSkupaj 4141 1717 2424
Regija 1Regija 1 1414 33 1111
Občina 1Občina 1 77 22 55
Občina 2Občina 2 77 11 66
Regija 2Regija 2 1717 99 88
Občina 4Občina 4 77 33 44
Občina 5Občina 5 1010 66 44
Regija 3Regija 3 1010 55 55
Občina 6Občina 6 1010 55 55
Primer hierarhične frekvenčne tabele (prag 3) - 1
SkupajSkupaj MoškiMoški ŽenskeŽenske
SkupajSkupaj 4141 1717 2424
Regija 1Regija 1 1414 33 1111
Regija 2Regija 2 1717 99 88
Regija 3Regija 3 1010 55 55
SkupajSkupaj MoškiMoški ŽenskeŽenske
SkupajSkupaj 4141 1717 2424
Regija 1Regija 1 1414 33 1111
Regija 2Regija 2 1717 99 88
Regija 3Regija 3 1010 55 55
ALIALI
Primer vrednostne tabeleŠtevilo zaposlenih po spolu, dejavnosti do oddelka (SKD
2008) in razredih neto plače
SkupajSkupaj Razred1Razred1 Razred2Razred2 Razred3Razred3
SkupajSkupaj 8080 3030 3737 1313
SKD1SKD1 40 [1 podj.]40 [1 podj.] 1010 2828 22
SKD2SKD2 40 [4 podj.]40 [4 podj.] 2020 99 1111
MoškiMoški 5050 2020 2525 55
SKD1SKD1 2626 55 2020 11
SKD2SKD2 2424 1515 55 44
ŽenskeŽenske 3030 1010 1212 88
SKD1SKD1 1414 55 88 11
SKD2SKD2 1616 55 44 77
ZAŠČITA MIKROPODATKOV
Določimo:- direktne identifikatorje (odstranimo);- ključne spremenljivke (identifikacija poročevalske enote);- občutljive spremenljivke.
Metode za zaščito mikropodatkov:• dodajanje šuma;• zaokroževanje;• združevanje v (večje) razrede;• prag;• metoda manjkajočih vrednosti;• druge.
Primer mikropodatkov, prag 2Starost Spol Kraj Poklic
28 moški Ljubljana biolog
33 moški Ljubljana kemik
35 moški Maribor biolog
30 moški Maribor kemik
24 moški Ljubljana kemik
40 moški Maribor kemik
50 moški Ljubljana biolog
31 moški Maribor kemik
31 moški Ljubljana kemik
55 moški Maribor kemik
Ključ Št. pojavov
Ljubljana – biolog 2
Ljubljana – kemik 3
Maribor – biolog 1
Maribor – kemik 4
Primer mikropodatkov, prag 2Starost Spol Kraj Poklic
28 moški Ljubljana biolog
33 moški Ljubljana kemik
35 moški Maribor neznano
30 moški Maribor kemik
24 moški Ljubljana kemik
40 moški Maribor kemik
50 moški Ljubljana biolog
31 moški Maribor kemik
31 moški Ljubljana kemik
55 moški Maribor kemik
LEP DAN ŠE NAPREJ VSEM SKUPAJ!