Szolgáltatásbiztonság IT rendszerekben

Preview:

DESCRIPTION

Intelligens rendszerfelügyelet. Szolgáltatásbiztonság IT rendszerekben. Micskei Zoltán (részben Dr. Majzik István előadásai alapján). Szolgáltatásbiztonság??. hideg tartalék. rendelkezésre állás. hibatűrés. szoftver redundancia. nem tervezett leállás. szoftver RAID. 0 perc leállás. - PowerPoint PPT Presentation

Citation preview

1Budapesti Műszaki és Gazdaságtudományi EgyetemMéréstechnika és Információs Rendszerek Tanszék

Szolgáltatásbiztonság IT rendszerekben

Micskei Zoltán(részben Dr. Majzik István előadásai alapján)

Intelligens rendszerfelügyelet

2

Szolgáltatásbiztonság??

rendelkezésre állás

hibatűrés

0 perc leállás

HA fürt

szoftver RAID

business continuity

katasztrófa elhárítás

replikáció

hideg tartalék

megbízhatóság

meghibásodás

szoftver redundancia

visszalépéses helyreállítás

„öt kilences” rendszer

nem tervezett leállás

hibajavító kódok

3

Tartalomjegyzék

A szolgáltatásbiztonság fogalma

A szolgáltatásbiztonságot befolyásoló tényezők

A szolgáltatásbiztonság eszközei

Szolgáltatásbiztonság analízise

4

Szolgáltatásbiztonság

Szolgáltatásbiztonság (dependability): a képesség, hogy igazoltan bízni lehet a szolgáltatásban

o igazoltan: elemzésen, méréseken alapulo bizalom: szolgáltatás az igényeket kielégíti

5

Szolgáltatásbiztonság jellemzői

Rendelkezésre állás

Megbízhatóság

Biztonságosság

Bizalmasság

Integritás

Karbantarthatóság

Szolgáltatás-biztonság

(Adat)Biztonság

Laprie et. al.: Basic Concepts and Taxonomy of Dependable and Secure Computing

6

Szolgáltatásbiztonság jellemzői

Rendelkezésre állás

Megbízhatóság

Biztonságosság

Bizalmasság

Integritás

Karbantarthatóság

Szolgáltatás-biztonság

(Adat)Biztonság

Laprie et. al.: Basic Concepts and Taxonomy of Dependable and Secure Computing

Használatra kész szolgáltatás esélye

Folytonosan hibamentes szolgáltatás

Katasztrofális következmények

nélküli szolgáltatás

Nincs hibás változtatásJavítás és módosítás

lehetősége

Nincs jogosulatlan hozzáférés

7

Rendelkezésre állás követelményei

Elosztott rendszerek (hibatűrés nélkül, irányadó számok): 1 szgép: 95% 2 szgép: 90% 5 szgép: 77% 10 szgép: 60%

Készenléti tényező Max. kiesés 1 év alatt2 db 9-es (99%) 3,5 nap3 db 9-es (99,9%) 9 óra4 db 9-es (99,99%) 1 óra5 db 9-es (99,999%) 5 perc6 db 9-es (99,9999%) 32 másodperc7 db 9-es (99,99999%) 3 másodperc

8

Tartalomjegyzék

A szolgáltatásbiztonság fogalma

A szolgáltatásbiztonságot befolyásoló tényezők

A szolgáltatásbiztonság eszközei

Szolgáltatásbiztonság analízise

9

Befolyásoló tényezők Hibajelenség (failure):

A specifikációnak nem megfelelő szolgáltatás

Hiba (error):Hibajelenséghez vezető rendszerállapot

Meghibásodás (fault):A hiba feltételezett oka

10

Hatáslánc Meghibásodás Hiba Hibajelenség

o pl. szoftver:• meghibásodás: programozó hiba: csökkentés helyett növel• hiba: vezérlés ráfut, változó értéke hibás lesz• hibajelenség: számítás végeredménye rossz

o pl. hardver:• meghibásodás: kozmikus sugárzás egy bitet átbillent• hiba: hibás memóriacella olvasása• hibajelenség: robotkar a falnak ütközik

Rendszer hierarchiaszintjének függvényeo alsó szintű hibajelenség felsőbb szinten meghibásodás

• kimenet beragadás egy chip szintjén hibajelenség• rendszer szintjén meghibásodás (chip a cserélhető komponens)

11

A hibajelenségek okai IT rendszerek esetén

Forrás: Medgyesi Zoltán: Nagy rendelkezésre állású kiszolgálófürtök vizsgálata, Diplomamunka, BME, 2007.

12

Meghibásodások kategorizálása Hardverhibák

o alaprendszer (alaplap, processzor, memória)

o tápellátás (tápegység, szünetmentes táp)

o adattároló alrendszer o hálózat

Szoftverhibák o az operációs rendszer hibái o alkalmazáshibák o illesztőprogram-hibák

Emberi hibák o rendszergazdai hibák o illetékes felhasználók nem

rosszindulatú hibái o illetékes felhasználók

rosszindulatú hibái o illetéktelen felhasználók

támadásai Környezeti hatások

o üzemeltetési környezet rendellenességei, például a légkondicionálás leállása, bombariadó, csőtörés

o természeti katasztrófák

13

Tartalomjegyzék

A szolgáltatásbiztonság fogalma

A szolgáltatásbiztonságot befolyásoló tényezők

A szolgáltatásbiztonság eszközei

Szolgáltatásbiztonság analízise

14

A szolgáltatásbiztonság eszközei Hiba megelőzés: Meghibásodás megakadályozása

o fizikai hibák: jó minőségű alkatrészek, árnyékolás,...o tervezési hibák: verifikáció

Hiba megszüntetés:o prototípus fázis: tesztelés, diagnosztika, javításoműködés közben: monitorozás, javítás

Hibatűrés: Szolgáltatást nyújtani hiba esetén isoműködés közben: hibakezelés, redundancia

Hiba előrejelzés: Hibák és hatásuk becsléseomérés és „jóslás”, megelőző karbantartás

15

Hibatűrő rendszerek

Fel kell készülni a működés közbeni hibákra!

Hibatűrés: Szolgáltatást nyújtani hiba esetén isoműködés közbeni autonóm hibakezeléso beavatkozás a meghibásodás hibajelenség láncba

Alapfeltétel: Redundancia (tartalékolás)o többlet erőforrások a hibás komponensek kiváltására

16

Redundancia megjelenése1. Hardver redundancia

o többlet hardver erőforrások• eleve a rendszerben lévők (elosztott rendszer)• hibatűréshez betervezett (tartalék)

2. Szoftver redundanciao többlet szoftver modulok

3. Információ redundanciao többlet információ a hibajavítás érdekében

• hibajavító kódolás (ECC)

4. Idő redundanciao ismételt végrehajtás, hibakezelés többlet ideje

Együttes megjelenés!

17

Redundancia típusai

Hidegtartalék (passzív redundancia)

Langyos tartalék

Meleg tartalék (aktív redundancia)

18

Költségoptimalizálás

Hibatűrés mértéke

Hibatűrés költsége

Kialakítás költsége

Kiesés költsége

Eredő

Optimum

19

Tartalomjegyzék

A szolgáltatásbiztonság fogalma

A szolgáltatásbiztonságot befolyásoló tényezők

A szolgáltatásbiztonság eszközei

Szolgáltatásbiztonság analízise

20

Szolgáltatásbiztonság analízise Feladatok:

o Hibamódok, meghibásodások azonosításao Analízis: kvalitatív és kvantitatívo…

21

Példa: szolgáltatásbiztonság analízise

Feladat: Milyen meghibásodások esetén nem lesz elérhető a szolgáltatás (webáruház)?

22

Feladat: Meghibásodások azonosítása Milyen meghibásodás esetén nem lesz elérhető a

szolgáltatás (webáruház)?

Áramkimaradás, HW hiba, hálózati elem/kábel hiba, szerver szolgáltatások hibája, alkalmazás hiba, frissítés telepítése, túlterhelés, támadás, félrekonfigurálás, verzió inkompatibilitás, vírus…

Hogyan lehetne ezeket szisztematikusan összegyűjteni?

23

Hibamód és hatás analízis (FMEA) Meghibásodás és hatásaik felsorolása

Komponens Hibamód Valószínűség Hatás

Webszerver HW hiba 10% Szolg. kiesés, alkatrész csere

SW frissítés 80% Időleges kiesés

SQL szerver Lemez megtelik 20%

Csak statikus tartalom érhető el

24

Hibafa (Fault tree) Hogyan állhat elő a gyökérben lévő hibajelenség?

Elemek (részlet)o AND kapuo OR kapuo Téglalap: köztes eseményo Kör: alapszintű meghibásodásoko „Gyémánt”: nem kibontott esemény

25

Szolgáltatásbiztonság analízise Feladatok:

o Hibamódok, meghibásodások azonosításao Analízis: kvalitatív és kvantitatívo …

Módszereko Ellenőrző listáko Táblázatok (pl. FMEA: Failure Mode and Effect Analysis)o Hibafáko Állapot alapú módszerek (pl. Petri hálók)o …

26

Példa: hibatűrés beépítése

27

Példa: hibatűrés beépítése

Másodlagos DNS szerver alkalmazása

Terheléselosztó fürt

Hálózati utak duplikálása Melegtartalék

SQL szerver

2. ISP használata

Melyik megoldás(oka)t éri meg használni?

28

Analízis: hibafa SHARPE eszköz Hibafa rajzolása

29

Hibafa – analízis Kvalitatív:

o egyszeres hibapont (SPOF) azonosításao kritikus esemény: több úton is hibajelenséget okoz

Kvantitatív:o alapszintű eseményekhez valószínűség rendeléseo gyökérelem jellemzőjének (pl. megbízhatóság)

számolásao Probléma: honnan lesznek jó bemenő adataink?

30

Meghibásodási adatok Analízis alapja: meghibásodási valószínűségek Honnan lesznek jó adatok:

o Becsléso Saját monitorozó rendszero Külső tanulmányok, számok (hihetőség, pontosság?)

Példák:o Cisco switch MTBF ~ 200000 óra (=22,8 év)o IBM S/390 mainframe MTTF 45 évoWindows XP MTTF 608 óraowebszerver MTTF ~ 16 nap…

31

Meghibásodási adatok – példa

Forrás: Jeff Dean, „Designs, Lessons and Advice from Building Large Distributed Systems”, Google

32

Időzített Petri hálók Elemek:

Helyek (kör), tokenek (Figyelem ez csak most, csak itt jelent állapotot!)

Átmenetek (téglalap) Időzítés rendelése az átmenetekhez

Determinisztikus Valószínűségi eloszlás alapján

Alap meghibásodási blokkok:

33

Analízis: Petri-háló TimeNET eszköz Alap blokkok és paraméterek

34

Analízis: Petri-hálóA teljesmodell:

35

Analízis: érzékenység és költségvizsgálat Érzékenység: melyik paraméter változása

befolyásol a legjobban:

Költségoptimalizálás:Költség Rendelkezésre állás Kiesés Kiesés költsége Nyereség

Alapmodell 0 0,904 34,931Tartalék SQL 0,913 31,792Tartalék web 0,921 28,945Tartalék mindkettőből 0,930 25,733Web szerver 0,914 31,463SQL szerver 0,914 31,536Web szerver + tartalék 0,933 24,565SQL szerver + tartalék 0,936 23,506

3 493 050,000500 000 3 179 150,000 -186 100,000500 000 2 894 450,000 98 600,000

1 000 000 2 573 250,000 -80 200,0001 000 000 3 146 300,000 -653 250,0002 000 000 3 153 600,000 -1 660 550,0002 000 000 2 456 450,000 -963 400,0003 000 000 2 350 600,000 -1 857 550,000

36

Példa: hibatűrés beépítése

Hibatűrő a rendszerünk?

37

Példa: hibatűrés beépítése

Hibatűrő a rendszerünk?

Attól függ:o Bizonyos SPOF-ek ellen védekeztünk

DEo sok kiesési lehetőség maradt mégo Adatok törlése, teljes szerverterem elpusztulása,

adminisztrátori hibák, OS hotfix miatti újraindítás…

38

Példa: hibatűrés beépítése

Tanulság: mindig tudjuk, hogy• mi ellen akarunk védekezni,• milyen módszerek vannak arra,• megéri-e védekezni.

39

Összefoglalás Szolgáltatásbiztonság

o Jellemzők, hatáslánc, eszközök

Hibatűréso Redundancia megjelenése

Analízis: oMérnöki és matematikai módszereko Hibamódok azonosításaoMegfelelő védekezési módszer kiválasztása

Recommended