Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
STROJNO UČENJE PRI NAČRTOVANJU ALGORITMOV ZA RAZPOZNAVANJE
TIPOV GIBANJA
Rok Piltaver
Institut "Jožef Stefan", Odsek za inteligentne sisteme
Informacijska družba 2008
16.10.2008, Ljubljana, Slovenija
Potek predstavitve
Uvod
Kako omiliti šum
Atributi
Odkrivanje zakonitosti
Rezultati
Povzetek
Uvod
Motivacija in zastavljena naloga
Sistemi za lociranje v realnem času (RTLS)
Ubisense RTLS
Gibanje - mirovanje
Kako omiliti šum
Atributi
Odkrivanje zakonitosti
Rezultati
Povzetek
Motivacija in zastavljena naloga
Motivacija:
RTLS sistemi postajajo vse cenejši.
Dostopnejše različice so nenatančne.
Potrebujemo robustne algoritme.
Težko je izdelati optimalen algoritem.
Zastavljena naloga:
Projekta PDR in Confidence potrebujeta primitivne rutine za razpoznavanje tipov gibanja (hodi, sedi, teče, leži, ...).
Potrebujemo algoritem za ločevanje med gibanjem in mirovanjem, ki deluje tudi pri natančnosti meritev ± 15 cm.
Sistemi za lociranje v realnem času (RTLS)
Sistemi za lociranje v realnem času - Real Time Location System -omogočajo lociranje objektov v 2D ali 3D prostoru v realnem času.
Razlikujejo se po:
Tehnologiji: Ultra-wideband, Wi-Fi, optična, infrardeča, ultrazvočna, z žiroskopi in pospeškomeri, idr.
Natančnosti: od ± 1 mm do ± 10 m
Frekvenci osveževanja: od 0,1 Hz do 60 Hz
Ceni: od 2.000 € do 100.000 €
Področju delovanja: od nekaj m2 do nekaj sto m2
Zanesljivosti
Velikosti in teži značk in senzorjev
Raznih omejitev za delovanje (vidna linija, napajanje)...
Ubisense RTLS
Tehnologija: Ultra-wideband
Natančnost: ± 15 cm
Frekvenca osveževanja: max 9 Hz
Cena: 12.000 €
Področje delovanja: od 5 x 5 m do 30 x 30 m
Ne potrebuje vidne linije, baterije zadostjejo za več let.
Razmeroma majhne in nemoteče značke.
Zahteva natančno kalibracijo.
Natančnost je na robu uporabnosti.
Gibanje - mirovanje
1.65
1.75
4.20 4.30 4.40
m
m
0.8
1.8
1.3 2.3 3.3 4.3
m
m
Šum je dovolj velik, da je težko ločiti mirovanje od gibanja.
Povprečna hitrost med mirovanjem je >22 cm/s.
Do 3% meritev ima veliko napako (>40 cm).
Uvod
Kako omiliti šum
Filtriranje
Povprečenje
Daljši vektorji
Več vektorjev
Atributi
Odkrivanje zakonitosti
Rezultati
Povzetek
Kako omiliti šum 1
V 1-3% meritvah se pojavi velika napaka.
Če vema kako gibanje opazujemo (hitrost, pospešek) lahko filtriramo take napake.
Napačne meritve nadomestimo z interporiranimi vrednostmi.
1.40
1.60
1.80
2.00
2.20
2.40
2.60
2.80
3.00
3.20
3.40
2.70 2.90 3.10 3.30 3.50 3.70 3.90 4.10 4.30
m
m
Kako omiliti šum 2
Položaj določimo kot uteženo vsoto položaja treh zaporednih meritev Ti -1, Ti in Ti +1, posebej za koordinati x in y.
Optimalno vrednost konstante w določimo s strojnim učenjem.
1.60
1.80
2.00
2.20
2.40
4.20 4.40 4.60
m
m
Kako omiliti šum 2
Položaj določimo kot uteženo vsoto položaja treh zaporednih meritev Ti -1, Ti in Ti +1, posebej za koordinati x in y.
Optimalno vrednost konstante w določimo s strojnim učenjem.
1.60
1.80
2.00
2.20
2.40
4.20 4.40 4.60
m
m
izmerjene
povprečene
Kako omiliti šum 3
Namesto vektorjev premika med dvema zaporednima meritvama Ti in Ti +1 upoštevamo vektorje med meritvami, ki so dlje narazen (Ti in Ti +n ).
V tem primeru je razmerje med šumom in dejansko razdaljo ugodnejše.
Tudi konstanto n določimo s pomočjo strojnega učenja.
Kako omiliti šum 4
Izberemo število zaporednih vektorjev premika N (oz. število meritev položaja zmanjšano za n + 2) iz katerih izračunamo atribute.
Premajhen N => premajhna zanesljivost ciljnega algoritma
Prevelik N => večja zakasnitev algoritma
Primer: M = N + n + 2 = 6, n = 2, N = 2.
Uvod
Kako omiliti šum
Atributi Hitrost
Pot
Kot
Odkrivanje zakonitosti
Rezultati
Povzetek
Hitrost
Ob mirovanju je hitrost blizu 0.
Ob gibanju je hitrost konstantna.
Povprečna hitrost:
Vsota razlik hitrosti:
Standardni odklon hitrosti:
Pot
Pot ob mirovanju je blizu 0.
Pot med gibanjem je daljša – razlika tudi ob počasnem gibanju.
Na začetku in koncu poti se lahko nahaja na isti točki.
Pot računamo kot vsoto razdalj med prvo in srednjo ter srednjo in zadnjo točko:
d (T1,T2) evklidska razdalja med točkama T1 in T2.
M = N + n +2
Ob mirovanju se smer zaradi šuma hitro spreminja.
Ob gibanju je smer bolj konstantna.
Vsota razlik kotov:
Standardni odklon kotov:
Kot
Uvod
Kako omiliti šum
Atributi
Odkrivanje zakonitosti Izbira algoritma
Izbira parametrov
Rezultati
Povzetek
Izbira algoritma za odkrivanje zakonitosti
Konstante:
w {0; 0,333; 0,5; 0,75; 1}
n {1; 4; 7; 10}
N {9; 14; 19; 24}
C4.5 max klas. točn. = 97,85%
C4.5 min klas. točn. = 96,56%
94.5
95
95.5
96
96.5
97
97.5
98
1 2 3 4 5 6 7 8 9 10
Kla
sif
ika
cij
sk
a t
očn
ost
%
Izbor konstant naivni Bayes SVM 10-NN
AdaBoost C4.5 RIPPER
Algoritmi: naivni Bayesov klasifikator, metoda podpornih vektorjev, 10-najbližjih sosedov, AdaBoost, odločitvena drevesa C4.5, odločitvena pravila RIPPER
Izbira parametrov za računanje atributov
Konstante:
w [0, 1] , korak 0,1
n [1, 9] , korak 1
N [5, 28], korak 1
optimum: N=14, n=3, w=0.5
1
3
5
7
9
90
91
92
93
94
95
96
97
98
99
100
56
78
91011
1213141516n
%
N
99-100
98-99
97-98
96-97
95-96
94-95
93-94
92-93
91-92
90-91
1
3
5
7
9
96
97
98
99
100
n
%
w
99-100
98-99
97-98
96-97
3069 učnih množic
Algoritem: C4.5
Minimalno 10 primerov v listu
10-kratno prečno preverjanje
Uvod
Kako omiliti šum
Atributi
Odkrivanje zakonitosti
Rezultati
Povzetek
Rezultati
Klasifikacijska točnost 96,6 % ob 10-kratnem prečnem preverjanju in učenju na združeni množici podatkov.
Klasifikacijska točnost 94 % na testnih podatkih.
Brez robnih primerov je klasifikacijska točnost še višja.
87 % primerov v 2 najbolj zastopanih listih z največjo čistostjo.
Pogosto je potrebno izračunati le 1 ali 2 atributa.
Maksimalno potrebujemo 3 atribute.
Vrh drevesa vedno enak.
Uvod
Kako omiliti šum
Atributi
Odkrivanje zakonitosti
Rezultati
Povzetek
Povzetek
Testni posnetki.
Grafična predstavitev in statistična obdelava.
Večje število potencialnih atributov.
Izbor algoritma za strojno učenje.
Nastavljanje parametrov.
Učenje zakonitosti v podatkih.
Implementacija algoritma za dano aplikacijo.
Hvala za pozornost.
?