Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
Pawe
ł For
czm
ańsk
i, W
IZUT
1/54
SystemyMultimedialne
{ }
Deskryptory wizualneDeskryptory wizualnena podstawie MPEG-7na podstawie MPEG-7
kolor i teksturakolor i tekstura
dr inż. Paweł Forczmań[email protected]
Pawe
ł For
czm
ańsk
i, W
IZUT
2/54
SystemyMultimedialne
{ }Visual Descriptors
Color Texture MotionShape
• Contour Shape
• Region Shape
• 2D/3D shape
• 3D shape
• Camera motion
• Motion Trajectory
• Parametric motion
• Motion Activity
• Texture Browsing
• Homogeneous texture
• Edge Histogram
1. Histogram
Scalable Color
Color Structure
GOF/GOP
2. Dominant Color
3. Color Layout Face recognition
Pawe
ł For
czm
ańsk
i, W
IZUT
3/54
SystemyMultimedialne
{ } WprowadzenieWprowadzenie
Opisowi z wykorzystaniem deskryptorów podlegają tzw. obiekty wizyjne (ang. video object), które opisywane są przy użyciu następujących cech:
koloru,kształtu,teksturyoraz ruchu,
dlatego też deskryptory wizyjne standardu można podzielić na grupy odnoszące się do każdej z tych cech.
Pawe
ł For
czm
ańsk
i, W
IZUT
4/54
SystemyMultimedialne
{ } Model Eksperymentalny -XMModel Eksperymentalny -XM
Model Eksperymentalny (ang. Experimentation Model, XM) to oprogramowanie referencyjne (ang. Reference Software) implementujące standard MPEG-7, które zostało opracowane przez międzynarodową grupę naukowców zajmujących się przetwarzaniem obrazów oraz opisem danych, w celu prowadzenia badań i testów. Jego kod źródłowy został napisany w języku C++ i jest udostępniany poprzez serwer:
http://iiss039.joanneum.at/cms/index.php?id=145
Pawe
ł For
czm
ańsk
i, W
IZUT
5/54
SystemyMultimedialne
{ } Model Eksperymentalny -XMModel Eksperymentalny -XM
XM zawiera implementację zarówno części normatywnych standardu MPEG-7 jak również dodatkowych komponentów, niezbędnych do ekstrakcji opisu danych multimedialnych.
W wyniku kompilacji kodu źródłowego XM uzyskuje się dwa rodzaje aplikacji:
Służące do ekstrakcji opisu;Wyszukujące odpowiednią zawartość wizyjną na podstawie zdefiniowanego zapytania.
Pawe
ł For
czm
ańsk
i, W
IZUT
6/54
SystemyMultimedialne
{ } Model Eksperymentalny -XMModel Eksperymentalny -XM
Pawe
ł For
czm
ańsk
i, W
IZUT
7/54
SystemyMultimedialne
{ } Model Eksperymentalny -XMModel Eksperymentalny -XM
Pawe
ł For
czm
ańsk
i, W
IZUT
8/54
SystemyMultimedialne
{ } Model Eksperymentalny -XMModel Eksperymentalny -XM
Pawe
ł For
czm
ańsk
i, W
IZUT
9/54
SystemyMultimedialne
{ } Deskryptory koloruDeskryptory koloru
Pawe
ł For
czm
ańsk
i, W
IZUT
10/5
4
SystemyMultimedialne
{ } Deskryptory koloruDeskryptory koloru
Oprócz deskryptorów opisujących treść obrazu pod względem koloru XM zawiera również dwa deskryptory pomocnicze: Color Space Descriptor (CSD) i Color Quantization Descriptor (CQD). Nie są one wykorzystywane jako samodzielne ale w połączeniu z innymi deskryptorami.
CSD określa przestrzeń barw użytą przez inny deskryptor szczególnie przez Dominant Color Descriptor.
CQD określa natomiast poziomy kwantyzacji dla potrzeb innych deskryptorów.
Pawe
ł For
czm
ańsk
i, W
IZUT
11/5
4
SystemyMultimedialne
{ } Przestrzenie barw w MPEG-7Przestrzenie barw w MPEG-7
● Red-Green-Blue
● 256 wartości w każdym z kierunków● Kwantyzacja – np. 4 przedziały w każdym kierunku● Każdy z pikseli definiowany jest jako punkt w przestrzeni● Budowa połączonego histogramu● Duża liczba dostępnych algorytmów kwantyzacji(np. median
cut, GLA,etc.)● Metryka odległościowa do oceny podobieństwa
Pawe
ł For
czm
ańsk
i, W
IZUT
12/5
4
SystemyMultimedialne
{ } Przestrzenie barw w MPEG-7Przestrzenie barw w MPEG-7
● Hue (H) = obrót● Saturation (S) = czystość● Value (V) = jasność
● Kwantyzacja z różną dokładnością:● 256 przedziałów (16 H, 4 S, 4 V)● 128 przedziałów (8 H, 4 S, 4 V)● 16 przedziałów (4 H, 2 S, 2 V)● I tak dalej...
Pawe
ł For
czm
ańsk
i, W
IZUT
13/5
4
SystemyMultimedialne
{ } Przestrzenie barw w MPEG-7Przestrzenie barw w MPEG-7
● Hue-Max-Min-Diff● Max = max(R,G,B), Min = min(R,G,B)● Diff = Max-Min, Sum = (Max+Min)/2
● Podobna do HSV
● Kwantyzacja niejednorodna● 5 części Diff definiuje 5 podprzestrzeni● Częsci H i S dzielone są na różną ilośc przedziałów w każdej
podprzestrzeni● t.j., dla 128 przedziałów, podprzestrzeń jest dzielona na 8 przedziałów H i 4 S.
Pawe
ł For
czm
ańsk
i, W
IZUT
14/5
4
SystemyMultimedialne
{ } HMMDHMMD
Pawe
ł For
czm
ańsk
i, W
IZUT
15/5
4
SystemyMultimedialne
{ } Dominant Color DescriptorDominant Color DescriptorDCD umożliwia opis kolorów reprezentatywnych dla danego obrazu lub regionu, a co za tym idzie pozwala na efektywne przeszukiwanie nawet bardzo dużych baz danych. DCD zdefiniować można jako następujący wektor:
F={(ci,pi,vi),s}, i=1,2,...,Ngdzie:N - liczba kolorów dominujących,ci - wektor określający wartości poszczególnych składowych w odpowiedniej przestrzeni barw,pi – względny udział składowej opisanej wektorem ci w danym obrazie (wartości z zakresu ; ∑ pi=1 ),vi - opcjonalny parametr opisujący wariancję wartości koloru w obszarze wokół badanego koloru (ang. Color Variance),s - spójność przestrzenna (ang. Spatial Coherency) dla badanego koloru dominującego.
Pawe
ł For
czm
ańsk
i, W
IZUT
16/5
4
SystemyMultimedialne
{ } DCD - ograniczeniaDCD - ograniczenia
Liczba kolorów dominujących może być różna dla poszczególnych obrazów, jednakże maksymalna liczba określona przez standard wynosi 8 – co zostało przyjęte jako warunek wystarczający dla poprawnej klasyfikacji obrazu pod względem DCD.
Pawe
ł For
czm
ańsk
i, W
IZUT
17/5
4
SystemyMultimedialne
{ } DCD – wyszukiwanie (1/2)DCD – wyszukiwanie (1/2)
Wyszukiwanie podobieństw z wykorzystaniem DCD polega na obliczeniu DCD dla każdego koloru dominującego w obrazie będącym zapytaniem, po czym wyliczana jest dla par obrazów (obraz – zapytanie, obraz badany) następująca odległość:
gdzie indeksy 1 i 2 dotyczą deskryptorów obu obrazów a parametr ak,l oznacza współczynnik podobieństwa między dwoma kolorami ck i cl
Dokładną definicję parametru a1i,2j zawiera następny slajd..
Pawe
ł For
czm
ańsk
i, W
IZUT
18/5
4
SystemyMultimedialne
{ } DCD – wyszukiwanie (2/2)DCD – wyszukiwanie (2/2)
gdzie:
d k,l – odległość Euklidesowa
pomiędzy kolorami ck i c
l;
Td – maksymalna odległość
pomiędzy podobnymi kolorami.D max=α Td (α=1..1,5)
Pawe
ł For
czm
ańsk
i, W
IZUT
19/5
4
SystemyMultimedialne
{ } DCD – w praktyceDCD – w praktyceJak widać z przedstawionych zależności w najprostszej wersji opisu nie jest konieczne branie pod uwagę przy wyszukiwaniu wartości wariancji i spójności przestrzennej.
niska spójnośćwysoka spójność
Najczęściej same wartości prawdopodobieństwa oraz wektory dają zadowalające rezultaty. Jeżeli jednak wymagana jest wysoka dokładność procedury wyszukującej należy uwzględnić również wspomniane wartości vi oraz si.Odpowiednie zależności znaleźć można w standardzie MPEG-7.
Pawe
ł For
czm
ańsk
i, W
IZUT
20/5
4
SystemyMultimedialne
{ } DCD – realizacjaDCD – realizacja● konwersja z przestrzenni RGB do przestrzeni Luv,
● kwantyzacja kolorów na bazie algorytmu kwantyzacji wektorowej GLA (General Lloyd Algorithm),
● ponowna konwersja Luv do RGB,
● zbudowanie statystyki, która każdy kolor dominujący charakteryzuje przez trójkę RGB i procentową zawartość w obrazie pikseli należących do poszczególnego koloru dominującego,
● obliczenie wariancji kolorów w danej grupie (jako średniego odchylenia kolorów oryginalnych od reprezentantów w każdej grupie),
● obliczenie parametru spójności przestrzennej wyznaczonych kolorów dominujących.
Pawe
ł For
czm
ańsk
i, W
IZUT
21/5
4
SystemyMultimedialne
{ } DCD – uproszczeniaDCD – uproszczenia● W celu przyspieszenia działania algorytmu kolorów dominujących
stosuje się często uproszczoną reprezentację kolorów w przestrzeni HSV.
● Dodatkowo, w celu zmniejszenia kosztów obliczeniowych realizacji algorytmu GLA, stosuje się uproszczoną formułę kwantyzacji.
● Dalej zaprezentowano kroki zmodyfikowanego algorytmu obliczania kolorów dominujących:
Pawe
ł For
czm
ańsk
i, W
IZUT
22/5
4
SystemyMultimedialne
{ } DCD – uproszczeniaDCD – uproszczenia1. konwersja RGB do HSV2. kwantyzacja nieliniowa,zgodnie z następującymi progami, w której H odpowiada za kanał Hue, S – kanał Saturation i V – kanał Value. W ten sposób tworzone są trzy macierze po kwantyzacji: Hquant , Squant i Vquant :
H quant (x , y)={0 dla H (x , y)
Pawe
ł For
czm
ańsk
i, W
IZUT
23/5
4
SystemyMultimedialne
{ } DCD – uproszczeniaDCD – uproszczenia3. Utworzenie histogramu trójwymiarowego H(3D), który przechowuje informację o częstości występowania 72 wartości kolorów po kwantyzacji.4. Przepisanie histogramu trójwymiarowego do wektora jednowymiarowego, zgodnie z regułą:
H (1D)(9h+3 s+v)=H (3D)(h , s , v)
Pawe
ł For
czm
ańsk
i, W
IZUT
24/5
4
SystemyMultimedialne
{ } DCD – uproszczeniaDCD – uproszczenia5. Wybór 8 kolorów dominujących zgodnie z ich licznością.6. Normalizacja ich wartości za pomocą dzielenia przez sumę ich wartości.
Pawe
ł For
czm
ańsk
i, W
IZUT
25/5
4
SystemyMultimedialne
{ } DCD – przykładyDCD – przykładyPrzykładowe wyniki działania DCD w projekcie FireStyle
Pawe
ł For
czm
ańsk
i, W
IZUT
26/5
4
SystemyMultimedialne
{ } Scalable Color DescriptorScalable Color Descriptor
Scalable Color Descriptor to deskryptor oparty na transformacji Haara zastosowanej na wartościach histogramu koloru w przestrzeni HSV.Wartości histogramu są normalizowane i w sposób nieliniowy kwantowane do reprezentacji liczby czterobitowej naturalnej w każdym z podzakresów histogramu.Na powstałych wartościach wykonywana jest transformacja Haara.
Zależnie od zdefiniowanych parametrów deskryptora wartości mogą być skalowane poprzez odrzucanie mniej znaczących bitów współczynników transformaty jak również przez zmianę liczby wyznaczonych współczynników transformaty Haara.
Pawe
ł For
czm
ańsk
i, W
IZUT
27/5
4
SystemyMultimedialne
{ } Scalable Color DescriptorScalable Color DescriptorPrzestrzeń HSV jest jednorodnie dyskretyzowana na 256 przedziałów:16 poziomów dla H, 4 dla S i 4 dla V. Poziomy histogramu obcinane są do postaci 11-bitowej.Następnie, w celu uzyskania bardziej wydajnego kodowania, wartości 11-bitowe są nieliniowo mapowane na wartości 4-bitowe, tak aby zwiększyć znaczenie dla wartości częściej występujących, kosztem tych rzadko występujących.
Całkowita wielkość deskryptora to 1024 bits/histogram, co jest wielkością często zbyt dużą, dlatego stosuje się kodowanie Haara.
Proces kodowania powoduje zmniejszenie dokładności równoważny zapisaniu 128, 64, 32 przedziałów
Pawe
ł For
czm
ańsk
i, W
IZUT
28/5
4
SystemyMultimedialne
{ } Generowanie SCDGenerowanie SCD
Pawe
ł For
czm
ańsk
i, W
IZUT
29/5
4
SystemyMultimedialne
{ } Przykłady SCDPrzykłady SCD
Wyszukiwanie realizowane może być na dwa sposoby – w przestrzeni współczynników Haara lub - po wyliczeniu transformaty odwrotnej - na wartościach histogramu. Obliczana jest odległość L1 (suma różnic bezwzględnych).W przestrzeni współcz. Haara porównywanie odbywa się poprzez obliczenie odległości Hamminga – porównywane są dwa deskryptory a wynik takiego porównania to liczba bitów różniących te opisy.
Pawe
ł For
czm
ańsk
i, W
IZUT
30/5
4
SystemyMultimedialne
{ } Color Structure DescriptorColor Structure Descriptor
CSD opisuje obraz zarówno pod względem rozkładu kolorów jak również ich struktury. W odróżnieniu od histogramu koloru deskryptor ten bierze pod uwagę informacje przez histogram nie uwzględniane – strukturę przestrzenną koloru w badanym obrazie.
Ekstrakcja deskryptora odbywa się w dwóch etapach:• obliczanie histogramu CS (ang. Colour Structure) w przestrzeni HMMD skwantowanej wektorowo (184,120,64,32 przedziały);• nieliniowa kwantyzacja poziomów zgodnie z właściwościami statystycznymi obrazu.
Pawe
ł For
czm
ańsk
i, W
IZUT
31/5
4
SystemyMultimedialne
{ } Color Structure DescriptorColor Structure Descriptor
CSD opisuje lokalna strukturę koloru w obrazie przy wykorzystaniu elementu strukturującego w formie okna 8x8 pikseli. Oblicza on ilość wystąpień pikseli o danym kolorze.
Załóżmy, że c0,c1,..cM-1 oznacza M kolorów w obrazie (po kwantyzacji).
Color Structure Histogram oznacza się h(m), gdzie m=0,1,...M-1. Wartośc histogramu h(m) oznacza ilość elementów strukturujących zawierających przynajmniej jedno wystąpienie koloru m.
Pawe
ł For
czm
ańsk
i, W
IZUT
32/5
4
SystemyMultimedialne
{ } Color Structure DescriptorColor Structure DescriptorPierwszy krok ekstrakcji daje w wyniku specyficzny histogram związany ściśle ze strukturą koloru w obrazie. Wartości histogramu przedstawiają zatem nie tyle amplitudy w poszczególnych przedziałach co charakterystykę przestrzenną rozkładu koloru.
Pawe
ł For
czm
ańsk
i, W
IZUT
33/5
4
SystemyMultimedialne
{ } Color Structure DescriptorColor Structure DescriptorW celu wyliczenia CSD stosuje się element sturukturujący o wymiarach 8x8 (64 elementy), jednak w zależności od rozdzielczości stosuje się różny „rozrzut” elementów:
Pawe
ł For
czm
ańsk
i, W
IZUT
34/5
4
SystemyMultimedialne
{ } Color Structure DescriptorColor Structure Descriptor
gdzie: N - jest liczbą przedziałów kwantowania (N=256),i – indeks przedziału kwantowania.
Testy wykazały iż opis nie jest wrażliwy na zmiany rozdzielczości obrazu czy też kompresję co pokrywa się z założeniem iż istotnym elementem opisu jest rozkład przestrzenny koloru w obrazie.
Wyszukiwanie dopasowujące realizowane jest poprzez obliczenie podobieństwa między wektorami. Przy założeniu że hA(i) i hB(i) będą odpowiednio wektorami zawierającymi wartości deskryptorów dla obrazu A i B miara odległości będzie przedstawiać się następującą zależnością:
Pawe
ł For
czm
ańsk
i, W
IZUT
35/5
4
SystemyMultimedialne
{ } Color Layout DescriptorColor Layout DescriptorCLD to deskryptor zawierający opis koloru niewrażliwy na zmiany rozdzielczości, pozwalający na bardzo szybkie wyszukiwanie obrazów. Został on opracowany w celu umożliwienia opisu rozkładu przestrzennego koloru w obrazie.
Zasadniczą różnicą w stosunku do CSD jest fakt iż wynikiem działania deskryptora nie jest histogram kolorów lecz próbki transformaty DCT dla poszczególnych składowych przestrzeni YCbCr.
Pawe
ł For
czm
ańsk
i, W
IZUT
36/5
4
SystemyMultimedialne
{ } Color Layout DescriptorColor Layout Descriptor
Ekstrakcja deskryptora odbywa się w czterech etapach:
• podział obrazu na 64 (8x8) bloki,
• znalezienie dla każdego bloku koloru reprezentatywnego i przedstawienie obrazu jako 64 jednorodne co do koloru bloki, z których każdy zawiera jedynie kolor reprezentatywny,
• obliczenie DCT dla każdej składowej Y, Cb, Cr,
• uzyskane współczynniki są szeregowane zgodnie z uporządkowaniem zygzakowatym. Następnie pewna ich liczba jest kwantowana w sposób nieliniowy (64 poziomy dla współczynników DC i 32 dla współczynników AC).
Pawe
ł For
czm
ańsk
i, W
IZUT
37/5
4
SystemyMultimedialne
{ } Color Layout DescriptorColor Layout DescriptorPonieważ standard dopuszcza skalowalność deskryptora, możliwa jest różna liczba współczynników biorących udział w procesie kwantyzacji. Zalecane jest użycie 12 współczynników - 6 dla luminancji i po 3 dla obu chrominancji, jednakże istnieje też możliwość wykorzystania schematu wykorzystującego 18 współczynników (po 6 dla luminancji i każdej z chrominancji), jak również dowolne kształtowanie opisu przez podanie liczby próbek, osobno dla luminancji i chrominancji (możliwe wartości to 3, 6, 10, 15, 21,28 i 64).
W deskryptorze zawarta jest zatem definicja zastosowanego wzorca, określająca liczbę współczynników Y,Cb i Cr użytych w opisie.
Wyszukiwanie odbywa się poprzez obliczanie odległości Euklidesowej pomiędzy wartościami dwóch deskryptorów dla każdej składowej koloru z osobna.
Pawe
ł For
czm
ańsk
i, W
IZUT
38/5
4
SystemyMultimedialne
{ } Color Layout DescriptorColor Layout Descriptor
Wyszukiwanie odbywa się poprzez obliczanie odległości Euklidesowej pomiędzy wartościami dwóch deskryptorów dla każdej składowej koloru z osobna.
Pawe
ł For
czm
ańsk
i, W
IZUT
39/5
4
SystemyMultimedialne
{ } GoF/GoP Color DescriptorGoF/GoP Color Descriptor
Oferuje możliwość zastosowania SCD do kolekcji (podobnych) obrazów lub klatek video.
Określa on atrybut „agregacja” (ang. aggregation), który wskazuje w jakim stopniu histogramy pojedynczych obrazów lub klatek wpływają na reprezentację całościową w zakresie średniej, części wspólnych i mediany.
Pod pewnymi względami deskryptor ten jest lepszy od „zwykłej” średniej, ponieważ uniezależnia on opis od zmian oświetlenia, nakładania tekstu i in.
Pawe
ł For
czm
ańsk
i, W
IZUT
40/5
4
SystemyMultimedialne
{ } Edge Histogram DescriptorEdge Histogram Descriptor
Przechowuje informację o przestrzennym rozkładzie krawędziWykorzystuje histogram, który oblicza częstośc wystepowania krawędzi pod kątami: 0°, 45°, 90°, 135° i nie-kierunkoweSprawdza się dobrze w porównywaniu 1-do-1Niewielki rozmiar (240-bit)
Pawe
ł For
czm
ańsk
i, W
IZUT
41/5
4
SystemyMultimedialne
{ } Edge Histogram DescriptorEdge Histogram Descriptor
90° 0° 45° 135° nieokreślony
Pawe
ł For
czm
ańsk
i, W
IZUT
42/5
4
SystemyMultimedialne
{ } EHD - algorytmEHD - algorytm
Sub-block
Image-block
Wejściowy obraz dzielony jest na pod-obrazy (sub-images)
Pawe
ł For
czm
ańsk
i, W
IZUT
43/5
4
SystemyMultimedialne
{ } EHD - rozszerzenieEHD - rozszerzenie
Pawe
ł For
czm
ańsk
i, W
IZUT
44/5
4
SystemyMultimedialne
{ }Homogeneous Texture Descriptor Homogeneous Texture Descriptor (HTD)(HTD)Homogeneous Texture Descriptor służy do opisu jednorodnych tekstur obiektów wizyjnych. Metoda wykorzystywana do ekstrakcji tego deskryptora polega na wyznaczeniu parametrów statystycznych każdego z kanałów dwuwymiarowego widma obrazu statycznego. Podział widma na rozłączne subpasma odbywa się przy użyciu zastawu filtrów zamodelowanych funkcją Gabora.
Pawe
ł For
czm
ańsk
i, W
IZUT
45/5
4
SystemyMultimedialne
{ }Homogeneous Texture Descriptor Homogeneous Texture Descriptor (HTD)(HTD)Deskryptor HTD dzieli widmo obrazu na 30 kanałów o sześciu kierunkach orientacji i pięciu zakresach częstotliwości. Dla każdego z kanałów wyznaczana jest średnia energia składników widma oraz ich wariancja. Składnia deskryptora HTD jest następująca
Użyte we wzorze symbole oznaczają:
fDC – jednorodnie skwantowana wartość średniej luminancji obrazu;fSD – jednorodnie skwantowana wartość odchylenia standardowego luminancji punktów obrazu od średniej;ei – średnia wartość energii i-tego kanału;di – wartość dewiacji energii i-tego kanału.
Pawe
ł For
czm
ańsk
i, W
IZUT
46/5
4
SystemyMultimedialne
{ }Homogeneous Texture Descriptor Homogeneous Texture Descriptor (HTD)(HTD)
Pawe
ł For
czm
ańsk
i, W
IZUT
47/5
4
SystemyMultimedialne
{ }Homogeneous Texture Descriptor Homogeneous Texture Descriptor (HTD)(HTD)
Wyznaczone w procesie wyszukiwania obrazy różnią się znacznie zarówno luminancją jak i prezentowaną zawartością. W rezultacie porównania obrazów tekstur z użyciem deskryptora HTD otrzymujemy wyniki, które nie zawsze są zgodne z odczuciami percepcyjnymi. Jednakże wyznaczanie opisu HTD jest stosunkowo szybkie.
zapytanie
Pawe
ł For
czm
ańsk
i, W
IZUT
48/5
4
SystemyMultimedialne
{ } Texture Browsing Descriptor Texture Browsing Descriptor
Texture Browsing Descriptor opisuje tekstury obiektów wizyjnych poprzez wyznaczenie parametrów odpowiadających ludzkiemu sposobowi postrzegania. Składnia opisu deskryptora TBD jest następująca:
Użyte we wzorze symbole oznaczają:v1 – parametr regularności bądź strukturyzacji tekstury (ang. regularity);v2 v3 – parametry opisujące kierunkowość tekstury (ang.directionality);v4 v5 – parametry opisujące ziarnistość tekstury (ang. coarseness).
Pawe
ł For
czm
ańsk
i, W
IZUT
49/5
4
SystemyMultimedialne
{ } Texture Browsing Descriptor Texture Browsing Descriptor
Regularity(irregular, slightly regular, regular, highly regular)
Coarseness(fine, medium, coarse, very coarse)
Directionality(the dominant direction(s) characterizing the texture alignment).
TBD
HTD
Pawe
ł For
czm
ańsk
i, W
IZUT
50/5
4
SystemyMultimedialne
{ } Texture Browsing Descriptor Texture Browsing Descriptor
Pawe
ł For
czm
ańsk
i, W
IZUT
51/5
4
SystemyMultimedialne
{ } Inne deskryptory teksturalneInne deskryptory teksturalneCechy teksturalne mogą być obliczane na bazie parametrów statystycznych macierzy współwystępowania (ang. co-occurence matrix)Macierz taka, zdefiniowana dla obrazu I o rozmiarach n x m i dla przesunięcia (Δx, Δy) , dana jest wzorem:
Dla obrazów w odcieniach szarości - GLCM
C (i , j)=∑p=1n∑q=1
m {1, gdy I ( p ,q)=i oraz I ( p+Δ x , q+Δ y)= j0 w przeciwnym przypadku }
Pawe
ł For
czm
ańsk
i, W
IZUT
52/5
4
SystemyMultimedialne
{ } Inne deskryptory teksturalneInne deskryptory teksturalneGLCM określa rozkład występowania poszczególnych par kolorów obrazu w określonej odległości przestrzennej (Δx, Δy) .
Macierz taką następnie zamienia się w symetryczną, poprzez dodanie do niej jej własnej transpozycji.
Taka symetryczna macierz współwystępowania jest identyczna dla przesunięć symetrycznych względem (0,0), np. (-1,0) i (1, 0), lub (-1, 1) i (1, 1).
W ostatnim kroku macierz jest normalizowana poprzez podzielenie każdego jej elementu przez sumę wszystkich elementów, tak aby uniezależnić się od wielkości obrazu wejściowego.
Pawe
ł For
czm
ańsk
i, W
IZUT
53/5
4
SystemyMultimedialne
{ } Inne deskryptory teksturalneInne deskryptory teksturalneMacierz współwystępowania jest zależna od obrotu ze względu na parametr przesunięcia (Δx, Δy) .
W związku z tym, dla każdego obrazu wyznaczane są cztery macierze kierunkowe, których przesunięcia są skierowane pod kątami 0, 45, 90 oraz 135 stopni.
Dodatkowo mogą być analizowane dwie odległości przesunięć.
W związku z tym, dla każdego obrazu wejściowego wyznaczanych jest 8 symetrycznych, unormowanych macierzy współwystępowania dla następujących wartości przesunięć:
offsets = [ 0 1; 0 2; 0 3; 0 4; -1 1; -2 2; -3 3; -4 4; -1 0; -2 0; -3 0; -4 0; -1 -1; -2 -2; -3 -3; -4 -4];dla obrazu w odcieniach szarości.
Pawe
ł For
czm
ańsk
i, W
IZUT
54/5
4
SystemyMultimedialne
{ } Inne deskryptory teksturalneInne deskryptory teksturalneMacierz współwystępowania może zostać opisana za pomocą szeregu parametrów statystycznych.
Zwykle stosuje się 4 parametry obliczane dla każdej z macierzy współwystępowania.
Parametry te dla symetrycznej, unormowanej macierzy współwystępowania P dane są poniższymi zależnościami:
Kontrast=∑i , j P i , j(i− j)2,
Energia=√∑i , j P i , j2 ,
Korelacja=∑i , j Pi , j(i−μi)( j−μ j)
√σi2σ j2
Jednorodność=∑i , j P (i , j)
1+∣i− j∣
Slajd 1Slajd 2StrukturaSlajd 4Slajd 5Slajd 6Slajd 7Slajd 8Slajd 9Slajd 10Slajd 11Slajd 12Slajd 13Slajd 14Slajd 15Slajd 16Slajd 17Slajd 18Slajd 19Slajd 20Slajd 21Slajd 22Slajd 23Slajd 24Slajd 25Slajd 26Slajd 27Slajd 28Slajd 29Slajd 30Slajd 31Slajd 32Slajd 33Slajd 34Slajd 35Slajd 36Slajd 37Slajd 38Slajd 39Slajd 40Slajd 41Slajd 42Slajd 43Slajd 44Slajd 45Slajd 46Slajd 47Slajd 48Slajd 49Slajd 50Slajd 51Slajd 52Slajd 53Slajd 54