54
Paweł Forczmański, WIZUT 1/54 Systemy Multimedialne { } Deskryptory wizualne Deskryptory wizualne na podstawie MPEG-7 na podstawie MPEG-7 kolor i tekstura kolor i tekstura dr inż. Paweł Forczmański [email protected]

T U Z I F Deskryptory wizualne na podstawie MPEG-7pforczmanski.zut.edu.pl/.../uploads/07_mpeg_7_kolor_tekstura.pdf · Model Eksperymentalny (ang. Experimentation Model, XM) to oprogramowanie

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    1/54

    SystemyMultimedialne

    { }

    Deskryptory wizualneDeskryptory wizualnena podstawie MPEG-7na podstawie MPEG-7

    kolor i teksturakolor i tekstura

    dr inż. Paweł Forczmań[email protected]

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    2/54

    SystemyMultimedialne

    { }Visual Descriptors

    Color Texture MotionShape

    • Contour Shape

    • Region Shape

    • 2D/3D shape

    • 3D shape

    • Camera motion

    • Motion Trajectory

    • Parametric motion

    • Motion Activity

    • Texture Browsing

    • Homogeneous texture

    • Edge Histogram

    1. Histogram

    Scalable Color

    Color Structure

    GOF/GOP

    2. Dominant Color

    3. Color Layout Face recognition

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    3/54

    SystemyMultimedialne

    { } WprowadzenieWprowadzenie

    Opisowi z wykorzystaniem deskryptorów podlegają tzw. obiekty wizyjne (ang. video object), które opisywane są przy użyciu następujących cech:

    koloru,kształtu,teksturyoraz ruchu,

    dlatego też deskryptory wizyjne standardu można podzielić na grupy odnoszące się do każdej z tych cech.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    4/54

    SystemyMultimedialne

    { } Model Eksperymentalny -XMModel Eksperymentalny -XM

    Model Eksperymentalny (ang. Experimentation Model, XM) to oprogramowanie referencyjne (ang. Reference Software) implementujące standard MPEG-7, które zostało opracowane przez międzynarodową grupę naukowców zajmujących się przetwarzaniem obrazów oraz opisem danych, w celu prowadzenia badań i testów. Jego kod źródłowy został napisany w języku C++ i jest udostępniany poprzez serwer:

    http://iiss039.joanneum.at/cms/index.php?id=145

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    5/54

    SystemyMultimedialne

    { } Model Eksperymentalny -XMModel Eksperymentalny -XM

    XM zawiera implementację zarówno części normatywnych standardu MPEG-7 jak również dodatkowych komponentów, niezbędnych do ekstrakcji opisu danych multimedialnych.

    W wyniku kompilacji kodu źródłowego XM uzyskuje się dwa rodzaje aplikacji:

    Służące do ekstrakcji opisu;Wyszukujące odpowiednią zawartość wizyjną na podstawie zdefiniowanego zapytania.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    6/54

    SystemyMultimedialne

    { } Model Eksperymentalny -XMModel Eksperymentalny -XM

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    7/54

    SystemyMultimedialne

    { } Model Eksperymentalny -XMModel Eksperymentalny -XM

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    8/54

    SystemyMultimedialne

    { } Model Eksperymentalny -XMModel Eksperymentalny -XM

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    9/54

    SystemyMultimedialne

    { } Deskryptory koloruDeskryptory koloru

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    10/5

    4

    SystemyMultimedialne

    { } Deskryptory koloruDeskryptory koloru

    Oprócz deskryptorów opisujących treść obrazu pod względem koloru XM zawiera również dwa deskryptory pomocnicze: Color Space Descriptor (CSD) i Color Quantization Descriptor (CQD). Nie są one wykorzystywane jako samodzielne ale w połączeniu z innymi deskryptorami.

    CSD określa przestrzeń barw użytą przez inny deskryptor szczególnie przez Dominant Color Descriptor.

    CQD określa natomiast poziomy kwantyzacji dla potrzeb innych deskryptorów.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    11/5

    4

    SystemyMultimedialne

    { } Przestrzenie barw w MPEG-7Przestrzenie barw w MPEG-7

    ● Red-Green-Blue

    ● 256 wartości w każdym z kierunków● Kwantyzacja – np. 4 przedziały w każdym kierunku● Każdy z pikseli definiowany jest jako punkt w przestrzeni● Budowa połączonego histogramu● Duża liczba dostępnych algorytmów kwantyzacji(np. median

    cut, GLA,etc.)● Metryka odległościowa do oceny podobieństwa

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    12/5

    4

    SystemyMultimedialne

    { } Przestrzenie barw w MPEG-7Przestrzenie barw w MPEG-7

    ● Hue (H) = obrót● Saturation (S) = czystość● Value (V) = jasność

    ● Kwantyzacja z różną dokładnością:● 256 przedziałów (16 H, 4 S, 4 V)● 128 przedziałów (8 H, 4 S, 4 V)● 16 przedziałów (4 H, 2 S, 2 V)● I tak dalej...

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    13/5

    4

    SystemyMultimedialne

    { } Przestrzenie barw w MPEG-7Przestrzenie barw w MPEG-7

    ● Hue-Max-Min-Diff● Max = max(R,G,B), Min = min(R,G,B)● Diff = Max-Min, Sum = (Max+Min)/2

    ● Podobna do HSV

    ● Kwantyzacja niejednorodna● 5 części Diff definiuje 5 podprzestrzeni● Częsci H i S dzielone są na różną ilośc przedziałów w każdej

    podprzestrzeni● t.j., dla 128 przedziałów, podprzestrzeń jest dzielona na 8 przedziałów H i 4 S.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    14/5

    4

    SystemyMultimedialne

    { } HMMDHMMD

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    15/5

    4

    SystemyMultimedialne

    { } Dominant Color DescriptorDominant Color DescriptorDCD umożliwia opis kolorów reprezentatywnych dla danego obrazu lub regionu, a co za tym idzie pozwala na efektywne przeszukiwanie nawet bardzo dużych baz danych. DCD zdefiniować można jako następujący wektor:

    F={(ci,pi,vi),s}, i=1,2,...,Ngdzie:N - liczba kolorów dominujących,ci - wektor określający wartości poszczególnych składowych w odpowiedniej przestrzeni barw,pi – względny udział składowej opisanej wektorem ci w danym obrazie (wartości z zakresu ; ∑ pi=1 ),vi - opcjonalny parametr opisujący wariancję wartości koloru w obszarze wokół badanego koloru (ang. Color Variance),s - spójność przestrzenna (ang. Spatial Coherency) dla badanego koloru dominującego.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    16/5

    4

    SystemyMultimedialne

    { } DCD - ograniczeniaDCD - ograniczenia

    Liczba kolorów dominujących może być różna dla poszczególnych obrazów, jednakże maksymalna liczba określona przez standard wynosi 8 – co zostało przyjęte jako warunek wystarczający dla poprawnej klasyfikacji obrazu pod względem DCD.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    17/5

    4

    SystemyMultimedialne

    { } DCD – wyszukiwanie (1/2)DCD – wyszukiwanie (1/2)

    Wyszukiwanie podobieństw z wykorzystaniem DCD polega na obliczeniu DCD dla każdego koloru dominującego w obrazie będącym zapytaniem, po czym wyliczana jest dla par obrazów (obraz – zapytanie, obraz badany) następująca odległość:

    gdzie indeksy 1 i 2 dotyczą deskryptorów obu obrazów a parametr ak,l oznacza współczynnik podobieństwa między dwoma kolorami ck i cl

    Dokładną definicję parametru a1i,2j zawiera następny slajd..

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    18/5

    4

    SystemyMultimedialne

    { } DCD – wyszukiwanie (2/2)DCD – wyszukiwanie (2/2)

    gdzie:

    d k,l – odległość Euklidesowa

    pomiędzy kolorami ck i c

    l;

    Td – maksymalna odległość

    pomiędzy podobnymi kolorami.D max=α Td (α=1..1,5)

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    19/5

    4

    SystemyMultimedialne

    { } DCD – w praktyceDCD – w praktyceJak widać z przedstawionych zależności w najprostszej wersji opisu nie jest konieczne branie pod uwagę przy wyszukiwaniu wartości wariancji i spójności przestrzennej.

    niska spójnośćwysoka spójność

    Najczęściej same wartości prawdopodobieństwa oraz wektory dają zadowalające rezultaty. Jeżeli jednak wymagana jest wysoka dokładność procedury wyszukującej należy uwzględnić również wspomniane wartości vi oraz si.Odpowiednie zależności znaleźć można w standardzie MPEG-7.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    20/5

    4

    SystemyMultimedialne

    { } DCD – realizacjaDCD – realizacja● konwersja z przestrzenni RGB do przestrzeni Luv,

    ● kwantyzacja kolorów na bazie algorytmu kwantyzacji wektorowej GLA (General Lloyd Algorithm),

    ● ponowna konwersja Luv do RGB,

    ● zbudowanie statystyki, która każdy kolor dominujący charakteryzuje przez trójkę RGB i procentową zawartość w obrazie pikseli należących do poszczególnego koloru dominującego,

    ● obliczenie wariancji kolorów w danej grupie (jako średniego odchylenia kolorów oryginalnych od reprezentantów w każdej grupie),

    ● obliczenie parametru spójności przestrzennej wyznaczonych kolorów dominujących.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    21/5

    4

    SystemyMultimedialne

    { } DCD – uproszczeniaDCD – uproszczenia● W celu przyspieszenia działania algorytmu kolorów dominujących

    stosuje się często uproszczoną reprezentację kolorów w przestrzeni HSV.

    ● Dodatkowo, w celu zmniejszenia kosztów obliczeniowych realizacji algorytmu GLA, stosuje się uproszczoną formułę kwantyzacji.

    ● Dalej zaprezentowano kroki zmodyfikowanego algorytmu obliczania kolorów dominujących:

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    22/5

    4

    SystemyMultimedialne

    { } DCD – uproszczeniaDCD – uproszczenia1. konwersja RGB do HSV2. kwantyzacja nieliniowa,zgodnie z następującymi progami, w której H odpowiada za kanał Hue, S – kanał Saturation i V – kanał Value. W ten sposób tworzone są trzy macierze po kwantyzacji: Hquant , Squant i Vquant :

    H quant (x , y)={0 dla H (x , y)

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    23/5

    4

    SystemyMultimedialne

    { } DCD – uproszczeniaDCD – uproszczenia3. Utworzenie histogramu trójwymiarowego H(3D), który przechowuje informację o częstości występowania 72 wartości kolorów po kwantyzacji.4. Przepisanie histogramu trójwymiarowego do wektora jednowymiarowego, zgodnie z regułą:

    H (1D)(9h+3 s+v)=H (3D)(h , s , v)

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    24/5

    4

    SystemyMultimedialne

    { } DCD – uproszczeniaDCD – uproszczenia5. Wybór 8 kolorów dominujących zgodnie z ich licznością.6. Normalizacja ich wartości za pomocą dzielenia przez sumę ich wartości.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    25/5

    4

    SystemyMultimedialne

    { } DCD – przykładyDCD – przykładyPrzykładowe wyniki działania DCD w projekcie FireStyle

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    26/5

    4

    SystemyMultimedialne

    { } Scalable Color DescriptorScalable Color Descriptor

    Scalable Color Descriptor to deskryptor oparty na transformacji Haara zastosowanej na wartościach histogramu koloru w przestrzeni HSV.Wartości histogramu są normalizowane i w sposób nieliniowy kwantowane do reprezentacji liczby czterobitowej naturalnej w każdym z podzakresów histogramu.Na powstałych wartościach wykonywana jest transformacja Haara.

    Zależnie od zdefiniowanych parametrów deskryptora wartości mogą być skalowane poprzez odrzucanie mniej znaczących bitów współczynników transformaty jak również przez zmianę liczby wyznaczonych współczynników transformaty Haara.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    27/5

    4

    SystemyMultimedialne

    { } Scalable Color DescriptorScalable Color DescriptorPrzestrzeń HSV jest jednorodnie dyskretyzowana na 256 przedziałów:16 poziomów dla H, 4 dla S i 4 dla V. Poziomy histogramu obcinane są do postaci 11-bitowej.Następnie, w celu uzyskania bardziej wydajnego kodowania, wartości 11-bitowe są nieliniowo mapowane na wartości 4-bitowe, tak aby zwiększyć znaczenie dla wartości częściej występujących, kosztem tych rzadko występujących.

    Całkowita wielkość deskryptora to 1024 bits/histogram, co jest wielkością często zbyt dużą, dlatego stosuje się kodowanie Haara.

    Proces kodowania powoduje zmniejszenie dokładności równoważny zapisaniu 128, 64, 32 przedziałów

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    28/5

    4

    SystemyMultimedialne

    { } Generowanie SCDGenerowanie SCD

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    29/5

    4

    SystemyMultimedialne

    { } Przykłady SCDPrzykłady SCD

    Wyszukiwanie realizowane może być na dwa sposoby – w przestrzeni współczynników Haara lub - po wyliczeniu transformaty odwrotnej - na wartościach histogramu. Obliczana jest odległość L1 (suma różnic bezwzględnych).W przestrzeni współcz. Haara porównywanie odbywa się poprzez obliczenie odległości Hamminga – porównywane są dwa deskryptory a wynik takiego porównania to liczba bitów różniących te opisy.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    30/5

    4

    SystemyMultimedialne

    { } Color Structure DescriptorColor Structure Descriptor

    CSD opisuje obraz zarówno pod względem rozkładu kolorów jak również ich struktury. W odróżnieniu od histogramu koloru deskryptor ten bierze pod uwagę informacje przez histogram nie uwzględniane – strukturę przestrzenną koloru w badanym obrazie.

    Ekstrakcja deskryptora odbywa się w dwóch etapach:• obliczanie histogramu CS (ang. Colour Structure) w przestrzeni HMMD skwantowanej wektorowo (184,120,64,32 przedziały);• nieliniowa kwantyzacja poziomów zgodnie z właściwościami statystycznymi obrazu.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    31/5

    4

    SystemyMultimedialne

    { } Color Structure DescriptorColor Structure Descriptor

    CSD opisuje lokalna strukturę koloru w obrazie przy wykorzystaniu elementu strukturującego w formie okna 8x8 pikseli. Oblicza on ilość wystąpień pikseli o danym kolorze.

    Załóżmy, że c0,c1,..cM-1 oznacza M kolorów w obrazie (po kwantyzacji).

    Color Structure Histogram oznacza się h(m), gdzie m=0,1,...M-1. Wartośc histogramu h(m) oznacza ilość elementów strukturujących zawierających przynajmniej jedno wystąpienie koloru m.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    32/5

    4

    SystemyMultimedialne

    { } Color Structure DescriptorColor Structure DescriptorPierwszy krok ekstrakcji daje w wyniku specyficzny histogram związany ściśle ze strukturą koloru w obrazie. Wartości histogramu przedstawiają zatem nie tyle amplitudy w poszczególnych przedziałach co charakterystykę przestrzenną rozkładu koloru.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    33/5

    4

    SystemyMultimedialne

    { } Color Structure DescriptorColor Structure DescriptorW celu wyliczenia CSD stosuje się element sturukturujący o wymiarach 8x8 (64 elementy), jednak w zależności od rozdzielczości stosuje się różny „rozrzut” elementów:

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    34/5

    4

    SystemyMultimedialne

    { } Color Structure DescriptorColor Structure Descriptor

    gdzie: N - jest liczbą przedziałów kwantowania (N=256),i – indeks przedziału kwantowania.

    Testy wykazały iż opis nie jest wrażliwy na zmiany rozdzielczości obrazu czy też kompresję co pokrywa się z założeniem iż istotnym elementem opisu jest rozkład przestrzenny koloru w obrazie.

    Wyszukiwanie dopasowujące realizowane jest poprzez obliczenie podobieństwa między wektorami. Przy założeniu że hA(i) i hB(i) będą odpowiednio wektorami zawierającymi wartości deskryptorów dla obrazu A i B miara odległości będzie przedstawiać się następującą zależnością:

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    35/5

    4

    SystemyMultimedialne

    { } Color Layout DescriptorColor Layout DescriptorCLD to deskryptor zawierający opis koloru niewrażliwy na zmiany rozdzielczości, pozwalający na bardzo szybkie wyszukiwanie obrazów. Został on opracowany w celu umożliwienia opisu rozkładu przestrzennego koloru w obrazie.

    Zasadniczą różnicą w stosunku do CSD jest fakt iż wynikiem działania deskryptora nie jest histogram kolorów lecz próbki transformaty DCT dla poszczególnych składowych przestrzeni YCbCr.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    36/5

    4

    SystemyMultimedialne

    { } Color Layout DescriptorColor Layout Descriptor

    Ekstrakcja deskryptora odbywa się w czterech etapach:

    • podział obrazu na 64 (8x8) bloki,

    • znalezienie dla każdego bloku koloru reprezentatywnego i przedstawienie obrazu jako 64 jednorodne co do koloru bloki, z których każdy zawiera jedynie kolor reprezentatywny,

    • obliczenie DCT dla każdej składowej Y, Cb, Cr,

    • uzyskane współczynniki są szeregowane zgodnie z uporządkowaniem zygzakowatym. Następnie pewna ich liczba jest kwantowana w sposób nieliniowy (64 poziomy dla współczynników DC i 32 dla współczynników AC).

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    37/5

    4

    SystemyMultimedialne

    { } Color Layout DescriptorColor Layout DescriptorPonieważ standard dopuszcza skalowalność deskryptora, możliwa jest różna liczba współczynników biorących udział w procesie kwantyzacji. Zalecane jest użycie 12 współczynników - 6 dla luminancji i po 3 dla obu chrominancji, jednakże istnieje też możliwość wykorzystania schematu wykorzystującego 18 współczynników (po 6 dla luminancji i każdej z chrominancji), jak również dowolne kształtowanie opisu przez podanie liczby próbek, osobno dla luminancji i chrominancji (możliwe wartości to 3, 6, 10, 15, 21,28 i 64).

    W deskryptorze zawarta jest zatem definicja zastosowanego wzorca, określająca liczbę współczynników Y,Cb i Cr użytych w opisie.

    Wyszukiwanie odbywa się poprzez obliczanie odległości Euklidesowej pomiędzy wartościami dwóch deskryptorów dla każdej składowej koloru z osobna.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    38/5

    4

    SystemyMultimedialne

    { } Color Layout DescriptorColor Layout Descriptor

    Wyszukiwanie odbywa się poprzez obliczanie odległości Euklidesowej pomiędzy wartościami dwóch deskryptorów dla każdej składowej koloru z osobna.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    39/5

    4

    SystemyMultimedialne

    { } GoF/GoP Color DescriptorGoF/GoP Color Descriptor

    Oferuje możliwość zastosowania SCD do kolekcji (podobnych) obrazów lub klatek video.

    Określa on atrybut „agregacja” (ang. aggregation), który wskazuje w jakim stopniu histogramy pojedynczych obrazów lub klatek wpływają na reprezentację całościową w zakresie średniej, części wspólnych i mediany.

    Pod pewnymi względami deskryptor ten jest lepszy od „zwykłej” średniej, ponieważ uniezależnia on opis od zmian oświetlenia, nakładania tekstu i in.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    40/5

    4

    SystemyMultimedialne

    { } Edge Histogram DescriptorEdge Histogram Descriptor

    Przechowuje informację o przestrzennym rozkładzie krawędziWykorzystuje histogram, który oblicza częstośc wystepowania krawędzi pod kątami: 0°, 45°, 90°, 135° i nie-kierunkoweSprawdza się dobrze w porównywaniu 1-do-1Niewielki rozmiar (240-bit)

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    41/5

    4

    SystemyMultimedialne

    { } Edge Histogram DescriptorEdge Histogram Descriptor

    90° 0° 45° 135° nieokreślony

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    42/5

    4

    SystemyMultimedialne

    { } EHD - algorytmEHD - algorytm

    Sub-block

    Image-block

    Wejściowy obraz dzielony jest na pod-obrazy (sub-images)

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    43/5

    4

    SystemyMultimedialne

    { } EHD - rozszerzenieEHD - rozszerzenie

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    44/5

    4

    SystemyMultimedialne

    { }Homogeneous Texture Descriptor Homogeneous Texture Descriptor (HTD)(HTD)Homogeneous Texture Descriptor służy do opisu jednorodnych tekstur obiektów wizyjnych. Metoda wykorzystywana do ekstrakcji tego deskryptora polega na wyznaczeniu parametrów statystycznych każdego z kanałów dwuwymiarowego widma obrazu statycznego. Podział widma na rozłączne subpasma odbywa się przy użyciu zastawu filtrów zamodelowanych funkcją Gabora.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    45/5

    4

    SystemyMultimedialne

    { }Homogeneous Texture Descriptor Homogeneous Texture Descriptor (HTD)(HTD)Deskryptor HTD dzieli widmo obrazu na 30 kanałów o sześciu kierunkach orientacji i pięciu zakresach częstotliwości. Dla każdego z kanałów wyznaczana jest średnia energia składników widma oraz ich wariancja. Składnia deskryptora HTD jest następująca

    Użyte we wzorze symbole oznaczają:

    fDC – jednorodnie skwantowana wartość średniej luminancji obrazu;fSD – jednorodnie skwantowana wartość odchylenia standardowego luminancji punktów obrazu od średniej;ei – średnia wartość energii i-tego kanału;di – wartość dewiacji energii i-tego kanału.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    46/5

    4

    SystemyMultimedialne

    { }Homogeneous Texture Descriptor Homogeneous Texture Descriptor (HTD)(HTD)

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    47/5

    4

    SystemyMultimedialne

    { }Homogeneous Texture Descriptor Homogeneous Texture Descriptor (HTD)(HTD)

    Wyznaczone w procesie wyszukiwania obrazy różnią się znacznie zarówno luminancją jak i prezentowaną zawartością. W rezultacie porównania obrazów tekstur z użyciem deskryptora HTD otrzymujemy wyniki, które nie zawsze są zgodne z odczuciami percepcyjnymi. Jednakże wyznaczanie opisu HTD jest stosunkowo szybkie.

    zapytanie

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    48/5

    4

    SystemyMultimedialne

    { } Texture Browsing Descriptor Texture Browsing Descriptor

    Texture Browsing Descriptor opisuje tekstury obiektów wizyjnych poprzez wyznaczenie parametrów odpowiadających ludzkiemu sposobowi postrzegania. Składnia opisu deskryptora TBD jest następująca:

    Użyte we wzorze symbole oznaczają:v1 – parametr regularności bądź strukturyzacji tekstury (ang. regularity);v2 v3 – parametry opisujące kierunkowość tekstury (ang.directionality);v4 v5 – parametry opisujące ziarnistość tekstury (ang. coarseness).

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    49/5

    4

    SystemyMultimedialne

    { } Texture Browsing Descriptor Texture Browsing Descriptor

    Regularity(irregular, slightly regular, regular, highly regular)

    Coarseness(fine, medium, coarse, very coarse)

    Directionality(the dominant direction(s) characterizing the texture alignment).

    TBD

    HTD

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    50/5

    4

    SystemyMultimedialne

    { } Texture Browsing Descriptor Texture Browsing Descriptor

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    51/5

    4

    SystemyMultimedialne

    { } Inne deskryptory teksturalneInne deskryptory teksturalneCechy teksturalne mogą być obliczane na bazie parametrów statystycznych macierzy współwystępowania (ang. co-occurence matrix)Macierz taka, zdefiniowana dla obrazu I o rozmiarach n x m i dla przesunięcia (Δx, Δy) , dana jest wzorem:

    Dla obrazów w odcieniach szarości - GLCM

    C (i , j)=∑p=1n∑q=1

    m {1, gdy I ( p ,q)=i oraz I ( p+Δ x , q+Δ y)= j0 w przeciwnym przypadku }

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    52/5

    4

    SystemyMultimedialne

    { } Inne deskryptory teksturalneInne deskryptory teksturalneGLCM określa rozkład występowania poszczególnych par kolorów obrazu w określonej odległości przestrzennej (Δx, Δy) .

    Macierz taką następnie zamienia się w symetryczną, poprzez dodanie do niej jej własnej transpozycji.

    Taka symetryczna macierz współwystępowania jest identyczna dla przesunięć symetrycznych względem (0,0), np. (-1,0) i (1, 0), lub (-1, 1) i (1, 1).

    W ostatnim kroku macierz jest normalizowana poprzez podzielenie każdego jej elementu przez sumę wszystkich elementów, tak aby uniezależnić się od wielkości obrazu wejściowego.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    53/5

    4

    SystemyMultimedialne

    { } Inne deskryptory teksturalneInne deskryptory teksturalneMacierz współwystępowania jest zależna od obrotu ze względu na parametr przesunięcia (Δx, Δy) .

    W związku z tym, dla każdego obrazu wyznaczane są cztery macierze kierunkowe, których przesunięcia są skierowane pod kątami 0, 45, 90 oraz 135 stopni.

    Dodatkowo mogą być analizowane dwie odległości przesunięć.

    W związku z tym, dla każdego obrazu wejściowego wyznaczanych jest 8 symetrycznych, unormowanych macierzy współwystępowania dla następujących wartości przesunięć:

    offsets = [ 0 1; 0 2; 0 3; 0 4; -1 1; -2 2; -3 3; -4 4; -1 0; -2 0; -3 0; -4 0; -1 -1; -2 -2; -3 -3; -4 -4];dla obrazu w odcieniach szarości.

  • Pawe

    ł For

    czm

    ańsk

    i, W

    IZUT

    54/5

    4

    SystemyMultimedialne

    { } Inne deskryptory teksturalneInne deskryptory teksturalneMacierz współwystępowania może zostać opisana za pomocą szeregu parametrów statystycznych.

    Zwykle stosuje się 4 parametry obliczane dla każdej z macierzy współwystępowania.

    Parametry te dla symetrycznej, unormowanej macierzy współwystępowania P dane są poniższymi zależnościami:

    Kontrast=∑i , j P i , j(i− j)2,

    Energia=√∑i , j P i , j2 ,

    Korelacja=∑i , j Pi , j(i−μi)( j−μ j)

    √σi2σ j2

    Jednorodność=∑i , j P (i , j)

    1+∣i− j∣

    Slajd 1Slajd 2StrukturaSlajd 4Slajd 5Slajd 6Slajd 7Slajd 8Slajd 9Slajd 10Slajd 11Slajd 12Slajd 13Slajd 14Slajd 15Slajd 16Slajd 17Slajd 18Slajd 19Slajd 20Slajd 21Slajd 22Slajd 23Slajd 24Slajd 25Slajd 26Slajd 27Slajd 28Slajd 29Slajd 30Slajd 31Slajd 32Slajd 33Slajd 34Slajd 35Slajd 36Slajd 37Slajd 38Slajd 39Slajd 40Slajd 41Slajd 42Slajd 43Slajd 44Slajd 45Slajd 46Slajd 47Slajd 48Slajd 49Slajd 50Slajd 51Slajd 52Slajd 53Slajd 54