5
17. Telekomunikacioni forum TELFOR 2009 Srbija, Beograd, novembar 24.-26., 2009. 2 Funkcije za kvantifikovanje uzajamne sliˇ cnosti telekomunikacionih servisa Milan Bjelica, Student Member, IEEE Saˇ zetak—Da bi se omogu´ cila personalizacija telekomunika- cionih servisa, potrebno je kvantitativno iskazati njihove odlike i uzajamnu sliˇ cnost. U ovom radu je dat pregled funkcija koje se tom prilikom koriste. Kljuˇ cne reˇ ci—Funkcije sliˇ cnosti, metriˇ cke funkcije, vektorski prostori, personalizacija, telekomunikacioni servisi. I. UVOD J EDAN od izazova koji se postavlja pred operatore mul- tiservisnih telekomunikacionih mreˇ za je modeliranje nji- hovih korisnika (u ovom radu se za osobu koja koristi teleko- munikacioni servis koristi naziv korisnik, bez ˇ zelje da se implicira njena rodna pripadnost). Model korisnika pri tome predstavlja skup kvalitativnih i kvantitativnih atributa koji opisuju interesovanja, ˇ zelje ili potrebe posmatranog korisnika. Kada bi raspolagali ovim podacima, operatori bi mogli svakom od korisnika da ponude personalizovane servise, koji bi se u najve´ coj meri podudarali s procenjenim modelom. Dva kljuˇ cna elementa personalizacije telekomunikacionih servisa su uˇ cenje modela korisnika i odre divanje sliˇ cnosti procenjenog modela s raspoloˇ zivim servisima. U svojoj do- ktorskoj disertaciji [1], pokazao sam da se potonji problem moˇ ze elegantno reˇ siti koriˇ cenjem elemenata matematiˇ cke teorije metriˇ ckih prostora. U ovom radu, saˇ zeto ´ cu predstaviti osnovne rezultate do kojih sam tom prilikom doˇ sao. II. VEKTORSKI PROSTORI Na samom poˇ cetku, podseti´ cemo se modela vektorskog prostora i vide´ cemo kako se on koristi za predstavljanje telekomunikacionih servisa. A. Osnovne definicije Neka su dati skup Ω i polje (F, +, ·). Za skup Ω se kaˇ ze da predstavlja vektorski prostor nad poljem F, ako je zatvoren nad operacijom sabiranja, (x, y Ω) x + y Ω (1) i mnoˇ zenja elementima polja F, (α F)(x Ω) αx Ω (2) i ako za sve elemente x, y i z Ω i α i β F vaˇ ze slede´ ce aksiome: x + y = y + x, (3) Milan Bjelica, Elektrotehniˇ cki fakultet Univerziteta u Beogradu, Bulevar kralja Aleksandra 73, Beograd, Srbija (e-mail: [email protected]). x +(y + z)=(x + y)+ z, (4) (0 Ω) 0 + x = x, (5) ((-x) Ω) x +(-x)= 0, (6) 1x = x, (7) α (βx)=(αβ) x, (8) α (x + y)= αx + αy, (9) (α + β) x = αx + βx. (10) Elementi vektorskog prostora nazivaju se vektorima, a ele- menti polja F skalarima. Aksiome (3)-(6) pokazuju da je Ω komutativna ili Abelova grupa u odnosu na operaciju sabi- ranja vektora. Ostale aksiome odnose se na mnoˇ zenje vektora skalarom. Primetimo da postojanje vektorskog prostora implicira li- nearnost sistema. Bilo koja dva elementa sistema mogu se sabrati i, tako de, bilo koji element sistema moˇ ze se pomnoˇ ziti konstantom, da bi se dobio novi element sistema. B. Skalarni proizvod vektora Neka su dati vektorski prostor Ω sa vektorima x, y i z i polje F sa skalarima α i β. Preslikavanje π × Ω F za koje vaˇ zi π (x + y, z)= π (x, z)+ π (y, z) , (11) π (αx, y)= απ (x, y) , (12) π (x, y)= π (y, x) , (13) x 6= 0 π (x, x) > 0 (14) naziva se skalarnim proizvodom vektora. U vektorskom pro- storu nad poljem realnih brojeva, uobiˇ cajeno je da se skalarni proizvod definiˇ se kao π (x, y)= x · y = |x||y| cos θ, (15) gde je sa || oznaˇ cen moduo vektora, dok je θ ugao izme du vektora x i y. Vektorski prostor nad kojim je definisan skalarni proizvod naziva se euklidskim prostorom. Za dva vektora u euklidskom prostoru se kaˇ ze da su ortogonalni ako je njihov skalarni proizvod jednak nuli. Ako bazu prostora ˇ cine uzajamno nor- malni vektori jediniˇ cnog modula, tada se takav prostor naziva ortonormalnim. 914

Funkcije za kvantifikovanje uzajamne slicnosti ...2009.telfor.rs/files/radovi/09_01.pdf · hovih korisnika (u ovom radu se za osobu koja koristi teleko-munikacioni servis koristi

  • Upload
    trantu

  • View
    226

  • Download
    0

Embed Size (px)

Citation preview

17. Telekomunikacioni forum TELFOR 2009 Srbija, Beograd, novembar 24.-26., 2009.

2

Funkcije za kvantifikovanjeuzajamne slicnosti telekomunikacionih servisa

Milan Bjelica, Student Member, IEEE

Sazetak—Da bi se omogucila personalizacija telekomunika-cionih servisa, potrebno je kvantitativno iskazati njihove odlikei uzajamnu slicnost. U ovom radu je dat pregled funkcija kojese tom prilikom koriste.

Kljucne reci—Funkcije slicnosti, metricke funkcije, vektorskiprostori, personalizacija, telekomunikacioni servisi.

I. UVOD

JEDAN od izazova koji se postavlja pred operatore mul-tiservisnih telekomunikacionih mreza je modeliranje nji-

hovih korisnika (u ovom radu se za osobu koja koristi teleko-munikacioni servis koristi naziv korisnik, bez zelje da seimplicira njena rodna pripadnost). Model korisnika pri tomepredstavlja skup kvalitativnih i kvantitativnih atributa kojiopisuju interesovanja, zelje ili potrebe posmatranog korisnika.Kada bi raspolagali ovim podacima, operatori bi mogli svakomod korisnika da ponude personalizovane servise, koji bi se unajvecoj meri podudarali s procenjenim modelom.

Dva kljucna elementa personalizacije telekomunikacionihservisa su ucenje modela korisnika i odredivanje slicnostiprocenjenog modela s raspolozivim servisima. U svojoj do-ktorskoj disertaciji [1], pokazao sam da se potonji problemmoze elegantno resiti koriscenjem elemenata matematicketeorije metrickih prostora. U ovom radu, sazeto cu predstavitiosnovne rezultate do kojih sam tom prilikom dosao.

II. VEKTORSKI PROSTORI

Na samom pocetku, podseticemo se modela vektorskogprostora i videcemo kako se on koristi za predstavljanjetelekomunikacionih servisa.

A. Osnovne definicije

Neka su dati skup Ω i polje (F,+, ·). Za skup Ω se kazeda predstavlja vektorski prostor nad poljem F, ako je zatvorennad operacijom sabiranja,

(∀x,y ∈ Ω) x + y ∈ Ω (1)

i mnozenja elementima polja F,

(∀α ∈ F) (∀x ∈ Ω) αx ∈ Ω (2)

i ako za sve elemente x, y i z ∈ Ω i α i β ∈ F vaze sledeceaksiome:

x + y = y + x, (3)

Milan Bjelica, Elektrotehnicki fakultet Univerziteta u Beogradu, Bulevar kraljaAleksandra 73, Beograd, Srbija (e-mail: [email protected]).

x + (y + z) = (x + y) + z, (4)

(∃0 ∈ Ω) 0 + x = x, (5)

(∃(−x) ∈ Ω) x + (−x) = 0, (6)

1x = x, (7)

α (βx) = (αβ) x, (8)

α (x + y) = αx + αy, (9)

(α+ β) x = αx + βx. (10)

Elementi vektorskog prostora nazivaju se vektorima, a ele-menti polja F skalarima. Aksiome (3)-(6) pokazuju da je Ωkomutativna ili Abelova grupa u odnosu na operaciju sabi-ranja vektora. Ostale aksiome odnose se na mnozenje vektoraskalarom.

Primetimo da postojanje vektorskog prostora implicira li-nearnost sistema. Bilo koja dva elementa sistema mogu sesabrati i, takode, bilo koji element sistema moze se pomnozitikonstantom, da bi se dobio novi element sistema.

B. Skalarni proizvod vektora

Neka su dati vektorski prostor Ω sa vektorima x, y i z ipolje F sa skalarima α i β. Preslikavanje π : Ω× Ω→ F zakoje vazi

π (x + y, z) = π (x, z) + π (y, z) , (11)

π (αx,y) = απ (x,y) , (12)

π (x,y) = π (y,x) , (13)

x 6= 0 ⇒ π (x,x) > 0 (14)

naziva se skalarnim proizvodom vektora. U vektorskom pro-storu nad poljem realnih brojeva, uobicajeno je da se skalarniproizvod definise kao

π (x,y) = x · y = |x| |y| cos θ, (15)

gde je sa || oznacen moduo vektora, dok je θ ugao izmeduvektora x i y.

Vektorski prostor nad kojim je definisan skalarni proizvodnaziva se euklidskim prostorom. Za dva vektora u euklidskomprostoru se kaze da su ortogonalni ako je njihov skalarniproizvod jednak nuli. Ako bazu prostora cine uzajamno nor-malni vektori jedinicnog modula, tada se takav prostor nazivaortonormalnim.

914

C. Predstavljanje telekomunikacionih servisa u modelu ve-ktorskog prostora

Po analogiji s teorijom pronalazenja informacija, [2], sva-kom telekomunikacionom servisu mozemo pridruziti njegovusurogatsku apstrakciju u vidu n-dimenzionalnog vektora odli-ka x = [x1 x2 · · · xn]. Bazisnim vektorima ovakvog prostoramozemo pridruziti znacenja ”kljucnih reci”, pa bi u tomslucaju vrednosti pojedinih koordinata x1, x2, . . . , xn odgo-varale ”udelu” kljucnih reci u posmatranom servisu; stoga jeuobicajeno da vrednosti koordinata budu nenegativne. Prime-timo da se, ako su ove vrednosti 0 ili 1, radi o jednostavnomoznacavanju prisustva ili odsustva kljucne reci, dok se uslucaju kada one pripadaju intervalu [0, 1] implicitno uvodeelementi fazi skupova.

Treba naglasiti da pitanja definisanja bazisnog skupa zaopisivanje telekomunikacionih servisa i odredivanja koordinatau ovakvom vektorskom prostoru za sada nisu standardizovana.U oblasti multimedije, moguce resenje mogli bi predstavljatistandardi MPEG-7 i MPEG-21.

Kada su poznati vektorski surogati raspolozivih servisa,moguce je jednostavno kvantifikovati njihovu uzajamnu sli-cnost.

III. KVANTIFIKOVANJE SLICNOSTI

Neka su dati vektorski prostor Ω i vektori x =[x1 x2 · · · xn], y = [y1 y2 · · · yn] i z = [z1 z2 · · · zn].U najgrubljoj podeli, funkcije za kvantifikovanje uzajamneslicnosti telekomunikacionih servisa mozemo svrstati u dvegrupe, mere razdaljine i mere slicnosti.

A. Mere razdaljine

Najpoznatije mere razdaljine su metricke funkcije. Neka jedata funkcija f , takva da vazi

f (x,y) > 0, (16)

f (x,y) = 0 ⇔ x = y, (17)

f (x,y) = f (y,x) , (18)

f (x,y) + f (y, z) > f (x, z) . (19)

Funkcija f naziva se metrikom i ima interpretaciju rastojanjaizmedu svojih argumenata – sto su dva vektora ”slicniji”,njihovo rastojanje u posmatranom prostoru je manje i obrnuto.

U nekim primenama su od interesa i funkcije koje ne zado-voljavaju sve uslove (16)-(19). Ako nije ispunjen uslov (17),funkcija f naziva se pseudometrikom. Ako ne vaze uslovi (17)i (18), radi se o hemimetrici. Ako ne vazi samo (18), funkcijaf je kvazimetrika. Za funkciju f kaze se da je semimetrikaako ne zadovoljava samo nejednakost trougla, (19). Konacno,ako je zadovoljen samo uslov (16) uz f (x,x) = 0, funkcijaf se naziva prametrikom.

Prva mera razdaljine koju cemo razmotriti je metrikaMinkowskog, koja je data izrazom

f (x,y) = p

√√√√ n∑i=1

|xi − yi|p, (20)

pri cemu je parametar p realan broj koji nije manji od 1. Prime-timo da su funkcije koje imaju podesljiv parametar narocitopogodne za preciznije kvantifikovanje slicnosti srodnih servisa,jer se promenom vrednosti tog parametra ”razvlaci skala”metrike.

Metrika Minkowskog ima tri vazna posebna slucaja. Za p =1, dobija se Manhattan ili taxi cab metrika,

f (x,y) =n∑

i=1

|xi − yi| . (21)

Za p = 2, radi se o Euklidovoj metrici

f (x,y) =

√√√√ n∑i=1

(xi − yi)2, (22)

koja se, uprkos kritikama da ne opisuje dobro karakteristikemultimedijalnih servisa, u literaturi i dalje najcesce koristi.

Kada p→∞, dobija se metrika supremuma,

f (x,y) = maxi|xi − yi| . (23)

Metrici Minkowskog slicna je lp metrika,

f (x,y) = p

√√√√ 1n

n∑i=1

|xi − yi|p, (24)

pri cemu je sada p prirodan broj. Normalizacioni clan 1/n uliteraturi se ponekad izostavlja.

Ponderisana varijanta Euklidove metrike naziva se Maha-lanobisovim rastojanjem,

f (x,y) =

√√√√ n∑i=1

wi (xi − yi)2, (25)

gde su sa wi, i = 1, . . . , n oznaceni tezinski koeficijenti.Izborom njihovih vrednosti se uzima u obzir nejednak uti-caj pojedinih koordinata vektorskog prostora na percepcijuservisa.

Aggarwal i dr. su primetili da sa povecavanjem dimenzijevektorskog prostora, n, performanse metrike Minkowskog, usmislu sposobnosti distinkcije bliskih vektora, rastu sa smanji-vanjm vrednosti parametra p [3]. Zbog toga, predlazu da se uprostorima velikih dimenzija koristi frakciona metrika, koja sedobija kada se u (20) dozvoli da vrednost parametra p pripadaintervalu (0, 1). Sledeci ovu ideju, u radu [4], pokazao samda je uocena pojava jos izrazenija u hipersfernim vektorskimprostorima, u kojima su moduli svih vektora uzajamno jednaki.Pod takvim okolnostima, optimalna vrednost parametra p, kojapruza najvecu distinktivnost metrike, nalazi se upravo unutarintervala (0, 1). Francois i dr. su pokazali da su frakcionemetrike pogodne za primene u uslovima kada sum koji delujenije beli Gaussov [5].

Na slici 1, prikazane su izodistante linije funkcije (20), zarazlicite vrednosti parametra p. Radi preglednosti, posmatranje dvodimenzionalni prostor, pri cemu je pretpostavljeno da sejedan od vektora nalazi u koordinatnom pocetku.

915

Slika 1: Primeri izodistantnih linija funkcije (20), za razlicitevrednosti parametra p, u dvodimenzionalnom vektorskomprostoru.

Od ostalih mera razdaljine, pomenucemo Gaussovo rasto-janje [6],

f (x,y) =n∑

i=1

exp

[− (xi − yi)

2

2σ2i

], (26)

gde su σi, i = 1, . . . , n podesljivi parametri.Zeta rastojanje [7] dato je izrazom

f (x,y) =

√√√√ 1n

n∑i=1

(x2i − y2

i )2. (27)

Ova funkcija je primer pseudometrike. Ona postaje metrikaonda kada su sve koordinate vektora x i y istog znaka.

U radu [8], predlozena je upotreba hiperbolickog rastojanja,

f (x,y) =

∣∣∣∣∣∣lnr −

√∑ni=1 (xi − yi)

2

r +√∑n

i=1 (xi − yi)2

∣∣∣∣∣∣ , (28)

pri cemu je r podesljivi parametar. Geometrijska interpretacijaovog rastojanja u ravni bila bi sledeca. Posmatrani hiperbolickiprostor predstavlja kruznu povrs. Neka su date tacke A i Bkoje pripadaju ovom prostoru. Neka je, dalje, kroz ove tackekonstruisana tetiva kruga, cije su krajnje tacke U i V, kao stoje to prikazano na slici 2. Hiperbolicko rastojanje tacaka A iB tada je

f(A,B) =∣∣∣∣ln dE (A,U) dE (B,V)

dE (A,V) dE (B,U)

∣∣∣∣ , (29)

gde je sa || oznacen operator apsolutne vrednosti i sa dE

Euklidovo rastojanje racaka.

Slika 2: Geometrijska interpretacija hiperbolickog rastojanja(28) u ravni.

Jos jedan primer neeuklidskog rastojanja nalazimo u [9].Funkcija f definisana izrazom

f (x,y) =

√√√√ n∑i=1

n∑j=1

gi,j (xi − yi) (xj − yj), (30)

gde je gi,j lokalna reprezentacija tenzora Riemannove metrikenaziva se tangentnim rastojanjem. Primetimo da se u slucajugi,j = δi,j tangentno rastojanje svodi na Euklidovu metriku.

Ovaj pregled funkcija razdaljine zavrsicemo tzv. meramadivergencije, koje se definisu nad prostorima koji su ogranicenina pozitivni hiperkvadrant [10].

Kullback-Leiblerova divergencija data je izrazom

f (x,y) =n∑

i=1

xi logxi

yi. (31)

Ova funkcija ima smisla samo ako nijedna koordinata vektoray nije jednaka nuli. Primetimo da ona nije ni prametrika, jerne zadovoljava uslov (16); takode, nije zadovoljen ni uslovsimetrije (18). Definise se i simetricna varijanta Kullback-Leiblerove divergencije, koja ga zadovoljava:

f (x,y) =n∑

i=1

xi logxi

yi+ yi log

yi

xi. (32)

Jeffreyjeva divergencija data je izrazom

f (x,y) =n∑

i=1

xi logxi

ξi+ yi log

yi

ξi, (33)

gde je ξi = (xi + yi) /2, i = 1, . . . , n.

B. Mere slicnosti

Funkcije slicnosti se mnogo koriste u teoriji pronalazenjainformacija. Nemaju formalnu matematicku definiciju, madase u mnogim prakticnim primenama insistira da zadovoljavajusledece uslove:

0 6 f (x,y) 6 1, (34)

f (x,y) = f (y,x) , (35)

f (x,x) = κ = const. (36)

916

Slika 3: Primeri izosimilarnih linija kosinusne slicnosti (37),u dvodimenzionalnom vektorskom prostoru.

Kosinusna slicnost je neposredno preuzeta iz teorije pro-nalazenja informacija, gde se i dalje intenzivno koristi. Defi-nisana je izrazom

f (x,y) =x · y|x| |y|

=

n∑i=1

xiyi√√√√ n∑i=1

x2i

√√√√ n∑i=1

y2i

. (37)

Ova funkcija se moze shvatiti kao kosinus ugla izmedu posma-tranih vektora, kao njihov normalizovani skalarni proizvod, ilikao korelacija. Ako je prostor Ω ogranicen na prvi hiperkva-drant, tada kosinusna slicnost zadovoljava uslove (34)-(36), uzκ = 1.

Na slici 3, prikazane su izosimilarne linije funkcije (37).Ponovo je posmatran dvodimenzionalni prostor, pri cemu jesada pretpostavljen polozaj jednog od vektora kao na slici.

Pseudokosinusna slicnost data je izrazom

f (x,y) =

n∑i=1

xiyi

n∑i=1

xi

n∑i=1

yi

. (38)

Zanimljivo je da u prostoru ove slicnosti postoje vektori kojinisu najslicniji samim sebi.

Dve naredne funkcije spadaju u grupu tzv. mera asocijacije.Diceov koeficijent je dat izrazom

f (x,y) =

2n∑

i=1

xi · yi

n∑i=1

xi +n∑

i=1

yi

. (39)

Koeficijent preklapanja, koji je koristen u prvim sistemima

Slika 4: Primeri izosimilarnih linija koeficijenta preklapanja(40), u dvodimenzionalnom vektorskom prostoru (prema [11]).

za automatsko pronalazenje informacija, definisan je izrazom

f (x,y) =

n∑i=1

min (xi, yi)

min

n∑j=1

xj ,n∑

k=1

yk

. (40)

Na slici 4, prikazane su izosimilarne linije ove funkcije.I ovde je posmatran dvodimenzionalni prostor, pri cemu jepretpostavljeni polozaj jednog od vektora vidljiv sa slike.

Ako je data (pseudo)metricka funkcija µ, tada se iz nje mozeizvesti funkcija slicnosti f koja zadovoljava uslove (34-36) nasledeci nacin:(1) Funkcija µ se normalizuje na posmatranom prostoru Ω,

tako da vazi(∀x,y ∈ Ω) µn (x,y) ∈ (0, 1) , (41)

(2) Formira se funkcijaf (x,y) = 1− µn (x,y) , (42)

koja predstavlja trazenu funkciju slicnosti.Na ovaj nacin, polazeci od hiperbolickog rastojanja, (28),moze se izvesti hiperbolicka slicnost

f (x,y) =

ln

e r +√∑n

i=1 (xi − yi)2

r −√∑n

i=1 (xi − yi)2

−1

. (43)

IV. DISKUSIJA

Korisnicima savremenih multiservisnih telekomunikacionihmreza nudi se veliki broj servisa, koji su razlicite prirodei karakteristika. Zbog toga, pridruzeni vektorski prostori seodlikuju izuzetno velikim dimenzijama. Ako tome dodamo ipotrebu da se u realnom vremenu opsluzi veliki broj hetero-genih korisnika, jasno je zasto je pravilan izbor funkcije zakvantifikovanje slicnosti vazan cinilac uspeha personalizacije.

U tipicnim scenarijima primene, kvantifikaciona funkcija,bez obzira na to da li je u pitanju mera razdaljine ilimera slicnosti, trebalo bi da bude sto manjeg reda racunskeslozenosti. Cesto nije od interesa znati tacnu vrednost slicnosti,

917

vec je bitno uporediti slicnosti nekoliko raspolozivih servisa saprocenjenim modelom korisnika. Stoga je velika prednost akopostoji heuristika koja bi brzo dovela do resenja, makar onobilo i suboptimalno. Eventualno postojanje inverzne funkcijesvakako je jedna od prednosti, narocito ako je inverzan pro-blem lakse resiv.

Jednostavnu heuristiku pruza nam geometrijska interpre-tacija kvantifikacione funkcije, koja moze da nas uputi ukojoj oblasti da trazimo servise od interesa za posmatranogkorisnika.

Da bi se omogucilo fer poredenje servisa, u radu [12]sam predlozio normalizaciju vektorskog prostora, tako dapredstavlja hipersfernu povrs.

Postojanje jednog podesljivog parametra moze biti od koristiu primenama sa malim brojem servisa i korisnika, za kojeje onda pojedinacno moguce odrediti ”optimalne” metrike; tonije racionalno raditi u vecim mrezama. Iz istog razloga, nisupodesne ni funkcije sa vise od jednog podesljivog parametra,sto je diskutovano i u [13].

Imajuci u vidu ove napomene, ne iznenaduje sto i daljeveliki znacaj imaju Euklidova metrika i kosinusna slicnost.

V. ZAKLJUCAK

U ovom radu su prikazane funkcije koje se u procesu per-sonalizacije telekomunikacionih servisa koriste za kvantifiko-vanje njihove slicnosti sa procenjenim modelom korisnika.Jos uvek se ne moze reci da postoji funkcija koja bi imalanajbolje performanse u svim prakticnim primenama. Paralelnosa konstruisanjem novih funkcija, koje bi bile pogodne zaprimene u vektorskim prostorima ogromnih dimenzija, svoj-stvenim za multiservisna okruzenja, stoga ce se i dalje koristiti

”stare”, proverene i dobro poznate funkcije, poput metrikeMinkowskog ili kosinusne slicnosti.

LITERATURA

[1] M. Bjelica, “Algoritam za personalizaciju telekomunikacionih servisa,”doktorska disertacija, Elektrotehnicki fakultet, Beograd, 2009.

[2] G. Salton, A. Wong, and C. S. Yang, “A vector space model forautomatic indexing,” Commun. ACM, vol. 18, no. 11, pp. 613–620, 1975.

[3] C. C. Aggarwal, A. Hinneburg, and D. A. Keim, “On the surprisingbehavior of distance metrics in high dimensional spaces,” in ICDT ’01:Proceedings of the 8th International Conference on Database Theory.London, UK: Springer-Verlag, 2001, pp. 420–434.

[4] M. Bjelica and Z. Petrovic, “Choosing between multimedia servicesby means of Minkowski metric,” in The International Conference onComputer as a Tool, EUROCON 2005, vol. 2, Nov. 2005, pp. 1324–1327.

[5] D. Francois, V. Wertz, and M. Verleysen, “Non-Euclidean metrics forsimilarity search in noisy datasets,” in ESANN2005, European Sympo-sium on Artificial Neural Networks, Bruges (Belgium), 2005, pp. 339–344.

[6] P. Muneesawang and L. Guan, Multimedia database retrieval: A human-centered approach. Springer Science, 2006.

[7] S. Cheung and A. Zakhor, “Fast similarity search and clustering of videosequences on the world-wide-web,” IEEE Transactions on Multimedia,vol. 7, no. 3, pp. 524–537, 2005.

[8] J. Goth and A. Skrop, “Varying retrieval categoricity using hyperbolicgeometry,” Information Retrieval, vol. 8, no. 2, pp. 265–283, April 2005.

[9] Z. W. Wang, R. B. Maguire, and Y. Y. Yao, “A non-Euclidean model forweb retrieval,” in Web-Age Information Management, ser. Lecture Notesin Computer Science, H. Lu and A. Zhou, Eds., vol. 1846. Springer,2000, pp. 233–238.

[10] M. Koskela, A. F. Smeaton, and J. Laaksonen, “Measuring conceptsimilarities in multimedia ontologies: Analysis and evaluations,” IEEETransactions on Multimedia, vol. 9, no. 5, pp. 912–922, 2007.

[11] W. P. Jones and G. W. Furnas, “Pictures of relevance: A geometricanalysis of similarity measures,” J. Am. Soc. Inf. Sci., vol. 38, no. 6, pp.420–442, 1987.

[12] M. Bjelica and Z. Petrovic, “A novel service retrieval scheme,” Com-munications Letters, IEEE, vol. 11, no. 7, pp. 637–639, July 2007.

[13] E. Balmashnova and L. M. Florack, “Novel similarity measures fordifferential invariant descriptors for generic object retrieval,” J. Math.Imaging Vis., vol. 31, no. 2–3, pp. 121–132, 2008.

ABSTRACT

To deliver a set of personalized telecommunication servicesto the end user, it is necessary to quantify their features aswell as to measure the mutual similarities. This paper givesan overview of some mathematical functions that are used forthis.

QUANTIFYING THE MUTUAL SIMILARITIES OFTELECOMMUNICATION SERVICES

Milan Bjelica

918