Upload
others
View
7
Download
0
Embed Size (px)
Citation preview
Βάσεις Δεδομένων ΙΙ
Ενότητα 10 Βάσεις Δεδομένων Πολυμέσων
Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσων
Το περιεχόμενο του μαθήματος
διατίθεται με άδεια Creative
Commons εκτός και αν αναφέρεται
διαφορετικά
Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού
Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και
συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό
Κοινωνικό Ταμείο) και από εθνικούς πόρους
Βάσεις Δεδομένων ΙΙ
Δεικτοδότηση Πολυμέσων
Πρόβλημα Δοθείσας μίας μεγάλης συλλογής (πολυμεσικών) εγγραφών (πχ μετοχές) Επιτρέπει γρήγορα ερωτήματα ομοιότητας
Εφαρμογές time series χρηματοιοκονομικά marketing (click-streams) ECGs ήχος εικόνες ιατρική ψηφιακές βιβλιοθήκες εκπαίδευση τέχνη higher-d σήματα επιστημονικές ΒΔ (πχ αστροφυσική) ιατρική (MRI ακτινογραφίες) ψυχαγωγία (video)
Παραδείγματα Ερωτημάτων Βρες ιατρικές υποθέσεις παρόμοιες και του κ Παπαδόπουλου Βρες ζεύγη μετοχών που κινούνται με συγχρονισμό Βρες ζεύγη εγγράφων που είναι παρόμοια (λογοκλοπία) Βρες πρόσωπα παρόμοια με του lsquoTiger Woodsrsquo
Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα
για παράδειγμα
τιμή
τιμή
1 365 μέρα
τιμή
1 365 μέρα
1 365 μέρα
συνάρτηση απόστασης από ειδικό
(πχ Ευκλείδεια απόσταση)
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Βάσεις Δεδομένων ΙΙ
Δεικτοδότηση Πολυμέσων
Πρόβλημα Δοθείσας μίας μεγάλης συλλογής (πολυμεσικών) εγγραφών (πχ μετοχές) Επιτρέπει γρήγορα ερωτήματα ομοιότητας
Εφαρμογές time series χρηματοιοκονομικά marketing (click-streams) ECGs ήχος εικόνες ιατρική ψηφιακές βιβλιοθήκες εκπαίδευση τέχνη higher-d σήματα επιστημονικές ΒΔ (πχ αστροφυσική) ιατρική (MRI ακτινογραφίες) ψυχαγωγία (video)
Παραδείγματα Ερωτημάτων Βρες ιατρικές υποθέσεις παρόμοιες και του κ Παπαδόπουλου Βρες ζεύγη μετοχών που κινούνται με συγχρονισμό Βρες ζεύγη εγγράφων που είναι παρόμοια (λογοκλοπία) Βρες πρόσωπα παρόμοια με του lsquoTiger Woodsrsquo
Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα
για παράδειγμα
τιμή
τιμή
1 365 μέρα
τιμή
1 365 μέρα
1 365 μέρα
συνάρτηση απόστασης από ειδικό
(πχ Ευκλείδεια απόσταση)
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Πρόβλημα Δοθείσας μίας μεγάλης συλλογής (πολυμεσικών) εγγραφών (πχ μετοχές) Επιτρέπει γρήγορα ερωτήματα ομοιότητας
Εφαρμογές time series χρηματοιοκονομικά marketing (click-streams) ECGs ήχος εικόνες ιατρική ψηφιακές βιβλιοθήκες εκπαίδευση τέχνη higher-d σήματα επιστημονικές ΒΔ (πχ αστροφυσική) ιατρική (MRI ακτινογραφίες) ψυχαγωγία (video)
Παραδείγματα Ερωτημάτων Βρες ιατρικές υποθέσεις παρόμοιες και του κ Παπαδόπουλου Βρες ζεύγη μετοχών που κινούνται με συγχρονισμό Βρες ζεύγη εγγράφων που είναι παρόμοια (λογοκλοπία) Βρες πρόσωπα παρόμοια με του lsquoTiger Woodsrsquo
Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα
για παράδειγμα
τιμή
τιμή
1 365 μέρα
τιμή
1 365 μέρα
1 365 μέρα
συνάρτηση απόστασης από ειδικό
(πχ Ευκλείδεια απόσταση)
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Εφαρμογές time series χρηματοιοκονομικά marketing (click-streams) ECGs ήχος εικόνες ιατρική ψηφιακές βιβλιοθήκες εκπαίδευση τέχνη higher-d σήματα επιστημονικές ΒΔ (πχ αστροφυσική) ιατρική (MRI ακτινογραφίες) ψυχαγωγία (video)
Παραδείγματα Ερωτημάτων Βρες ιατρικές υποθέσεις παρόμοιες και του κ Παπαδόπουλου Βρες ζεύγη μετοχών που κινούνται με συγχρονισμό Βρες ζεύγη εγγράφων που είναι παρόμοια (λογοκλοπία) Βρες πρόσωπα παρόμοια με του lsquoTiger Woodsrsquo
Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα
για παράδειγμα
τιμή
τιμή
1 365 μέρα
τιμή
1 365 μέρα
1 365 μέρα
συνάρτηση απόστασης από ειδικό
(πχ Ευκλείδεια απόσταση)
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Παραδείγματα Ερωτημάτων Βρες ιατρικές υποθέσεις παρόμοιες και του κ Παπαδόπουλου Βρες ζεύγη μετοχών που κινούνται με συγχρονισμό Βρες ζεύγη εγγράφων που είναι παρόμοια (λογοκλοπία) Βρες πρόσωπα παρόμοια με του lsquoTiger Woodsrsquo
Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα
για παράδειγμα
τιμή
τιμή
1 365 μέρα
τιμή
1 365 μέρα
1 365 μέρα
συνάρτηση απόστασης από ειδικό
(πχ Ευκλείδεια απόσταση)
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα
για παράδειγμα
τιμή
τιμή
1 365 μέρα
τιμή
1 365 μέρα
1 365 μέρα
συνάρτηση απόστασης από ειδικό
(πχ Ευκλείδεια απόσταση)
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
τιμή
τιμή
1 365 μέρα
τιμή
1 365 μέρα
1 365 μέρα
συνάρτηση απόστασης από ειδικό
(πχ Ευκλείδεια απόσταση)
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους