37
Enterprise

0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

باسمه تعالي

مركز تحقيقات مخابرات ايران

معاونت توسعه ارتباطات علمي

Enterprise افزارهاي توسعه نرم پروژه

فاز اول - باز افزارهاي متن بر پايه نرم

اي موتور جستجوي چندرسانه

١٣٨٥ شهريور ماه

Page 2: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۲ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

EOS.Multimedia­SearchEngine کد سند

۱ نسخه

ز رحمتي بهرو مجري پروژه

شهريار شريعت ، جعفر محمدي محققين

مهسا سليمان پور زاده، معصومه عظيم ي ويراستار

مهدي اميري مرورکننده

ا ربيعي ض دكتر حميد ر ناظر

٨٥ / ٣ / ١ تاريخ تهيه

٨٥ / ٦ / ١ تاريخ مرور

٨٥ / ٦ / ١٥ تاريخ تصحيح

Page 3: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۳ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

فهرست

۴ ......... .. ........ ..................... ............................................................................. ............................... بخش اول

۱۰ ...... ..... ....................... ......... .............................. ........................... ها اي و مشکل تعدد فرمت جستجوي چندرسانه - ۱

۱۰ .................. .... ............ .......................................................................................... صوت - اي جستجوي چندرسانه - ۲

١٣ .... .............. ... .. . . ................... . ................... ........ ................................................. تصوير – اي جستجوي چندرسانه - ٣

٢۵ ........ .. . . ....... . . .. . ..... .............. ........................ ....................................................... ويديو – اي جستجوي چندرسانه - ٤

٢٩ .............. . .. ..... .... .. ................... .................................................... هاي با ابعاد باال جم عظيم داده گذاري ح انديس - ٥

٣٠ .... . ... . .. ........ ..... ................ .. ......... .................................................................................................... منابع و مراجع - ٦

٣٨ ....... .... .... ...... . ................... ........................................................................................................ بخش دوم

۴۲ .......... . . . . . ............. ....................... ..................................................... ي ا رسانه چند ي جستجو ي ها سيستم ي ارزياب ي معيارها - ١

۴۲ ... .... . . . ............ .. ........................................... اي باز موجود بر روي وب جهت جستجو و بازيابي چندرسانه هاي متن سيستم - ۲

۶۰ .......... .. ...... ................. .......................................................................................................................................... گيري نتيجه - ۳

٦٦ ........... . .............. ....... ............. ................... ............................. ............................................ ........................................... مراجع - ۴

٦٧ ....... . . ........... ...... .... ...... ..... .... ................................................................................................... بخش سوم

۷۱ ........... .. ............................................................................................................ افزار مورد نظر مشخصات فني نرم - ١

٧٧ ....................................................................................................... ...................................... بخش چهارم

۸۱ ...... . .. .. . .... . ..... .......... ................................................................................................................. سازي فرآيند بومي - ١

۸۱ ........ . . .. . ... .. . ............................ ................................................................................................. سازي فرآيند بومي - ۲

٨٢ ........ .. .. ......... . ........ ................ .................................................... . افزارهاي متنباز متناسب با نيازهاي بومي نرم - ۳

٨٤ ....... . ... ... .. .. ....... ..... . .. . ............... ................... .............................................................................................. مراجع - ٤

Page 4: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۴ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

بخش اول

اي موتور جستجوي چندرسانه مشخصات

) Multimedia Search Engine (

Page 5: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۵ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

چكيده

در ابتـدا . ا شـده اسـت هـ هاي آن قابليت اي و کلي موتورهاي جستجوي چندرسانه هاي مرحله از پروژه سعي بر شناخت ويژگي ن ي در ا

بنـدي کلـي موتورهـاي اي بـه سـه دسـته تري از موضوع ارائه داد، موتورهـاي جـستجوي چندرسـانه براي اينکه بتوان بررسي دقيق

هـاي انجـام وجو، روش ارائه پرس بندي، نحوه براي هر دسته . بندي شده است تقسيم يي هاي صوتي، تصويري و ويديو جستجوي داده

. هاي بر سر راه آنها، آورده شده است ش چال همچنين هاي تکنيکي مربوطه و وجو، نحوه ارائه نتايج و بحث پرس

Page 6: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۶ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

فهرست مطالب

١٠ .......................... ................................ ................................ ................................ ................................ ................................ ها اي و مشکل تعدد فرمت جستجوي چندرسانه ١

١٠ ......................... ................................ ................................ ................................ ................................ ................................ ................................ صوت - اي جستجوي چندرسانه ٢

١٠ ..................... ................................ ................................ ................................ ................................ ................................ ................................ .... .. .. .. .. ... .. . بازيابي موسيقي ١ - ٢

١١ ......................... ................................ ................................ ................................ ................................ ................................ ..... ... .. .. . هاي بازيابي موسيقي روش ١ - ١ - ٢

١١ ............... ................................ ................................ ................................ ................................ ................................ ................................ ..... .. .. .. ... .. .. .. .. .. .. .. . بازيابي گفتار ٢ - ٢

١٢ ....................... ................................ ................................ ................................ ................................ ................................ ..... .. .. .. .. .. .. .. . هاي بازيابي گفتار روش ١ - ٢ - ٢

١٣ ................................ ................................ ................................ ................................ ................................ ................................ تي بدون ساختار هاي صو بازيابي داده ٣ - ٢

١٣ ............................... ................................ ................................ ................................ ................................ هاي صوتي بدون ساختار هاي بازيابي داده روش ١ - ٣ - ٢

١٣ ...................... ................................ ................................ ................................ ................................ ................................ ................................ تصوير - اي جستجوي چندرسانه ٣

١٥ ...... ................................ ................................ ................................ ................................ ................................ ................................ وجوهاي تصوير هاي پرس مشخصه ١ - ٣

١٩ ............. ................................ ................................ ................................ ................................ ................................ هاي جستجو و بازيابي تصاوير ساختارمند روش ٢ - ٣

٢٠ ...................... ................................ ................................ ................................ ................................ تجو و بازيابي تصاوير عمومي و بدون ساختار هاي جس روش ٣ - ٣

٢٠ ....................... ................................ ................................ ................................ ................................ ................................ ... .. .. ... .. اساس ويژگي رنگ بازيابي بر ١ - ٣ - ٣

٢١ .............. ................................ ................................ ................................ ................................ ................................ گ بندي رن اساس ويژگي طرح بازيابي بر ٢ - ٣ - ٣

٢١ .................... ................................ ................................ ................................ ................................ ................................ ...... .. .. .. .. اساس ويژگي بافت بازيابي بر ٣ - ٣ - ٣

٢٢ .............................. ................................ ................................ ................................ ................................ ................................ .... اساس ويژگي شکل بازيابي بر ٤ - ٣ - ٣

٢٣ ... ................................ ................................ ................................ ................................ ۲ هاي موجود براي بازيابي بر اساس محتوي در سطح تکنيک ٥ - ٣ - ٣

٢٥ ... ................................ ................................ ................................ ................................ ۳ هاي موجود براي بازيابي بر اساس محتوي در سطح تکنيک ٦ - ٣ - ٣

٢٥ ....................... ................................ ................................ ................................ ................................ ................................ ................................ ويديو – اي جستجوي چندرسانه ٤

٢٦ ....... ................................ ................................ ................................ ................................ ................................ ................................ وجوهاي ويديو هاي پرس مشخصه ١ - ٤

٢٦ .............. ................................ ................................ ................................ ................................ ................................ ................................ ..... .. .. .. جستجو و بازيابي ويديو ٢ - ٤

Page 7: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۷ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

٢٦ ............................... ................................ ................................ ................................ ................................ ................................ ..... .. .. .. .. .. .. . بندي زماني سگمنت ١ - ٢ - ٤

٢٨ ........................ ................................ ................................ ................................ ................................ ................................ ...... .. .. .. .. .. .. .. .. ... .. .. .. .. .. .. .. .. ... .. .. .. تجريد ٢ - ٢ - ٤

٢٨ ...................... ................................ ................................ ................................ ................................ ................................ ...... .. .. .. .. .. .. .. .. ... .. .. .. . استخراج محتوي ٣ - ٢ - ٤

٢٩ ........................... ................................ ................................ ................................ ................................ ................................ هاي با ابعاد باال گذاري حجم عظيم داده انديس ٥

٣٠ ............................. ................................ ................................ ................................ ................................ ................................ ................................ . ... .. .. .. .. .. .. .. .. ... .. .. منابع و مراجع ٦

Page 8: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۸ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

مقدمه

اين حجم عظيم اطالعات بدون . اي داشته است سابقه ديجيتال رشد بي و ويديوهاي تصاوير ها، صوت هاي اخير حجم مجموعه در سال

هـاي گسترش کاربردهاي اين داده اين روز به روز نيز بر بر عالوه . د مفيد واقع شوند توانن نمي ، ، جستجو و بازيابي موثر مرور هاي روش

هـاي هنـري، بازيابي و استفاده از تصاوير، امروزه در فيلدهاي بسياري نظير گالري عنوان مثال توليد، به . شود وده مي اي افز چندرسانه

هـاي هـاي از راه دور و مـديريت منـابع زمـين، سيـستم پـردازش هاي مهندسي و معماري، طراحي داخلي، ها، طراحي مديريت موزه

بيني آب و هـوا، طراحـي مـد و هاي علمي، پيش داده نگاري و تبليغات، تشخيص پزشکي، مديريت پايگاه اطالعات جغرافيايي، روزنامه

صاوير، ستم شـکنان، سيـ هاي حقوق انحصاري و عاليم تجـاري، کـشف مجرمـان و قـانون داده پارچه، مديريت پايگاه هـاي آرشـيو ـت

. [CVMC 2000, JEMG 99] بصورت وسيعي مطرح است ... هاي ارتباطي، آموزش و سرگرمي و سيستم

بـه مـرور کـردن تنها اي عظيم نيازهاي چنداني نداشته باشند و داده چندرسانه کاربران معمولي ممکن است در مواجهه با يک پايگاه

اي نيازمندنـد کـه هاي چندرسانه اي خاص از داده اي معموال به تکه کفايت کنند ولي کاربران حرفه داده با فراغت بال هاي پايگاه داده

در حال ما ئ اي مرتب و دا امروزه اين نيازهاي حرفه . بايد در زماني کوتاه در ميان خيل عظيمي از اطالعات به آن دسترسي پيدا کنند

پس نيازمنـد . شود اي کمک کند، شديدا احساس مي که بتواند به اين کاربران حرفه هاي بازيابي اطالعات افزايش بوده و نياز به روش

. اي بپردازد هاي چندرسانه هايي هستيم که بتواند به جستجو و بازيابي اطالعات در ميان حجم عظيمي از داده روش

محتـوي پايـه هـاي بر ايـه مـتن و روش پ هـاي بر روش : وجود دارد عمده روش ، دو اي اطالعات چندرسانه اين بازيابي جستجو و براي

اي توسط افراد مطلع پايه متن، ابتدا اطالعاتي در مورد داده چندرسانه بر هاي در روش . [RHC 99] ) مشاهده و شنود پايه هاي بر روش (

هاي متني روي اين داده سپس جستجو بر . باشد اي مي شود که معرف کامل داده چندرسانه مي ي نويس حاشيه هاي متني در قالب داده

هاي انجام گرفته در اين دسته از فعاليت . شود به کاربران نشان داده مي ، هاي متني اي متناظر داده صورت گرفته و اطالعات چندرسانه

هـاي انجـام فعاليت کامل به بررسي [SCAH 92, TY 84] دو مقاله . اشاره نمود [CF 79, CF 80, SKC 81, CYDA 88] توان به مي

روي حجم کار دسـتي انجـام گيرنـده بـر ، ها اين است که با رشد حجم داده ، مشکل اصلي اين دسته . پردازند دسته مي گرفته در اين

از طرفي برداشت افراد مختلف از حتي يک تصوير مشخص نيـز حتـي متفـاوت اسـت . شود خارج از حد قابل پذيرش مي ، ها نيز داده

[RHC 99] حجـم چـون همچنين . اي يکدست نباشد هاي چندرسانه ليدي براي پايگاه داده شود که اطالعات متني تو و اين باعث مي

هـا توليـد اي که براي اين داده و اطالعات متني هاي انساني بندي دسته در حال افزايش است و اي شديدا و سريعا ي چندرسانه ها داده

هـا را زيـر شود که عمال کارايي ايـن روش داده مي زيادي داده برگشت خيلي حجم ، ازاي هر جستجويي باشد، به محدود مي شود، مي

Page 9: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۹ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

بسيار غني بـوده و قابليـت آن را از لحاظ اطالعاتي تصاوير کند که ها خودنمايي مي در اين روش در حالي اين مشکل . برد سوال مي

. بندي شوند هاي بسيار دقيق و جزئي طبقه دارند که به دسته

هـاي روش ها که اين روش در . هاي جستجو هموار کرد دوم روش مطرح شدن و رشد دسته مشکالت بيان شده، راه را براي مجموعه

گردد، خودکار از آنها استخراج مي ت هايي که بصور بر اساس ويژگي اي هاي چندرسانه شوند، داده ناميده مي ١ بر محتوي بازيابي مبتني

. [VGVR 95, AND 95, PP96, BSHC 96] گيرند شده و مورد جستجو و بازيابي قرار مي گذاري انديس

گـذاري دسـتي نـديس ها دالر جهت ا هاي راديويي و تلويزيوني هر ساله ميليون هاي خبري، شبکه اي، سرويس هاي چندرسانه شرکت

هاي تحقيقاتي متعددي در سراسر جهـان در حـال هاي بسياري در گروه در نتيجه تالش . کنند شان هزينه مي اي هاي چندرسانه داده

بـر بازيـابي مبتنـي . اي به يک پروسه خودکار يا نيمه خودکار تبـديل گـردد هاي چندرسانه گذاري فايل س ندي جام است که پروسه ا ان

. باشند اي هنوز مبحث بازي بوده و محصوالت چنداني در اين زمينه موجود نمي هاي چندرسانه محتوي در داده

وجوهـاي ن خيل عظيمي از اطالعات بـدنبال پاسـخي مناسـب بـراي پـرس کنند در ميا اي سعي مي موتورهاي جستجوي چندرسانه

ها و مشکالت موجود بر سر راه اين موتورهاي جـستجوگر را در چنـد توان چالش بر اساس اين هدف براحتي مي . کاربرانشان بگردند

ارائـه ، نحـوه هاي جـستجو استراتژي ، وجو نحوه ورود پرس ، ها مشکل تعدد فرمت ها و نحوه ذخيره داده : بندي کرد ته اصلي دس دسته

. باشند هاي موتورهاي جستجو مي ترين دغدغه مهم هاي موجود چالش انفجار اطالعات و حجم باالي داده برخورد با و نحوه نتايج

تـصوير و صـوت، ها در سـه حـوزه هاي بازيابي داده سپس از آنجايي که روش . کنيم ها را بررسي مي در ادامه ابتدا مشکل تعدد فرمت

هاي جستجو و ارايه نتايج را بطور مفصل جو، استراتژي و ورود پرس باشند، مشکالت نحوه هاي خاص خودشان مي ويديو داراي ويژگي

گـذاري حجـم دهيم و در نهايت به بررسي ساير مشکالت، از جمله مـشکل انـديس طور جداگانه مورد بررسي قرار مي ه در هر حوزه ب

. ردازيم پ ها مي باالي داده

1 Content based retrieval

Page 10: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۱۰ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

ها اي و مشکل تعدد فرمت جستجوي چندرسانه ١

، AVI ، DIVX ، Quick time ، MPEG هاي ويـديويي براي داده . باشد اي موجود مي هاي چندرسانه هاي بسيار متنوعي براي داده فرمت

Real و Windows Media Types براي صوت ، MIDI ، MP3 ، Real audio و Windows Player Types و بـراي تـصوير JPEG ، GIF ،

BMP دهـد، اي را انجام مي هاي چندرسانه يک موتور جستجو که عمل بازيابي بر روي داده . باشند ها مي ترين فرمت جزو محبوب ... و

. ها را داشته باشد بايستي توانايي درک اين فرمت مي

صوت - اي چندرسانه جستجوي ٢

هـاي و صـوت ) نظير موسيقي و گفتار ( هاي داراي ساختار دو دسته صوت هاي ساختاري به هاي صوتي را از لحاظ تفاوت توان داده مي

هـاي از بازيـابي اطالعـات در مـورد داده منظور . تقسيم کرد ) ها نظير سر و صداي ترافيک ترکيبي از هر انواع سيگنال ( بدون ساختار

. باشد ساختارمند، مشخص کردن و پيدا کردن يک ساختار مي

بازيابي موسيقي ١ - ٢

هـاي آموزشـي و شـود، زيـرا در زمينـه هاي تحقيقاتي است که روز به روز بر طرفداران آن افزوده مـي موسيقي يکي از زمينه بازيابي

تواند جهت پيدا کردن يکي از موارد زيـر ر مبحث بازيابي موسيقي يک عمل جستجو مي د . توان از آن بهره جست تفريحي زيادي مي

: [TALMUD] باشد

) د يک ورودي صوتي را بپذيرد واسط باي ( ٢ يک ملودي •

) صداي يک آلت موسيقي يا يک خواننده مشخص ( ٣ يک تن صدا •

...) يا ٤ ريتم، کرد ( يک الگوي موزيکال •

...) جاز، راک، کالسيک يا ( ٥ يک دسته خاص از موسيقي •

2 Melody

3 Timbre

4 Chord

Page 11: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۱۱ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

) نوازد مثال فالن آلت موسيقي که فالن ملودي را مي ( يا ترکيبي از موارد فوق •

قي هاي بازيابي موسي روش ١ - ١ - ٢

اين تبديالت . گيرند يکسان هستند وجو انجام مي هاي پرس هاي اصلي و داده روي داده زيابي صوت معموال تبديالتي که بر در مبحث با

اسـتريم اي بـا بيـت ، احتماال تبديل داده به داده ...) نويززدايي، همبستگي صوتي و ( ها داده صوتي، ارتقاي داده ٦ اخذ : از عموما عبارتند

جهت انجام ١٠ ها يا توصيف کننده ٩ ها و نهايتا استخراج ويژگي ) در زمان و فرکانس ٨ سازي و گسسته ٧ گيري مجدد با نمونه ( ه ش يافت کاه

پايـه هـاي بـر هـاي آمـاري يـا سـاير روش ، روش ١١ هاي تطبيق رشته بهبود يافتـه تواند توسط روش ها مي که اين پردازش . ها پردازش

مثـل روش نزديکتـرين ( بندي هاي عمومي کالسه ها نيز از روش ي مقايسه نتايج حاصل از پردازش برا . گيري فواصل انجام شود اندازه

کاري در آينـده هاي استخراج شده نيز جهت جلوگيري از دوباره و در آخر اينکه بردار ويژگي . شود استفاده مي ) همسايه يا همبستگي

. [TALMUD] تواند ذخيره و نگهداري شوند مي

بازيابي گفتار ٢ - ٢

براي جستجوي محتواي گفتار، نتـايج خـوبي را بـراي (NLP) هاي پردازش زبان طبيعي ر مبحث بازيابي گفتار، استفاده از تکنيک د

تر بوده و به اين دليل و بودن زبان بسيار مشکل » ١٢ ساختار آزاد « هاي زبان فارسي بدليل پردازش . ها به دست داده است برخي از زبان

توانـد بـراي مـي ١٣ در مبحث بازيابي گفتار تـشخيص تـن صـدا . ر، محصول چندان موفقي را شاهد نيستيم برخي از داليل زباني ديگ

براي بازيابي گفتار ابتدا گفتـار بـه مـتن تبـديل شـده و مـتن بدسـت آمـده . شود شناسايي يک فرد از طريق نمونه صدا بکار گرفته

ترين مشکالت مهم . تباط تنگاتنگي با مبحث پردازش زبان طبيعي دارد در نتيجه ار . شود تا مورد جستجو قرار گيرد گذاري مي انديس

در و تغييـر پذيري، پيچيدگي و ابهام زبـاني، نارسـايي پيوسته بودن سيگنال، تغيير : از موجود بر سر راه تبديل گفتار به متن عبارتند

5 Genre

6 Capturing

7 resampling

8 discretizing

9 Features

10 Descriptors

11 Enhanced String Matching

12 Free Order

13 Timber Recognition

Page 12: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۱۲ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

محتواي اخبار ي توان به آن اشاره نمود، جستجو ه مي ترين کاربردهايي ک از مهم . ) و اثر کانال زمينه پس ( محيط صداي گوينده و نويز

از نظر گوينـده، ( گنجند هاي که فقط در چند دسته خاص مي البته الزم به ذکر است که به دليل وجود تعدادي زيادي داده . باشد مي

و بـا اسـتفاده از تعـدادي از نيازي به تبـديل گفتـار بـه مـتن نيـست ...) زمينه، فيلدي که محتواي خبر به آن تعلق دارد و نويز پس

تـوان ايـن مي ) هاي بدست آمده ها و مقايسه فنم Phoneme نظير تبديل متن مورد جستجو و عبارت مورد نظر به ( هاي ديگر اکتشاف

. [TALMUD] مساله را هندل نمود

ي اين سيستم، جستجوي كلمات هدف كل . باشد مي ١٤ هاي كليدي در گفتار هاي بازيابي گفتار جستجوگر واژه نمونه ديگري از سيستم

جـستجوگر . باشـد گذاري قسمت مورد نظر و يا در مواردي انجام واکنـشي متناسـب مـي خاصي در گفتار پيوسته و ذخيره يا عالمت

برخـي از ايـن . فزارهاي مبتني بر گفتار مـورد اسـتفاده قـرار گيـرد ا عنوان بخشي از ساير نرم کلمات کليدي مي تواند به تنهايي يا به

: کاربردها عبارتنداز

بندي اطالعات گفتاري استخراج و طبقه •

رديابي مکالمه هاي تلفني •

عنوان بخشي از سيستم ديكته براي تشخيص دستورات خاص کاربر و شناسايي کلمات خارج از ديکشنري به •

هاي بازيابي گفتار روش ١ - ٢ - ٢

هـا صـوتي در مرزهـاي گفتـار بنـدي داده اه داده، سـگمنت هاي يک پايگ بر روي داده (ASR) ١٥ قبل از انجام شناسايي گفتار خودکار

اساس وجود يا عـدم وجـود گفتـار، حـضور موسـيقي، کيفيـت صـوت و ها بر بندي اين سگمنت گوينده يا نقاط تغيير آوايي و کالسه

مورد پـردازش قـرار ASR هاي بدست آمده توسط بعد از اين مرحله هر کدام از سگمنت . تواند مفيد باشد جنسيت و زبان گوينده مي

و نهايتـا ) در صورت لزوم ( ها، تبديل آنها به متن در صورت لزوم، در آوردن مدل کلمات و مدل گرامري زبان استخراج فنم . گيرند مي

هاي پردازش زبان طبيعي، از مراحل مختلف ها، کلمات يا ساير اطالعات مفهومي بدست آمده با استفاده از تکنيک گذاري فنم انديس

ASR روند به شمار مي [TALMUD] .

14 http://www.asr­gooyesh.com/farsi/rd_overview.asp

15 Automatic Speech Recognition

Page 13: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۱۳ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

هاي صوتي بدون ساختار بازيابي داده ٣ - ٢

در کـل صـوت ها صوتي و جدا کردن آن از هاي بدون ساختار، پيدا کردن برخي از اصوات مورد نظر در داده در مبحث بازيابي صوت

از ). اي ضـبط شـده از يـک اسـتاديوم هـ در صـوت » .... گـل « مثال پيدا کـردن ( باشند ها مي ترين نوع بازيابي صورت امکان، از عمومي

از ديگـر کاربردهـاي ايـن . هاي ويديويي اشاره نمود گذاري فايل توان به استفاده از آنها در انديس ترين کاربردهاي اين دسته مي مهم

باران باريدن ها، ها، خنده ها، شليک نظير دست زدن ( هاي صوتي موجود هاي صوتي مناسب از فايل توان به پيدا کردن افکت دسته مي

. [TALMUD] تلويزيوني جديد نام برد - هاي راديو جهت توليد برنامه ...) و

هاي صوتي بدون ساختار هاي بازيابي داده روش ١ - ٣ - ٢

پايـه هـاي بـر البتـه سـاير روش . شـود و فيلترينگ انجام مـي ١٦ گيري هاي آستانه هاي صوتي معموال به وسيله تکنيک تشخيص افکت

. تواند مورد استفاده قرار گيرد ر بخش بازيابي موسيقي توضيح داده شد، در اين بخش نيز مي ها که د استخراج ويژگي

تصوير - اي جستجوي چندرسانه ٣

، نقاشي، متن اسکن شده و يا هر چيزي ديگري باشد کـه بـا Clipart ، ١٧ تواند يک عکس، مثال تصويري يک تصوير در حالت کلي مي

. بينايي انسان در ارتباط است

وجوهـاي در موتورهـاي ارائه آنها در موتورهاي جستجوي تصويري داراي تفاوت اساسـي بـا پـرس وجوها و نحوه هاي پرس مشخصه

باشـد، ولـي در جـستجوي تـصويري، اساس کلمات کليدي مـي در يک موتور جستجوي متني، جستجو بر . باشد جستجوي متني مي

در نتيجه يکـي از مـسايل مهـم در جـستجوي . باشد با کلمات، مشکل مي باشد که بيان آنها هاي تصوير مي اساس ويژگي جستجو بر

. باشد وجوها و نحوه ارائه آنها مي تصوير، بررسي انواع پرس

: بايستي در هنگام جستجو و بازيابي مورد توجه قرار گيرند هايي از تصاوير که مي ويژگي

. کنند را توصيف مي ...) ورت و نظير کوه، ماشين، ص ( صحنه تصوير : ١٨ گر محتوي هاي توصيف ويژگي •

. کنند را توصيف مي ...) نظير اطالعات رنگي، بافتي و شکلي و ( هاي تصوير ويژگي : ١٩ هاي وابسته به محتوي ويژگي •

16 Thresholding

17 illustration

18 Content­descriptive features

Page 14: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۱۴ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

. کنند را توصيف مي ...) نظير فرمت فايل، سايز و ( اي هاي داده ويژگي : ٢٠ هاي مستقل از محتوي ويژگي •

. گر محتوي هستند هاي توصيف توانند مورد استفاده قرار گيرد، ويژگي در موتورهاي جستجو مي هايي که براي بازيابي بهترين ويژگي

هـاي بـسيار انـدکي را در گرهاي محتوي به صورت خودکار، بسيار مشکل بوده و در حال حاضر پيشرفت ولي متاسفانه توليد توصيف

هـايي ترين ويژگي مهم . باشد ها استفاده کند، موجود نمي ويژگي به همين دليل موتور جستجويي که از اين . اين زمينه شاهد هستيم

گـر چـه . هاي وابسته به محتوي هستند گيرند ويژگي براي بازيابي تصاوير مورد استفاده قرار مي در موتورهاي جستجوي امروزي که

توان همبستگي معنايي بـين هستند و مي گذاري آنها مناسب ها براي بازيابي اطالعات در تصاوير و براي انديس بکارگيري اين ويژگي

هاي گوناگوني بر اساس محتواي آنها تقسيم نموده ها و محتويات تصوير برقرار کرد، ولي بهتر است ابتدا تصاوير را به دسته اين ويژگي

توانـد ي تـصاوير مـي بندي مناسب بـرا يک دسته . ها تعريف نمود بندي تري را بر پايه اين دسته هاي جستجو و بازيابي منطقي و روش

: [TALMUD] بصورت زير تعريف شود

تصاوير ساختارمند •

o هاي اسکن شده متن

هاي تايپ ماشيني اسکن شده متن §

شده نويس اسکن هاي دست متن §

o تصاوير صورت انسان

) تشخيص صورت ( بازيابي بر اساس صورت فرد خاص §

اساس احساسات صورت افراد بازيابي بر §

o ها دياگرام

o و ...

ساختاري غير تصاوير •

19 Content­dependent features

20 Content­independent features

Page 15: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۱۵ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

در . باشـند هاي جستجو و بازيابي تصاوير ساختارمند با تصاوير بدون ساختار با هم کامال متفاوت مي همانطور که انتظار داريم، روش

بـه هاي مورد استفاده در آن کـامال منحـصر خاص از تصاوير استفاده شده و روش هاي آن دسته بازيابي تصاوير ساختارمند، از ويژگي

اي از تصاوير استخراج گرديده و هاي کلي وعمومي شود تا ويژگي ولي در بازيابي تصاوير بدون ساختار، سعي مي . باشد دسته مي همان

. اساس آنها انجام گيرد بازيابي بر

ه توضـيحاتي سـپس بـ . دهيم وجوهاي کاربران و نحوه ارائه آنها را مورد بررسي قرار مي انواع پرس اين بخش، ابتدا مشخصه در ادامه

هاي مورد اسـتفاده هاي بازيابي تصاوير ساختارمند اشاره کرده و در نهايت به بررسي انواع ويژگي فني کامال مختصري در مورد روش

. دهيم استفاده از آنها را توضيح مي پردازيم و نحوه در بازيابي تصاوير بدون ساختار مي

تصوير وجوهاي هاي پرس مشخصه ١ - ٣

وجوهايي را دوست دارند در اختيار داشته باشند، بايد از نيازهاي کاربران آگاه بود و اينکه نکه کاربران چه نوع پرس براي آگاهي از اي

آورند؟ قضاوت آنها در مـورد عمل مي ه اي از نتايج بدست آمده ب دهند؟ چه استفاده براي رفع چه نيازهايي عمل جستجو را انجام مي

توان بطور شهودي بـه هنوز تحقيق جامعي در اين زمينه وجود ندارد اما مي ... . شود چيست؟ و مي نتايجي که به آنها برگشت داده

: تواند به يکي از داليل زير مورد نياز باشد مي وجو پرس يک . [JEMG 99] نتايجي دست يافت

. دهند يا خواننده نمي براي توصيف حاالت و جمالتي که براحتي قابل بيان نيستند و يا اينکه درک واضحي به شنونده •

) نظير تصاوير راديولوژي ( نمايش جزئيات يک شي براي تجزيه و تحليل آن شي •

... براي کاربردهايي نظير طراحي و •

هـايي کـه دارا تواننـد از لحـاظ ويژگـي تصاوير مي . هاي خاصي مد نظر است بسته به هر کدام از کاربردهاي فوق، تصاويري با ويژگي

: زير تقسيم شوند هاي هستند به گروه

) مثال چه کسي تصوير را ساخته است؟ کجا و کي؟ ( مشخص ٢١ تصاوير داراي دادگان •

). هاي سبز ستاره : مثال ( تصاوير داراي ترکيب معيني از رنگ، بافت و شکل •

). هايي دور يک ميز مثال صندلي ( تصاوير حاوي ترتيبي از اشياي خاص مورد نظر •

). مسابقه فوتبال مثال ( تصاوير معرف يک رويداد خاص •

21 metadata

Page 16: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۱۶ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

). جمشيد مثال تصوير تخت ( تصاوير حاوي رويداد، مکان يا فرد خاص •

) نظير شادي ( تصاوير حاوي هيجانات دروني فردي •

تـرش را در خـود تجريد سطح باالتري از موارد قبلي ) باشد به جز مورد اول که به محتواي تصوير نامربوط مي ( هر کدام از موارد فوق

سـه وجوها را از لحاظ پيچيدگي به توان پرس اين اساس مي بر . تر است اساس آن بدون داشتن دانش خارجي سخت دارد و بازيابي بر

: [JPE 96, JPE 98] دسته تقسيم نمود

هـاي نمونه . هاي ابتدايي نظير رنگ، بافت، شکل و موقعيت مکاني عناصر تصوير شامل بازيابي توسط ويژگي : ۱ وجوهاي سطح پرس

، » تصاويري را با اشياي نازک تيره در گوشه سمت چپ و باالي تصوير پيدا کـن « : تواند به اين شکل بيان شود جوها مي و از اين پرس

تصاويري را که بيشترين شـباهت بـا « تر و يا در حالتي عمومي » چيده شده را پيدا کن هاي زرد به شکل حلقه تصاوير حاوي ستاره «

کنند که بدون نياز به اتصال به هيچ منبع دانش هايي از تصوير استفاده مي ع جستجوها از ويژگي اين نو . » اين تصوير دارند را پيدا کن

. وجو را بيابند توانند پاسخ پرس اي مي خارجي

اي از اشياي دهند که حاوي اطالعات استنتاجي منطقي اي انجام مي هاي اشتقاقي اساس ويژگي بازيابي را بر : ۲ وجوهاي سطح پرس

: توانند به دو دسته زير تقسيم شوند وجوها خود مي اين پرس . باشند صوير مي موجود در ت

). تصاويري را پيدا کن که حاوي يک اتوبوس دو طبقه باشند : مثال ( بازيابي اشيايي از نوع داده شده •

). تصاوير برج ايفل را پيدا کن : مثال ( اساس اشياي مشخص بازيابي بر •

سازي مقداري دانش خـارجي نياز به ذخيره ) وجوهاي در مورد اشياي مشخص و بخصوص پرس ( وجوها براي پاسخگويي به اين پرس

باشـد، در حاليکـه نيـاز مي ۱ وجوهاي سطح تر از پاسخگويي به پرس وجوهاي اين سطح به مراتب مشکل پاسخگويي به پرس . داريم

. [PGBE 95] باشد پردازند از اين دسته مي اکثر کساني که به جستجوي تصاوير مي

هاي سطح باال از تصوير و درک باشد که نيازمند استدالل اي مي هاي انتزاعي شامل بازيابي بر اساس ويژگي : ۳ و جوهاي سطح پرس

: توانند به دو زير دسته تقسيم گردند وجوهاي اين دسته نيز مي پرس . باشد معني و مفهوم آن تصوير مي

). تصاويري را پيدا کن که در آن شخصي در حال دويدن باشد : مثال ( ت بازيابي رويدادهاي مشخص يا نوع خاصي از فعالي •

). کند تصاويري را بياب که در آن کسي درد را تحمل مي : مثال ( بازيابي تصاوير حاوي هيجانات يا حاالت روحي خاص •

Page 17: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۱۷ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

ت ذهنـي الزمـه ارتبـاط استدالل پيچيده و قـضاو . باشند تر از يک جستجو مي وجوهاي اين سطح، بسيار پيچيده پاسخگويي به پرس

دارند ولي به مراتب از آنها ۲ وجوهاي سطح وجوها موارد استفاده کمتري از پرس اين پرس . باشد دادن مفاهيم با محتويات تصوير مي

. باشند تر مي مشکل

که در اين بخش به آن مطالبي . پردازيم وجوها مي وجوهاي تصوير را بررسي کرديم، به بررسي نحوه ارائه اين پرس حال که انواع پرس

. باشد مي موجود هاي از موتورهاي جستجو در اين سطح باشد که در حال حاضر، نمونه مي ۱ جستجوهاي سطح پردازيم در حوزه مي

GRIM DBMS [FRPS مـثال سيـستم ( کردنـد را پشتيباني مـي SQL وجوهاي شبيه هاي ارائه شده، استفاده از پرس اولين سيستم

که در [CF 81] مطرح شد ٢٢ وجو با مثال رسيد روش پرس هاي شهودي توسط کلمات مشکل به نظر مي که بيان داده از آنجايي ). [89

امروزه تقريبا تمامي سيستم موجود از . کند باشد، از سيستم تقاضاي نتايج مي آن کاربر با ارائه تصويري شبيه آنچه که مد نظرش مي

پـذيرد و سـپس در يـک صـفحه تعـدادي از ير نمونه دريافت شـده، جـستجو انجـام مـي تصو اساس بر . کنند اين شيوه پشتيباني مي

. شوند براي کاربر نمايش داده مي ، به ترتيب شباهت ، هاي يافته شده ترين پاسخ نزديک

: وجوهاي کاربر ارائه داد براي انواع پرس [CEM 98, CHPS 99] اساس بندي زير را بر توان دسته مي

در اين . باشد ترين روش در جستجو و بازيابي اطالعات تصويري مي جو با مثال يا قالب کالسيک جست : 23 جستجو با مثال •

اي از تصوير را که به آنها روش در يک واسط گرافيکي تعاملي، کاربر تصوير مورد نظر خود را انتخاب کرده ، نواحي

) ا ٢٥ ه يا شباهت ويژگي ٢٤ تگي روشنايي مثال همبس ( نمايد و سپس معيارهاي خود براي جستجو عالقمند است مشخص مي

. کند مي ل وجوي خود را ارسا نمايد و پرس را انتخاب مي

هاي ديگري از آنجايي که کاربر هميشه تصويري شبيه آنچه را که الزم دارد در اختيار ندارد، روش : 26 ها جستجو با ويژگي •

در اين . باشند مي IBM QBIC [FSNA 95] سيستم پايه ايده مطرح شده در براي اين منظور پيشنهاد شد که همه آنها بر

نظير رنگ، بافت، شکل، جابجايي و يا ساختار ( هاي آنها سري از ويژگي کاربر تصاويري را مطابق يک ها، سيستم

ي براي بازياب . [CEM 98, FSNA 95, PPS 94, RC 96] کند باشد، تقاضا مي که مد نظرش مي ) نواحي آن ٢٧ مکاني - زماني

22 Query by Example

23 Search by example

24 Intensity correlation

25 Feature similarity

26 Search by features

27 Spatio­Temporal structures

Page 18: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۱۸ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

اساس انتخاب تواند بر جستجوهاي بافت مي . شود داده مي ٢٨ بر اساس رنگ، به کاربر اجازه انتخاب رنگ از يک جعبه رنگ

. پذيرد نمونه بافت مورد نظر از يک مجموعه بافت مختلف انجام

در اين . باشد ي باشد که ويژگي مورد استفاده در آن، شکل م ها مي حالت خاصي از جستجو با ويژگي : ٢٩ ها جستجو با طرح •

گيرد تا طرح بصري کلي چيزي را که در ذهن دارند و اي در اختيار کاربران قرار مي ها ابزارهاي گرافيکي پيشرفته سيستم

شود تا نتايج متناظر با آن وجو به سيستم فرستاده مي هاي کلي به عنوان پرس اين طرح . دهند گردند نشان دنبال آن مي

,LBNF 94, CLLK 97, RC 96, CCMS 97] برگشت داده شوند JFS 95, JSSC 97­b, STL 97] . ها در اين سيستم

يا در صورتي که [LBNF 94, CLLK 97] اي ترسيم کند روي صفحه تواند طرح کلي تصوير مورد نظر خود را بر کاربر مي

هايي که سيستم در اختيار دايره ها و تواند طرحي از شکل مورد نظر خود را با مستطيل هنر ترسيم خوبي نداشته باشد، مي

JSSC 97­b, STL] دهد، براي سيستم نشان دهد او قرار مي 97] .

هاي اساس ويژگي باشد که در آن بر ها و جستجو با مثال مي اين حالت، تلفيقي از جستجو با ويژگي : ٣٠ جستجو با نواحي •

ها به کاربر سپس اين ناحيه . شود آن تقسيم مي بندي شده و به نواحي تشکيل دهنده تصوير ورودي، تصوير، قطعه اوليه

داده تصاويري از پايگاه . پذيرد اساس آن انجام نمايد تا جستجو بر نشان داده شده و کاربر ناحيه مورد نظر خود را انتخاب مي

اي از نوان نمونه ع به . شوند برگشت داده مي ، عنوان نتايج اي شبيه به ناحيه مورد جستجو داشته باشند، به که حاوي نواحي

هاي اوليه رنگ و اساس ويژگي بندي بر که در آن ناحيه [CBGM02] اشاره نمود BlobWorld توان به ها مي اين سيستم

. پذيرد بافت انجام مي

باشد مي ٣١ گيري از بازخورد ارتباط تواند مطرح شود، بهره تکنيک مناسب ديگري که مي : با پااليش تدريجي ه جستجو همرا •

اين تکنيک در . [GS 71] ايه ايده پااليش تدريجي نتايج استوار است و اولين بار براي جستجوي متن ارائه گرديد پ که بر

و امروزه بصورت موفقي [PCA 92] هاي بازيابي بر اساس کلمات کليدي بکار گرفته شد نخست در سيستم ، بازيابي تصاوير

JSSC] مثال ( بکار گرفته شده است اساس محتوا نيز هاي بازيابي بر در بسياري از سيستم 97­b, RHM 97] .( در اين

شود و کاربر از بين آنها تصويري را که بيشترين تصادفي به کاربر نشان داده مي اي از تصاوير توليد شده ها مجموعه سيستم

برگشت ش کاربر براي بر نظر در اين صورت مجموعه تصاويري منطبق . کند شباهت را با تصوير مورد نظرش دارد انتخاب مي

28 Palette

29 Search by sketches

30 Search by Region

31 Relevance Feedback

Page 19: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۱۹ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

کند و تر است انتخاب مي داده خواهد شد که کاربر از ميان اين تصاوير برگشتي تصويري را که به تصوير مد نظرش نزديک

کند تا در نهايت کاربر تصوير مورد نظر خود را اين حلقه به همين صورت ادامه پيدا مي . گيرد دوباره عمل بازيابي انجام مي

. پيدا نمايد

به کاربران اجازه داد تا براي هر کدام از توان ، مي هاي فوق در هر کدام از سيستم در انتهاي بحث بايد ذکر شوند، يکي اينکه، نکته دو

هـايي کـه بتواننـد معيارهـاي هنوز جا براي تحقيق در مـورد واسـط و ديگر اينکه . هايي را انتخاب نمايند وجويشان وزن اجزاي پرس

. [SSRJ 97] اساس آنها عمل نمايند خالي است ظر کاربران را دريافت کرده و بر سنجش شباهت مورد ن

هاي جستجو و بازيابي تصاوير ساختارمند روش ٢ - ٣

هـاي بازيـابي تـصاوير بـدون سـاختار ها و همچنين متفاوت با روش بازيابي در هر دسته از تصاوير ساختارمند متفاوت با ساير دسته

: [TALMUD] اند گيرند بصورت خالصه در زير ذکر بيان شده يابي هر دسته مورد استفاده قرار مي عملياتي که در باز . باشد مي

اسناد تصويري موجود بايد به اسناد متني تبديل شده و جستجو در متـون ها در اين سيستم : هاي تايپ ماشيني اسکن شده متن

هـا، نـويززدايي و زمينه و سـايه براي حذف پس بايستي ابتدا مي براي تبديل يک سند تصويري به سند متني، . پذيرد استخراجي انجام

روي آن بـر ( OCR 32) اقدامات الزم صـورت پذيرفتـه و سـپس عمليـات تـشخيص حـروف و کلمـات ، ارتقاي کيفيت متون باقيمانده

. پذيرد انجام

نويس در اين يت پايين عالوه بر متون دست هاي غيرمعمول، يا با کيف متون نوشته شده با فونت : شده نويس اسکن هاي دست متن

شـود کـه مـتن بـه کلمـات متـصل بـه هـم اسـتفاده مـي » ٣٣ تـشخيص کلمـه « براي تشخيص متن از تکنيک . گيرند دسته قرار مي

هـاي تطبيـق تـصوير، در جهت آموزش تکنيک . شود استفاده مي OCR به جاي » تطبيق تصوير « هاي بندي شده و از تکنيک سگمنت

روي آنها و عمليات آموزش سيستم بر هايي از تصاوير کلماتي که براي ما اهميت دارند، به سيستم معرفي شوند ايستي نمونه ب ابتدا مي

. پذيرد انجام

. نيز باشند ي از قبل تعريف شده ا ه هستند که بايد قادر به درک بعضي از نماد OCR هاي گسترشي از برنامه : ها دياگرام

32 Optical Character Recognition

33 Word Spotting

Page 20: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۲۰ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

کننـده اصـلي ، تحليـل تفکيـک (PCA) ٣٤ هايي نظير تحليـل مولفـه اصـلي ي اين منظور از تکنيک برا : تشخيص صورت در تصاوير

35 (LDA) شود استفاده مي ... هاي عصبي و هاي گبور، شبکه و جت ٣٦ ، تبديل موجک گبور .

هاي مورد استفاده در تـشخيص صـورت در اينجـا هـم مـورد اسـتفاده قـرار اکثر تکنيک : تشخيص احساسات در تصاوير صورت

. گيرد مي

هاي جستجو و بازيابي تصاوير عمومي و بدون ساختار روش ٣ - ٣

خـالف جـستجو در حـوزه در ايـن جـستجوها بـر . باشند مي ۱ هاي بدون ساختار عموما از جستجوهاي از سطح روي داده جستجو بر

هـاي هاي مورد استفاده در روش گي ترين ويژ از مهم . شود هاي عمومي و سطح پايين تصاوير استفاده مي تصاوير ساختارمند از ويژگي

، [RMJG 95, AKJ 96] ، شـکل [FLRP 96, BMWM 96] ، بافـت [MSDB 91, JSSC 97­a] تـوان از رنـگ بازيابي اين دسته، مـي

VGVR] بندي مکاني طرح KLCK] نظير تبديل موجک ، ها شدت پيکسل ٣٧ هاي چند وضوحي ديل ، تب [95 و فيلترهـاي گاوسـي [98

. نام برد [SRRM 98] ٣٨ چند مقياسي

بندي، بافت رنگ، طرح ( هاي مورد استفاده ترين ويژگي اساس مهم هاي بکار رونده در بازيابي تصاوير بر اين بخش ابتدا تکنيک در ادامه

. شود گرفته و در نهايت توضيحات مختصري در مورد جستجوهاي سطوح باالتر ارائه مي مورد بررسي قرار ) و شکل

ي رنگ اساس ويژگ بازيابي بر ١ - ٣ - ٣

هايي که از ايـن نمـايش رنگـي ترين تکنيک مهم . باشد رنگي مي هيستوگرام ، مهمترين نمايش رنگي مورد استفاده در بازيابي تصاوير

و هيـستوگرام رنـگ [MI 89, NB 94] هـا ، مقايـسه هيـستوگرام [MSDB 91] ٣٩ هـا هيستوگرام ک اشترا : از کنند عبارتند استفاده مي

). ت کاهش اثرات نويز جه ( [MSMO 95] ٤٠ ی تجميع

34 Principle Component Analysis

35 Linear Discriminate Analysis

36 Gabor Wavelet Transform

37 Multi Resolution

38 Multi­Scale Gaussian filtering

39 Histogram Intersection

40 Cumulated Color Histogram

Page 21: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۲۱ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

تـوان بـه گـشتاورهاي مـثال مـي . ده قرار گرفته است ي جهت بازيابي تصاوير مورد استفا هاي رنگ هاي ديگري نيز براي ويژگي نمايش

. اشاره نمود [JSSC 95 a,b] ٤٢ هاي رنگي و مجموعه [MSMO 95] ٤١ رنگي

بندي رنگ اساس ويژگي طرح بازيابي بر ٢ - ٣ - ٣

هاي برگشتي اشتباه بـسيار بـاال خ شود تا ميزان پاس هاي با تعداد تصاوير باال باعث مي داده بر روي پايگاه استفاده تنها از ويژگي رنگي

ترکيب ويژگي رنگ و رابطه مکاني ( 43 بندي رنگي به همين دليل استفاده از ويژگي طرح . مد کند رآ و استفاده از اين ويژگي را ناکا رود

CTO 97, FFNP] باشـد هاي رنگي در زير نواحي مشخصي از تصوير مـي استخراج ويژگي ايده کلي اين روش . مطرح شد ) ها پيکسل

LOT] توان به استفاده از ويژگي رنگ در درختان چهارتايي اشاره نمود که از آن جمله مي [93 بندي تصوير و اسـتفاده از قطعه . [94

JSSC] برد ه همان نسبت پيچيدگي کار را نيز باالتر مي تري را توليد کند ولي ب تواند نتايج دقيق ويژگي رنگ در هر ناحيه مي 95­a] .

استفاده از سه گـشتاور رنگـي اول در : توان به موارد زير اشاره نمود اند مي هاي ديگري که با اين ديد به مساله پرداخته از جمله روش

هاي شـبيه و غيرشـبيه يل شدن بين پيکسل ، روش بر پايه تمايز قا [MSAD 96] نواحي در چند ناحيه همپوشان از قبل تعيين شده

بکار ...) نظير بافت و ( هاي ديگر نيز توان با ساير ويژگي بندي مکاني را مي طرح ... . و [PZM 96] هر ناحيه به ميانگين رنگي آن ناحيه

. برد

اساس ويژگي بافت بازيابي بر ٣ - ٣ - ٣

ها هاي مختلفي براي نمايش و استفاده بافت مدل . رائه نيستند شود که توسط نمايش رنگي قابل ا اي گفته مي بافت به الگوهاي بصري

اما استفاده از شباهت بافت بين نقاطي که داراي رنگ همساني . اساس بافت به تنهايي کاربرد چنداني ندارد بازيابي بر . ارائه شده است

. ختلفي جهت شناخت بافت پيشنهاد شده اسـت هاي م تکنيک . باشد بسيار مفيد مي ) ها و علف نظير آسمان و دريا و يا برگ ( هستند

HSD] ٤٤ وقوعي استفاده از ماتريس هم ها در اين زمينه بوده است که سابقه آن به خيلي قبل از مبحث بازيـابي جزو اولين تالش [73

هاي استخراج ويژگي بر پايه مطالعات روانشناسانه و که Tamura توان به روش هاي اين زمينه مي ترين روش مهم از . گردد تصوير برمي

. باشد، اشاره نمود مي [TMY 78] بافتي داراي مفهوم

41 Color Moments

42 Color Sets

43 Color Layout

44 Co­occurrence matrix

Page 22: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۲۲ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

هاي وجو و داده بين مورد پرس ٤٥ هاي درجه دوم پايه مقايسه مقادير آماره هاي موجود براي بازيابي بر اساس بافت بر ترين تکنيک مهم

، ٤٧ ، جهت بافـت ٤٦ هايي از بافت تصوير نظير کنتراست، زبري يژگي گيري و ها اندازه با استفاده از اين آماره . کنند بانک اطالعاتي کار مي

هـاي ديگـري بـراي رهيافـت . شود ممکن مي [FLRP 96] و تصادفي بودن بافت يا حالت تناوبي [TMY 78] بافت ٤٨ نظم و باقاعدگي

، [JSSC 94, TCJK 93, ALJF 93, AKJC 92, GKLD 94, TNP 94] هاي بر پايه تبديل موجک نمايش : از گيري بافت عبارتند اندازه

LMN] ها و فراکتال [BMWM 96] فيلترهاي گبور در کاربردهـاي هـا روش هاي مختلفي در جهت مقايـسه کـارايي ايـن مقاله . [98

. [WDR 76, PORD 92, CJ 83, APP 84, MM 95] پردازش تصوير ارائه شده است

بازيابي بر اساس ويژگي شکل ٤ - ٣ - ٣

ويژگـي شـکل را بـراي کاربردهـاي ه کـ ي ا خصيـصه مهمتـرين . باشد مي ۱ نوع بازيابي در سطح ترين اساس شکل شهودي بازيابي بر

تواند در برابر انتقـال، دوران و تغييـر مقيـاس هويـت خـود را حفـظ شکل مي سب ساخته است اين است که يک پردازش تصوير منا

. [RHC 99] نمايد

، براي هر تصوير ذخيـره ) باشند که مستقل از اندازه و جهت مي ( اوير ها تعدادي از ويژگي هاي مشخصه اشياي داخل تص در اين روش

شـوند، بـه دو دسـته تقـسيم استخراج مي صورت چه به هاي شکل بر اساس اينکه ويژگي . شود اساس آنها انجام مي شده و بازيابي بر

­ شوند، عبارتند مشخصه اشيا که به کار گرفته مي هاي ترين ويژگي مهم . بر پايه نواحي هاي ويژگي ها و پايه لبه بر هاي ويژگي شوند، مي

، [HU 62, WN 93, LYFA 94, KLS 95] 51 و ثوابـت گـشتاور ٥٠ ، مـدور بـودن ٤٩ هاي سراسـري نظيـر نـسبت ابعـاد شـي ويژگي : از

هـاي هاي محلي نظير سـگمنت و ويژگي [PF 77, ZR 72, RSH 96] ) هاي تبديل فوريه يافته استفاده از لبه ( ٥٢ گرهاي فوريه توصيف

RMJG] ٥٣ هاي متوالي لبه تـوان از روش دگرديـسي کشـسان اند، مـي هاي ديگري که براي انطباق اشکال پيشنهاد شده از روش . [95

45 Second­order statistics

46 Coarseness

47 Directionality

48 Regularity

49 Aspect ratio

50 Circularity

51 Moment Invariants

52 Fourier Descriptors

53 Consecutive Boundary Segments

Page 23: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۲۳ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

54 ها قالب [PPS 96, BPS 96] هاي انطباق اشياي تصوير که با تکنيک ٥٦ هاي تصاوير و نمايش اسکلتي لبه ٥٥ ، مقايسه هيستوگرام جهتي

و [EACH 91] ٥٨ ، توابـع گردشـي [PPS 96] (FEM) ٥٧ روش عناصر محـدود ، [KCBC 97, TSKK 98] د شون گراف با هم مقايسه مي

BLSM] توان به اند مي ها پرداخته ها و مقايسه آن از مقاالتي که به بررسي کلي اين روش . نام برد [GCJK 96] گرهاي موجک توصيف

95, MKL . اشاره نمود [97

۲ اس محتوي در سطح اس هاي موجود براي بازيابي بر تکنيک ٥ - ٣ - ٣

ها براي کوتاه کـردن فاصـله بـين برخي از پژوهش . هاي ابتدايي هستند اي موجود بر پايه ويژگي هاي بازيابي چندرسانه اکثر سيستم

اشـاره نمـود GRIM_DBMS توان به انجام گرفته در اين دسته مي ي ها از پژوهش . در حال انجام هستند ۲ و سطح ۱ بازيابي سطح

[FRPS هـاي سـاختمان ٥٩ هاي اشـکوب نظير نقشه ( هاي اشياي يک حوزه کوچک از قبل تعيين شده اساس تفسير طراحي که بر [89

. دهد بازيابي را انجام مي ) مسکوني

شناسـايي اشـياي دوم شناسايي و تحليـل صـحنه و اول : باشد گيرند، بيشتر در دو راستا مي هايي که در اين راستا انجام مي پژوهش

بـه اشـياي به صحنه و هم راجـع توان اطالعاتي راجع باشد، چون هم مي شناسايي صحنه در تصاوير بسيار مهم مي . صحنه موجود در

IRIS [HKKZ تـوان بـه سيـستم اند مي هايي که با اين ديد به مساله پرداخته از سيستم . موجود در صحنه استخراج کرد اشـاره [95

هايي متني در مورد تصوير بافت، ناحيه و اطالعات مکاني به تفسير صحنه پرداخته و توصيف هاي رنگ، نمود که با استفاده از ويژگي

هـاي عـصبي توسط شـبکه باشد که بعدا اي ديگري از اين گروه، استخراج اجزاي با فرکانس پايين تصوير مي نمونه . نمايد را توليد مي

نمونه ديگر اطالعات رنگي همسايگي از تصاوير بـا رزولوشـن پـايين يا در [AOJH 97] گيرند تجزيه و تحليل قرار مي مصنوعي مورد

هاي زيادي نيز براي تشخيص اشيا در تصاوير تالش . [ARWG 97] هاي تعريف شده توسط کاربر را بسازند شوند تا قالب استخراج مي

گيري ي در تشخيص اشيا با الهام اشاره نمود که سع [FMFG 97, HMV 97, AHVH 98] توان به از آن جمله مي . انجام گرفته است

هـاي پـردازش پايـه هـاي بـر و سيـستم SIMPLIcity [WLW 01] سيـستم . انـد دهد پرداخته از فرايندهايي که در مغز انسان رخ مي

54 Elastic Deformation of Templates

55 Directional Histogram

56 Skeletal Representation

57 Finite Element Method

58 Turning Functions

59 Floor plans

Page 24: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۲۴ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

ن گـروه مـي هـا ، جديدترين تـالش [CCYC 05, CC 06] ٦٠ مراتبي تحليلي سلسله سـعي در SIMPLIcity در سيـستم . د ن باشـ از اـي

هايي نظير رنـگ و بافـت، بر اساس ويژگي . شود هاي سطح پايين آن مي اساس ويژگي ي معنايي تصاوير بصورت خودکار بر بند کالسه

، ٦١ تـصوير داخلـي ( ، ) عکس طبيعي، تصوير سـاختگي ( ، ) بافتي، غير بافتي ( هاي نظير کند تا تصاوير را به کالس اين سيستم سعي مي

هـاي سلـسله پردازش پايه هاي بر و در سيستم . بازيابي محتوايي را براساس آنها انجام دهد بندي نموده و کالسه ... و ) ٦٢ تصوير بيروني

داده ممکـن اسـت ظـاهر شـوند، تـشکيل مراتبي معنايي از مفاهيمي که در پايگـاه ، ابتدا يک ساختار سلسله (AHP) مراتبي تحليلي

سپس . شود از ساختار سلسله مراتبي به آن گره نسبت داده مي هاي سطح پايين متناظر با هر گره در مرحله آموزش ويژگي . شود مي

داده در سـاختار سلـسله مراتبـي از ريـشه شـروع بـه حرکـت نمـوده و بـا مقايـسه در مرحله استفاده، هر تصوير با ورود بـه پايگـاه

ها، کـه از لحـاظ ر کالسي از برگ کند تا در نهايت د ها حرکت مي هاي هر نود فرزند در ساختار، به سمت برگ هايش با ويژگي ويژگي

هاي داده شده به تصاوير انجـام اساس مفاهيم و برچسب بر در اين روش، جستجو . مفهومي به آن شباهت بيشتري دارد، قرار بگيرد

. پذيرد مي

گيرنـد از کاربران مـي اند که بر اساس بازخوردي که هايي نيز ارائه شده باشند، سيستم هاي فوق که تمام خودکار مي بر سيستم عالوه

MIT از دانـشگاه FourEyes هاي سطح پايين دارند که از آن نمونه به سعي در يادگيري و ايجاد ارتباط بين مفاهيم معنايي و ويژگي

ي هايي را برا شود، برچسب شود تا در تصاويري که به آنها نشان داده مي در اين سيستم از کاربران خواسته مي . [TM 96] اشاره نمود

اي از سـاير گـذاري نـواحي سيستم از اين توضيحات کاربران استفاده نموده و از آنها براي برچسب . نواحي مشخص شده عنوان کنند

صري « مفهـوم ، نمونه ديگـري از ايـن دسـته . کند باشند، استفاده مي هاي اوليه شبيه اين ناحيه مي تصاوير که داراي ويژگي قالـب ـب

CWLW] باشد که در مي » ٦٣ مفهومي خواهـد سيـستم از کـاربر مـي . کنـد در اين روش کاربر تقاضاي يک مفهوم مي . مطرح شد [98

ده را محدوده رنگ، بافت، شکل و پارامترهاي جابجايي مفهوم مورد نظرش را معين نمايد و براساس اين ويژگي ها تصاوير بدست آـم

. رود تا کاربر تصوير مورد نظـر خـود را بيابـد ح سيستم پيش مي اصال - اين فرآيند در يک حلقه بازخورد کاربر . دهد به وي نشان مي

بعد از گذشت . زند تا براي کاربران آينده مورد استفاده و مفيد واقع شود سيستم واژه مورد جستجو را به تصوير پيدا شده برچسپ مي

. ي اوليه خواهد بود ها پايه ويژگي اي از اطالعات مفهومي بر داده حاوي گنجينه مدتي از زمان اين پايگاه

60 analytic hierarchical process (AHP)

61 Indoor

62 Outdoor

63 Semantic Visual Template

Page 25: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۲۵ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

۳ اساس محتوي در سطح هاي موجود براي بازيابي بر تکنيک ٦ - ٣ - ٣

هايي که شايد بتوان آنها را در اين دسته جا داد، تحقيقاتي است که در تنها نمونه . در اين سطح، تقريبا کار خاصي انجام نشده است

آيند يا خير در آنها مطرح ها و يا اينکه آيا دو رنگ بهم مي گ ها و مطرح کردن مفاهيم گرم و سرد بودن رن اساس رنگ آنها بازيابي بر

. [TK 92, CBV 98] شده است

ويديو – اي جستجوي چندرسانه ٤

هـاي محاسـباتي و ، بازيابي ويـديو از پيچيـدگي استس الزم آنها و زمان زيادي که براي بازبيني هاي ويديو ه دليل حجم باالي داده ب

هر صحنه نيز به نوبه خـود از . تشکيل شده است ٦٤ يک داده ويديو از تعدادي صحنه . برخوردار است زماني بيشتري نسبت به تصاوير

شات به بطور طبيعي، تغيير از يک شات . باشد تشکيل شده است که هر شات حاوي يک منظره، مکالمه يا عمل مجزا مي ٦٥ چند شات

طور خودکار با آنـاليز ه توانند ب اين تغييرات مي . ( باشد يه دوربين مي ديگر، شامل يک تغيير ناگهاني در محتواي تصويري صفحه و زاو

بـه عنـوان ) فـريم ( توان از هر شات يک تصوير مي ). هاي متوالي کشف شوند هاي رنگي و بردارهاي جابجايي و بافت فريم هيستوگرام

هاي کليدي بـراي يـک ويـديو را موعه اين فريم گويند و مج مي » ٦٦ فريم کليدي « اين فريم نماينده را . نماينده آن شات انتخاب نمود

storyboard نامند فيلم مي .

تصاوير ثابـت اي از آن فيلم که مجموعه storyboard ترين روش براي بازيابي ويديو اين است که جستجو و بازيابي را بر روي عمومي

ر ويديو، چنـدين ويـديوي کوچـک حـاوي جزئيـات يک راه ديگر براي جستجو و بازيابي اين است که براي ه . باشد، انجام دهيم مي

. [AZP 96, BYY 98] روي آنها انجام دهيم بازيابي را بر و و جستجو ) ٦٧ اختصار ويديو ( کليدي آن تهيه نموده

. اندازيم تري به بازيابي ويديو مي وجوهاي ويديو را بررسي نموده و سپس نگاه دقيق هاي پرس اين بخش ابتدا مشخصه در ادامه

64 scene

65 shot

66 Key Frame

67 Video skimming

Page 26: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۲۶ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

وجوهاي ويديو هاي پرس ه مشخص ١ - ٤

داراي همان خـواص ۱ وجوهاي سطح پرس . وجوهاي تصوير ارائه داد اي شبيه پرس بندي توان دسته وجوهاي ويديو نيز مي براي پرس

هاي همسان با تصاوير ثابت تکيه کند، از حرکت اشيا نيـز روي ويژگي باشند با اين تفاوت که جستوها به جاي اينکه فقط بر قبلي مي

هاي قرمز رنگ از سمت چپ و باالي کليپ به سمت راسـت و پـايين هايي را پيدا کن که در آن ستاره کليپ : مثال . ( کند ستفاده مي ا

هـا هـايي را بيـاب کـه در آن کليپ : مثال ( توان اعمال حرکتي را نيز وارد نمود مي ۲ وجوهاي سطح در پرس ). کنند کليپ حرکت مي

. نيز به همين ترتيب ۳ وجوهاي سطح و در مورد پرس ). ت هواپيمايي در حال بلند شدن اس

تـوان وجوهاي تصوير قايل شد ايـن اسـت کـه در ويـديو مـي وجوهاي ويديو در مقايسه با پرس توان براي پرس تفاوت ديگري که مي

ا اسـامي عوامـل سـازنده ها ي نويس نظير زير ( هاي ظاهر شونده در آن وجوهايي از گفتارهاي موجود در ويديو، موسيقي آن، متن پرس

. نيز مطرح کرد ) شوند يک فيلم که در انتهاي ويديو آورده مي

جستجو و بازيابي ويديو ٢ - ٤

گذاري ارائه شده براي هاي انديس اغلب رهيافت . باشد هاي ويديو مي گذاري کاراي فايل ي نيازمند انديس ي هاي ويديو بازيابي موثر داده

در ادامه به هر کدام از اين مراحـل . ٧٠ و استخراج محتوي ٦٩ ، تجريد ٦٨ بندي زماني سگمنت : اند ه ويديو، از سه مرحله متوالي تشکيل شد

. اندازيم تري مي نگاه دقيق

بندي زماني سگمنت ١ - ٢ - ٤

هـا هاي کمي عمـده بـين فـريم باشد که قادر به بيان تفاوت مناسب مي ٧١ رهيافت کلي براي اين بخش تعريف يک معيار تفاوت کمي

. شوند بکار گرفته مي ٧٣ و تشخيص تغيير شات ٧٢ هاي تشخيص تغيير صحنه ور تکنيک براي اين منظ . باشد

: [TALMUD] از عبارتند تشخيص تغيير صحنه مختلف هاي الگوريتم

68 Temporal Segmentation

69 Abstraction

70 Content Extraction

71 Quantitative difference metric

72 Scene detection

73 Shot detection

Page 27: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۲۷ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

. آيند ها و تغييرات اصوات بدست مي ها با استفاده از ويژگي مرز صحنه : تشخيص تغيير صحنه با استفاده از صوت •

سر هاي پشت با بررسي و تشخيص تغييرات عمده هيستوگرام رنگي فريم : هيستوگرام رنگي تشخيص تغيير صحنه با آناليز •

هاي فريم ( اي از يک سري از تصاوير پشت سر هم از ويديو هر صحنه مجموعه . گردد هم، تغيير در صحنه ويديو کشف مي

. خواهد بود ) متوالي

­ توان هنگام تهيه زيرنويس فيلم از عالمت مي : د تشخيص تغير صحنه با استفاده از زير نويس فيلم در صورت وجو •

. ها کمک کنند هايي استفاده کنيم که بعدا به ما در تشخيص تغيير صحنه گذاري

: [TALMUD] از شات عبارتند تشخيص تغيير مختلف هاي الگوريتم

از ترکيب تبديل ر براي اين منظو : ) انتقال ناگهاني بين دو شات را برش گويند ( ٧٤ تشخيص تغيير شات با تشخيص برش •

روش تحليل گردش نوري . شود استفاده مي ٧٧ تحليل گردش نوري يا از روش ٧٦ و بردارهاي جابجايي ٧٥ کوسينوسي گسسته

با استفاده از . . رود بندي بصري و توصيف ويديو بکار مي باشد که براي سگمنت پايه تفسير جابجايي دوربين مي يک روش بر

گيري شده و نواحي منفرد از يک فريم به فريم بعدي تعقيب ، گردش نوري اندازه Lucas­Kanade ٧٨ روش کاهش گراديان

شود و تغييرات گيري سرعت نواحي مجزا در طي زمان، نمايش زماني يک صحنه ساخته مي با استفاده از اندازه . شوند مي

. باشد گسترده در نمايش زماني نمايانگر تغيير شات مي

تشخيص در اين روش : ) انتقال تدريجي بين دو شات را محوشدگي گويند ( ٧٩ شدگي تشخيص تغيير شات با تشخيص محو •

اين روش براي . پذيرد هاي رنگ انجام مي ها با استفاده از ترکيب تحليل گردش نوري و هيستوگرام تغيير شات

. شود بندي در شرايطي که تغييرات ناگهاني در محتواي تصاوير نداريم بکار برده مي سگمنت

74 Cut detection

75 Discrete Cosine Transform (DCT)

76 Motion Vectors

77 Optical Flow Analysis

78 Gradient descent

79 Fade detection

Page 28: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۲۸ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

تجريد ٢ - ٢ - ٤

هـاي تـصوير، باعـث هاي استخراجي از تـک تـک فـريم گذاري ويديو با آن مواجه هستيم اين است که ويژگي شکلي که در انديس م

هاي ويديو بايـد يـک سـري تجريـد را جهـت در نتيجه به جاي بکارگيري تمامي فريم . شوند ها مي شدن حجم عظيمي از داده جمع

هاي کليـدي فريم . شود استفاده مي ٨٠ هاي کليدي ها، فقط از فريم استفاده از تمامي فريم در عمل، به جاي . ها انجام دهيم کاهش داده

هـاي زيـر هاي کليدي از تکنيک براي استخراج فريم . دهند هاي ويديو را به دست مي به بهترين شکل ممکن، تجريدي از تمامي فريم

: [TALMUD] شود استفاده مي

هايي که با يک مکث عمده هاي جابجايي هاي کليدي با مينيمم محلي فريم : ٨١ يي هاي کليدي با تحليل جابجا انتخاب فريم •

. شود ها در يک شات از محاسبات گردش نوري استفاده مي براي پيدا کردن مينيمم محلي . شوند متناظر هستند شروع مي

) ها يير دوربين يا شخصيت نظير تغ ( تغييرات عمده در فعاليت : ٨٢ هاي کليدي با استفاده از تابع فعاليت استخراج فريم •

. دهند هاي کليدي جديد را به دست مي فريم

استخراج محتوي ٣ - ٢ - ٤

هـاي رنگـي، نظيـر ويژگـي ( آن شـات نماينـده هـاي فـريم کليـدي ويژگـي توان از ، مي يک شات براي استخراج و نمايش محتويات

تـوان بـه هاي زماني مي از ويژگي . نمود ستفاده ات ا آن ش هاي زماني ويژگي و يا ) هاي بافت، لبه و شکل هاي رنگي، ويژگي هيستوگرام

: موارد زير اشاره نمود

...) زوم کردن، کج شدن، حرکت افقي در عرض صفحه و ( عملگرهاي دوربين •

ها تغييرات زماني روشنايي و رنگ •

يک شات هاي هاي غالب در طول تمامي فريم نمايش بوسيله ميانگين و واريانس روشنايي متوسط و پيدا کردن رنگ •

) شوند هاي يک شات ساخته مي ي فريم تصاويري که با استفاده از محتويات تمام ( ٨٣ تصاوير نماينده •

80 Key Frames

81 Motion Analysis

82 Activity function

83 Salient Stills

Page 29: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۲۹ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

هاي با ابعاد باال گذاري حجم عظيم داده انديس ٥

عمل جستجو . گردد داده ذخيره مي شود که در پايگاه داده تبديل به يک بردار ويژگي چند بعدي با طول ثابت مي هر تصوير در پايگاه

نتيجـه ايـن . پـذيرد وجـو انجـام مـي بردار ويژگي تصوير مورد پرس و داده با محاسبه شباهت بين بردارهاي ويژگي موجود در پايگاه

. باشد ) وجو به ترتيب ميزان شباهت با داده مورد پرس ( ها مقايسه بايد يک ترتيب مرتبي از عناصر داده

. باشد ها مي بحث کارايي آنها در مواجهه با حجم عظيم داده ، اي هاي چندرسانه هاي بازيابي داده ها در روش ترين بحث يکي از مهم

. ها مشکالت کمتري را ايجاد نمايد شود تا باال رفتن حجم داده گذاري کارا باعث مي هاي انديس روش

هاي هر مثال بردار ويژگي . د باش ها بخودي خود باال مي حجم هر کدام از داده يکي اينکه، : باشد در اينجا دو مشکل اصلي مطرح مي

اي بسيار شديد بوده و حجم آنها در حال هاي چندرسانه رشد داده و ديگري اينکه، . باشد مي ۲ ۱۰ تصوير در حالت معمولي از درجه

از توان ابعاد هر کدام مي در تالش براي حل مشکل اول، : براي حل اين دو مشکل دو راه حل هم وجود دارد . باشد ازدياد شديد مي

هاي توان از روش هاي موجود براي اينکار مي ترين روش از مهم . گذاري کاهش داد را قبل از انديس ) ها بردار ويژگي اندازه ( ها داده

و الگوريتم بروزرساني [CFKL 95] رهيافت تصاوير ويژه . نام برد [SM 83] ٨٥ بندي برداري و خوشه (PCA) ٨٤ هاي اصلي تحليل مولفه

توان از و براي حل مشکل دوم مي . کنند استفاده مي PCA هايي هستند که از از روش [CMW 97] (SVD) ٨٦ ن تجزيه مقدار تکي

گذاري هنوز بدون پاسخ مانده ترين و کاراترين ساختار انديس پيدا کردن مناسب . گذاري چندبعدي استفاده نمود هاي انديس تکنيک

: از اند عبارتند ها پيشنهاد شده گذاري چندبعدي داده س ترين ساختارهايي که براي اندي مهم . [FBFN 94] است

SS و درخت TV ، درخت *R ، R+ ، R هاي ، درخت hB درخت ، K­D­B درخت چهارتايي، درخت ، k­d ، درخت Bucketing الگوريتم

[RHC 99, BKSS 90, LJF 94, KJS 97] ، فت ديگري که رهيا . باشند اي مي که به دليل پيچيدگي داراي سربار اضافه قابل مالحظه

اساس ميزان شباهت و دستيابي سلسله بندي تصاوير بر اي نتايج بهتر از اين ساختارها را ازخود نشان داده است، خوشه تا اندازه

JKXB 98, AVCK] باشد مراتبي به آنها مي 98] .

اشاره [DWRJ 96, RNAS 96] توان به اند، مي ها براي بحث بازيابي تصوير پرداخته از مقاالت مفيدي که بررسي و مقايسه اين روش

RNAS] در . نمود ه اين سه مرحل . ت س ي تصاوير جهت بازيابي مطرح شده ا گذار س ي اي براي اند يک استراتژي سه مرحله [96

. سازي رهيافت انتخاب شده گذاري موجود و تغيير و بهينه هاي انديس ها، ارزيابي رهيافت کاهش ابعاد داده : از عبارتند

84 Principal Component Analysis

85 Column­wise clustering

86 Singular value Decomposition

Page 30: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۳۰ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

مراجع منابع و ٦

[1] [AHVH 98] P. Alshuth, T. Hermes, L. Voigt and O. Herzog, “On video retrieval: content analysis by

ImageMiner” in Storage and Retrieval for Image and Video Databases VI, Proc SPIE 3312, 236­247, 1998

[2] [AKJ 96] A.K. Jain, A. Vailaya, Image retrieval using color and shape, Pattern Recognition 29 (8)(1996) 1233­

1244.

[3] [AKJC 92] Amlan Kundu and Jia. Lin Chen. Texture classification using qmf bank­based subband

decomposition, CVGIP: Graphical Models and Image Processing, 54(5):369­384, September 1992.

[4] [ALJF 93] Andrew Laine and Jian Fan, Texture classification by wavelet packet signatures, IEEE Trans. Patt.

Recog. and Mach. Intell., 15(11):1186­1191, 1993.

[5] [AND 95] A. D. Narasimhalu, Special section on content­based retrieval, Multimedia Systems, 1995.

[6] [AOJH 97] OLIVA A., HERAULT J., “Real­world scene categorization by a self­organizing neural network”

Perception, supp 26, 1997.

[7] [APP 84] A. P. Pentland, Fractal­based description of natural scenes, IEEE Trans. Patt. Recog. and Mach. Intell.,

6(6):661­674, 1984.

[8] [ARWG 97] Ratan, A L and Grimson, W E L, “Training templates for scene classification using a few

examples” in Proceedings of IEEE Workshop on Content­Based Access of Image and Video Libraries , San

Juan, Puerto Rico, June 1997, 90­97, 1997.

[9] [AVCK 98] Vellaikal, A and Kuo, C C J, “Hierarchical clustering techniques for image database organization

and summarization” in Multimedia Storage and Archiving Systems III , Proc SPIE 3527, 68­79, 1998.

[10][AZP 96] P. Aigrain, H. Zhang, and D. Petkovic, "Content­based representation and retrieval of visual media – a

state­of­the­art review” Multimedia Tools and Applications 3(3), 179­202, 1996.

[11][BKSS 90] N. Beckmann, HP Kriegel, R. Schneider, and B. Seeger , “The R*­tree: an efficient and robust access

method for points and rectangles” ACM SIGMOD Record 19(2), 322­331, 1990.

[12][BLSM 95] Bingcheng Li and Song De Ma, On the relation between region and contour representation, In Proc.

IEEE Int. Conf. on Image Proc., 1995.

[13][BMWM 96] B.S. Manjunath, W.Y. Ma, Texture features for browsing and retrieval of large image data, IEEE

Trans. Pattern Anal. Mach. Intell. 18 (1996)837 ­842.

[14][BPS 96] Alberto Del Bimbo, Pietro Pala, Simone Santini , “Image retrieval by elastic matching of shapes and

image patterns” in Proceedings of Multimedia ‘96 , 215­218, 1996.

[15][BSHC 96] Bruce Schatz and Hsinchun Chen, Building large­scale digital libraries, Computer, 1996.

[16][BYY 98] RM Bolle, B.­L. Yeo, and MM Yeung, “Video query: research directions” IBM Journal of Research

and Development 42(2), 233­252, 1998.

Page 31: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۳۱ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

[CBGM 02] C. Carson, S. Belongie, H. Greenspan and J.Malik, “Blobworld: Image Segmentation Using

Expectation­Maximization and Its Application to Image Querying”, IEEE TRANSACTIONS ON PATTERN

ANALYSIS AND MACHINE INTELLIGENCE, VOL. 24, NO. 8, AUGUST 2002.

[17][CBV 98] JM Corridoni, A.Del Bimbo, E.Vicario , “Image retrieval by color semantics with incomplete

knowledge” Journal of the American Society for Information Science 49(3), 267­282, 1998.

[18][CCMS 97] S.­F. Chang, W. Chen, H.J. Meng, H. Sundaram, and D. Zhong, “VideoQ­An Automatic Content­

Based Video Search System Using Visual Cues,” ACM Multimedia 1997, Seattle, WA, November 1997 (Demo:

http://www.ctr.columbia.edu/videoq).

[CCYC 05] S. C. Chenga, T. C. Choub, C. L. Yanga and H. Y. Chang, “A semantic learning for content­based image

retrieval using analytical hierarchy process”, Expert Systems with Applications (Elsevier), No 28, pp 495–505, 2005.

[CC 06] T. C. Chou,S. C. Cheng, “Design and implementation of a semantic image classification and retrieval of

organizational memory information systems using analytical hierarchy process”, Omega (Elsevier), No. 34, pp 125 –

134, 2006.

[19][CEM 98] S.­F. Chang, A. Eleftheriadis, Robert McClintock, "Next­Generation Content Representation,

Creation and Searching for New Media Applications in Education," Proceedings of the IEEE, special issue on

Multimedia Signal Processing, Vol. 86, No. 5, pp.884­904, May 1998.

[20][CF 79] N. S. Chang and K. S. Fu, A relational database system for images. Technical report TR­EE 79­28,

Purdue University, May 1979.

[21][CF 80] N. S. Chang and K. S. Fu, Query by pictorial example. IEEE Trans. On software engineering, SE­6(6),

Nov. 1980.

[22][CF 81] NS Chang and KS Fu, “Picture query languages for pictorial data­base systems” IEEE Computer 14(11)

23­33, 1981

[23][CFKL 95] Christos Faloutsos and King­IP (David) Lin. Fastmap: A fast algorithm for indexing, data mining

and visualization of traditional and multimedia datasets. In Proc. of SIGMOD, pages 163­174, 1995.

[24][CHPS 99] Shih­Fu Chang, Qian Huang , Thomas Huang, Atul Puri, and Behzad Shahraray, Multimedia Search

and Retrieval, Book chapter, in Advances in Multimedia: Systems, Standards, and Networks, A. Puri and T.

Chen (eds.). New York: Marcel Dekker, 1999.

[25][CJ 83] G. C. Cross and A. K. Jain. Markov random field texture models. IEEE Trans. Patt. Recog. And Mach.

Intell., 5:25­39, 1983.

[26][CLLK 97] Y. Chans, Z. Lei, D. Lopresti and SY Kung, “A feature­based approach for image retrieval by

sketch” in Multimedia Storage and Archiving Systems II (Kuo, C C J et al, eds), Proc SPIE 3229, 220­231,

1997.

[27][CMW 97] S. Chandrasekaran, B. S. Manjunath, Y. F. Wang, J. Winkeler and H. Zhang, An eigenspace update

algorithm for image analysis, CVGIP: Graphical models and image processing journal, 1997.

Page 32: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۳۲ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

[28][CTO 97] Tat Seng Chua, Kian Lee Tan, and Beng Chin Ooi. Fast signature based color spatial image retrieval.

In Proc. IEEE Conf. on Multimedia Computing and systems, 1997.

[29][CVMC 2000] Colin C. Venters and Dr. Matthew Cooper, "A Review of Content­Based Image Retrieval

Systems", Manchester Visualization Centre, Manchester Computing, University of Manchester, JISC, March

2000.

[30][CWLW 98] E. Chang, J. Wang, C. Li, and G. Wilderhold , “RIME, a replicated image detector for the World­

Wide Web” in Multimedia Storage and Archiving Systems III (Kuo, C C J et al, eds), Proc SPIE 3527, 58­67 ,

1998.

[31][CYDA 88] Shi_Kuo Chang, C. W. Yan, Donald C. Dimitroff and Timothy Arndt. An intelligent image database

system. IEEE Trans. on Software Engineering, 14(5), May 1988.

[32][DWRJ 96] D. White and R. Jain, Similarity indexing Algorithms and performance, In Proc SPIE Storage and

Retrieval for Image and Video Databases, 1996.

[33][EACH 91] Esther M. Arkin, L. Chew, D. Huttenlocher, K. Kedem, and J. Mitchell. An efficiently computable

metric for comparing polygonal shapes. IEEE Trans. Patt. Recog. And Mach. Intell., 13(3), March 1991.

[34][FBFN 94] Christos Faloutsos, Ron Barber, Myron Flickner, Wayne Niblack, Dragutin Petkovic, and William

Equitz, “Efficient and effective querying by image content” Journal of Intelligent Information Systems 3, 231­

262, 1994.

[35][FFNP 93] C. Faloutsos, M. Flickner, W. Niblack, D. Petkovic, W. Equitz and R. Barber, Efficient and effective

querying by image content. Technical report, IBM Research Report, 1993.

[36][FLRP 96] F. Liu, R.W. Picard, Periodicity directionality and randomness: Wold features for image modelling

and retrieval, IEEE Trans. Pattern Anal. Mach. Intell. 18 (7)(1996) 722­733.

[37][FMFG 97] D. Forsyth, J. Malik, M. Fleck, H. Greenspan, T. Leung, S. Belongie, C. Carson, and C. Bregler,

“Finding pictures of objects in large collections of images” in Digital Image Access and Retrieval: 1996 Clinic

on Library Applications of Data Processing (Heidorn, P B and Sandore, B, eds), 118­139. Graduate School of

Library and Information Science, University of Illinois at Urbana­Champaign, 1997.

[38][FRPS 89] Rabbitti, F and Stanchev, P, “GRIM_DBMS: a graphical image database management system” in

Visual Database Systems (Kunii, T, ed), Elsevier, Amsterdam, 415­430, 1989.

[39][FSNA 95] Myron Flickner, Harpreet Sawhney, Wayne Niblack, Jonathan Ashley, Qian Huang, Byron Dom,

Monika Gorkani, Jim Hafner, Denis Lee, Dragutin Petkovic, David Steele, and Peter Yanker, “Query by Image

and Video Content: The QBIC System,” IEEE Computer Magazine, Sep. 1995, Vol.28, No.9, pp. 23­32.

[40][GCJK 96] Gene C. H. Chuang and C. C. Jay Kuo. Wavelet descriptor of planar curves Theory and applications.

IEEE Trans Image Proc. 5(1):56­70, January 1996.

[41][GKLD 94] M. H. Gross, R. Koch, L. Lippert and A. Dreger, Multiscale image texture analysis in wavelet

spaces, In Proc IEEE Int Conf on Image Proc., 1994.

Page 33: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۳۳ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

[42][GS 71] Salton, G, The SMART retrieval system – experiments in automatic document processing. Prentice­

Hall, New Jersey, 1971.

[43][HKKZ 95] T. Hermes C. Klauck J. Kreys and J. Zhang, “Image retrieval for information systems” in Storage

and Retrieval for Image and Video Databases III (Niblack, W R and Jain, R C, eds), Proc SPIE 2420, 394­405,

1995.

[44][HMV 97] Haering N., Myles Z., da Vitoria Lobo N., “Locating deciduous trees” in Proceedings of IEEE

Workshop on Content­Based Access of Image and Video Libraries , San Juan, Puerto Rico, June 1997, 18­25,

1997.

[45][HSD 73] Robert M. Haralick, K. Shanmugam and Its'hak Dinstein, Texture features for image classification,

IEEE Trans. on Sys. Man. and Cyb., SMC­3(6), 1973.

[46][HU 62] M. K. Hu, Visual pattern recognition by moment invariants, computer methods in image analysis. IRE

Transactions on Information Theory, 8, 1962.

[47][JEMG 99] John P Eakins and Margaret E Graham, "Content­based Image Retrieval; A report to the JISC

Technology Applications Programme", Institute for Image Data Research, University of North Umbria at

Newcastle, January 1999

[48][JFS 95] C. E. Jacobs, A. Finkelstein, and D. H. Salesin, “Fast multiresolution image querying,” ACM

SIGRAPH, pp. 277­286, August, 1995.

[49] [JKXB 98] Jin JS; Kurniawati R.; Xu G.; Bai X., “Using browsing to improve content­based image retrieval” in

Multimedia Storage and Archiving Systems III , Proc SPIE 3527, 101­109, 1998.

[50][JPE 96] Eakins, J P, “Automatic image content retrieval – are we getting anywhere?” Proceedings of Third

International Conference on Electronic Library and Visual Information Research (ELVIRA3) , De Montfort

University, Milton Keynes, pp 123­135, 1996.

[51][JPE 98] Eakins J P, “Techniques for image retrieval” Library and Information Briefings, in press, 1998.

[52][JSSC 94] John R. Smith and Shih­Fu Chang, Transform features for texture classification and discrimination in

large image databases, In Proc. IEEE Int. Conf. on Image Proc., 1994.

[53][JSSC 95­a] John R. Smith and Shih­Fu Chang, Single color extraction and image query, In Proc. IEEE Int.

Conf. on Image Proc., 1995.

[54][JSSC 95­b] John R. Smith and Shih­Fu Chang, Tools and techniques for color image retrieval, In IS & T/SPIE

proceedings Vol.2670 Storage & Retrieval for Image and Video Databases IV, 1995.

[55][JSSC 97­a] J.R. Smith, S.F. Chang, Querying by color regions using the VisualSEEk content­based visual query

system, in: M.T. Maybury (Ed.), Intelligent Multimedia Information Retrieval, AAAI Press, Menlo Park, CA,

1997, pp. 23­41.

[56][JSSC 97­b] Smith J R and Chang S F, “An image and video search engine for the World­Wide Web” in Storage

and Retrieval for Image and Video Databases V (Sethi, I K and Jain, R C, eds), Proc SPIE 3022, 84­95, 1997.

Page 34: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۳۴ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

[57] [KCBC 97] BB Kimia, J. Chan, D. Bertrand, S. Coe, Z. Roadhouse, and H. Tek, “A shock­based approach for

indexing of image databases using shape” in Multimedia Storage and Archiving Systems II (Kuo, C C J et al,

eds), Proc SPIE 3229, 288­302, 1997.

[58][KJS 97] R. Kurniawati, JS Jin, and JA Shepherd, “The SS+ tree: an improved index structure for similarity

searches in high­dimensional feature space” in Storage and Retrieval for Image and Video Databases V (Sethi, I

K and Jain, R C, eds), Proc SPIE 3022, 110­120, 1997.

[59][KLCK 98] K.C. Liang, C.C.J. Kuo, Implementation and performance evaluation of a progressive image

retrieval system, in: I.K. Sethi, R.C. Jain (Eds.), Storage and Retrieval for Image and Video Databases VI, Proc

SPIE 3312, 1998, 37­48.

[60][KLS 95] Deepak Kapur, Y. N. Lakshman and Tushar Saxena. Computing invariants using elimination methods,

In Proc IEEE Int. Conf. on Image Proc., 1995.

[61][LBNF 94] D. Lee, R. Barber, W. Niblack, M. Flickner, J. Hafner, and D. Petkovic, “Query by image content

using multiple objects and multiple features: user interface issues” in Proceedings of ICIP­94, International

Conference on Image Processing, Austin, Texas , 76­80, 1994.

[62][LJF 94] King­Ip Lin, HV Jagadish, Christos Faloutsos, “The TV­tree: an index structure for high dimensional

data” Journal of Very Large Databases 3(4), 517­549, 1994.

[63][LMN 98] Lance M. Kaplan, Romain Murenzi, Kameswara Rao Namuduri , “Fast texture database retrieval

using extended fractal features” in Storage and Retrieval for Image and Video Databases VI (Sethi, I K and Jain,

R C, eds), Proc SPIE 3312, 162­173, 1998.

[64][LOT 94] H Lu, B. Ooi, and K. Tan, Efficient image retrieval by color contents, In Proc. of the 1994 Int. Conf.

on Applications of Databases, 1994.

[65][LYFA 94] Luren Yang and Fritz Algregtsen, Fast computation of invariant geometric moments A new method

giving correct results, In Proc IEEE Int. Conf on Image Proc., 1994.

[66][MI 89] Mikihiro Ioka. A method of defining the similarity of images on the basis of color information,

Technical Report RT­0030, IBM Research, Tokyo Research Laboratory, November 1989.

[67][MKL 97] Babu M. Mehtre, M. Kankanhalli and Wing Foon Lee, Shape measures for content based image

retrieval: A comparison, Information Processing & Management, 33(3), 1997.

[68][MM 95] W. Y. Ma and B. S. Manjunath, A comparison of wavelet transform features for texture image

annotation. In Proc. IEEE Int. Conf. on Image Proc., 1995.

[69][MSAD 96] Markus Stricker and Alexander Dimai, Color indexing with weak spatial constraints, In Proc. SPIE

Storage and Retrieval for Image and Video Databases, 1996.

[70][MSDB 91] M.J. Swain, D.H. Ballard, Color indexing, Int. J. Comput.Vision 7 (1)(1991) 11­32.

[71][MSMO 95] Markus Stricker and Markus Orengo, Similarity of color images, In Proc SPIE Storage and

Retrieval for Image and Video Databases, 1995.

Page 35: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۳۵ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

[72][NB 94] W. Niblack, R. Barber and et al, The QBIC project Querying images by content using color, texture and

shape, In Proc SPIE Storage and Retrieval for Image and Video Databases, Feb 1994.

[73][PCA 92] Rosanne Price , Tat­seng Chua , Suliman Al­Hawamdeh, “Applying relevance feedback to a photo

archival system” Journal of Information Science 18(3), 203­215, 1992.

[74][PF 77] E. Persoon and K. S. Fu, Shape discrimination using Fourier descriptors, IEEE Trans. Sys. Man. Cyb.,

1977.

[75][PGBE 95] Enser P G B, “Pictorial information retrieval” Journal of Documentation , 51(2), 126­170, 1995.

[76][PORD 92] Philippe P. Ohanian and Richard C. Dubes, Performance evaluation for four classes of texture

features. Pattern Recognition, 25(8):819­833, 1992.

[77][PP 96] A. Pentland and R. Picard, Special issue on digital libraries, IEEE Trans. Patt. Recog. and Mach. Intell.,

1996.

[78][PPS 94] A. Pentland, R.W. Picard, and S. Sclaroff, “Photobook: Tools for Content­Based Manipulation of

Image Databases,” Proc. Storage and Retrieval for Image and Video Databases II, Vol. 2185, SPIE, Bellingham,

Wash., 1994, pp. 34­47.

[79][PPS 96] A. Pentland, R. W. Picard and S. Sclaroff, Photobook: Content­based manipulation of image databases.

International Journal of Computer Vision, 1996.

[80][PZM 96] Greg Pass, Ramin Zabih and Justin Miller, Comparing images using color coherence vectors, In Proc.

ACM Conf. on Multimedia, 1996.

[81][RC 96] J. R. and S.­F. Chang, “VisualSEEk: A Fully Automated Content­Based Image Query System,” ACM

Multimedia Conference, Boston, MA, Nov. 1996 (Demo http://www.ctr.columbia.edu/VisualSEEk).

[82][RHC 99] Y. Rui, T. Huang, and S. Chang. Image retrieval: current techniques, promising directions and open

issues. Journal of Visual Communication and Image Representation, 10(4):39­­62, 1999.

[83][RHM 97] Yong Rui, Thomas S. Huang, and Sharad Mehrotra, “Relevance feedback techniques in interactive

content­based image retrieval” in Storage and Retrieval for Image and Video Databases VI (Sethi, I K and Jain,

R C, eds), Proc SPIE 3312, 25­36, 1997.

[84][RMJG 95] Mehrotra, R and Gary, J E, “Similar­shape retrieval in shape data management” IEEE Computer

28(9), 57­62, 1995.

[85][RNAS 96] Raymond Ng and Andishe Sedighian, Evaluating multi­dimensional indexing structures for images

transformed by principal component analysis, In Proc. SPIE Storage and Retrieval for Image and Video

Databases, 1996.

[86][RSH 96] Yong Rui, Alfred C. She and Thomas S. Huang, Modified Fourier descriptors for shape representation

­ a practical approach, In Proc. of First International Workshop on Image Databases and Multimedia Search,

1996.

Page 36: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۳۶ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

[87][SCAH 92] Shi­Kuo Chang and Arding Hsu. Image information systems: Where do we go from here? IEEE

trans. On Knowledge and Data Engineering, 4(5), Oct. 1992.

[88][SKC 81] Shi­Kuo Chang. Pictorial database systems. IEEE Computer, Nov. 1981.

[89][SM 83] Gerard Salton and Michael J. McGill, Introduction to Modern Information Retrieval, McGraw­Hill

Book Company, 1983.

[90] [SRRM 98] Ravela, S and Manmatha, R, “Retrieving images by appearance” in Proceedings of IEEE

International Conference on Computer Vision (IICV98), Bombay, India , 608­613, 1998.

[91] [SSRJ 97] Santini, S and Jain, R C, “The graphical specification of similarity queries” Journal of Visual

Languages and Computing 7, 403­421, 1997.

[92][STL 97] Sclaroff S, Taycher L, Lacascia M., “ImageRover: a content­based image browser for the World­Wide

Web” in Proceedings of IEEE Workshop on Content­Based Access of Image and Video Libraries , San Juan,

Puerto Rico, June 1997, 2­9.

[93][TALMUD] J. V. Sanchez, J. G. Rodriguez, E. Boertjes, M. Kholer, D. Walshe, M. L. Demarie, G. L. Bello,

"Retrieval and Filtering methods and techniques", Talmud Project, PIR 2.3.

[94][TCJK 93] Tianhorng Chang and C. C. Jay Kuo. Texture analysis and classification with tree structured wavelet

Transform. IEEE Trans. Image Proc., 2(4):429­441, October 1993.

[95][TK 92] Kato T, “Database architecture for content­based image retrieval” in Image Storage and Retrieval

Systems (Jambardino, A A and Niblack, W R , eds), Proc SPIE 1662, 112­123, 1992.

[96][TM 96] Minka, T “An image database browser that learns from user interaction” MIT Media Laboratory

Technical Report #365, 1996.

[97][TMY 78] Hideyuki Tamura, Shunji Mori and Takashi Yamawaki, Texture features corresponding to visual

perception, IEEE Trans. on Sys. Man. and Cyb., SMC­8(6), 1978.

[98][TNP 94] K. S. Thyagarajan, Tom Nguyen and Charles Persons, A maximum likelihood approach to texture

classification using wavelet transform, In Proc IEEE Int. Conf. on Image Proc., 1994.

[99][TSKK 98] Tirthapura S., Sharvit D., Klein P. and Kimia B., “Indexing based on edit­distance matching of shape

graphs” in Multimedia Storage and Archiving Systems III (Kuo, C C J et al, eds), Proc SPIE 3527, 25­36, 1998.

[100] [TY 84] Hideyuki Tamura and Naokazu Yokoya, Image database systems: A survey, Pattern Recognition,

17(1), 1084.

[101] [VGVR 95] V.N. Gudivada, V.V. Raghavan, Design and evaluation of algorithms for image retrieval by

spatial similarity, ACM Trans. Inform. Systems 13 (2)(1995) 115­144.

[102] [WDR 76] Joan Weszka, Charles Dyer and Azeril Rosenfeld, A comparative study of texture measures for

terrain Classification, IEEE Trans. on Sys. Man. and Cyb., SMC­6(4), 1976.

[WLW 01] J. Z. Wang, J. Li and G. Wiederhold, “SIMPLIcity: Semantics­Sensitive Integrated Matching for Picture

Libraries”, IEEE Transaction on Pattern Analysis and Machine Intelligence, Vol 23, No 9, Sep 2001.

Page 37: 0ce.sharif.edu/courses/85-86/2/ce342/resources/root/... · EOS.MultimediaSearchEngine Enterprise ۶ 4 3 2 . - . /0/1 " ! " # $% & ' ( # ( ) * +, ©]a 1% AZ 44444444444444444444444444

EOS.MultimediaSearchEngine : سند کد فاز اول - باز افزارهاي متن بر پايه نرم Enterprise افزارهاي پروژه توسعه نرم

۳۷ . باشد مي ت ايران مركز تحقيقات مخابرا حق هرگونه استفاده مجدد از اين مستند منوط به اخذ مجوز كتبي از ©

[103] [WN 93] Niblack, W et al “The QBIC project: querying images by color, texture and shape” IBM Research

Report RJ­9203, 1993.

[104] [ZR 72] C. T. Zahn and R. Z. Roskies, Fourier descriptors for plane closed curves, IEEE Trans on

Computers, 1972.