Upload
khosravi82
View
2.982
Download
12
Embed Size (px)
DESCRIPTION
مروری بر کارهای انجام شده در داده های پيوندی
Citation preview
1389/2/261
دانشگاه اصفهاندانشکده فني و مهندسي
گروه کامپيوتر
3بررسی ساختار و چالشهای وب وب مبتنی بر داده های پيوندی
استاد راهنما:دکتر محمدعلی نعمت بخش
ارائه دهنده:هادي خسروي فارسانی
1389ارديبهشت
2
فهرست مطالب
بررسی وب سنتی و معرفی مشکالت آن•
Linkedمعرفی مفاهيم، اصول و خصوصيات کليدی داده های پيوندی )•Data)
بررسی روش انتشار داده در ساختار جديد•
معرفی تعدادی از ابزارهای مورد استفاده در اين تکنولوژی•
آينده داده های پيوندي•
سوال و پاسخ•
1389/2/26
3
(The Web of Documentوب سنتی )
مشابه •توزيع شدهسيستم فايل يک •
اشياء اوليه•اسناد•
لينک ها مابين • )به عنوان رابطه بخشی از(اسناد•
درجه ساختار در اشياء•بسيار پايين•
معناي محتوا و لينک ها•ضمنیبه صورت •
طراحی شده برای •انسانمصرف •
1389/2/26
4
وب سنتی ) وب مبتنی بر اسناد لينک داده شده(
1389/2/26
5
سيلوهای داده ای در وب•
1389/2/26
6
1389/2/26
سيلوهای داده ای در وب
7
چالشهای وب سنتی
سادگی•داده های با ساختار بسيار پايين، لينک های بدون نوع ، داده های جدا از •هم
يکپارچگی•تمام مقاالت چاپ شده از اساتيد دانشگاه اصفهان در کنفرانس داده کاوی •
را نشان بده
پرس و جوی وب•نام مقاله ای را که من با استادی از دانشگاه تهران چاپ کرده ام•
1389/2/26
8
وب مبتنی بر داده های پيوندی
نه تنها لينک مابين اسناد وجود دارد بلکه مابين موجوديت ها نيز لينک وجود دارد•
1389/2/26
9
وب مبتنی بر داده های پيوندی
مشابه•پايگاه داده توزيع شده يک •
طراحی شده •انسان در ابتدا و سپس برای ماشينبرای •
اشياء اوليه•و يا توصيفی از موجوديت هاموجوديت ها •
لينک مابين •موجوديت ها•
ميزان ساختار در موجوديت ها•بسيار باال•
معنای محتوا و لينک ها•مشخص است.صورت واضح به •
1389/2/26
10
تکنولوژی های مورد استفاده برای داده های پيوندی
URI
RDF
HTTP
(RDFS/OWL)
(FAOF, SKOS, etcتعدادی از انتولوژی های استاندارد )
SPARQL
1389/2/26
11
URI
روشی ساده برای شناسايي منابع در وب •
شماهای مختلفی می تواند استفاده شود••FTP،HTTP ، mailto :
ها از موجوديت هاي واقعی URIتعدادی •
•http://tomheath.com/id/me•http://eng.ui.ac.ir/~khosravi/hadi•http://dbpedia.org/resource/Talis_Group
1389/2/26
12
RDF (Resource Description Framework)
فرمت داده ای برای توصيف موجوديت ها و روابط مابين آنها•
•subject → predicate → object
•Hadi → LivesIn → Isfahan•hadi → WorksFor → ShaikhBahayi
•<uri> → <uri> → <uri> or "literal"
1389/2/26
13
Talis is Based Near Birmingham
<http://dbpedia.org/resource/Talis_Group><http://xmlns.com/foaf/0.1/based_near>
<http://sws.geonames.org/3333125/>
1389/2/26
14
RDF
Prefixesrc: <http://richard.cyganiak.de/foaf.rdf#>rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>foaf: <http://xmlns.com/foaf/0.1/>dbpedia: <http://dbpedia.org/resource/>dp: <http://dbpedia.org/property/>skos: <http://www.w3.org/2004/02/skos/core#>
1389/2/26
15
RDF
•
1389/2/26
16
SPARQL
استRDF زبان استانداردي براي پرس و جو بر روي آنتولوژي • استاندارد شده و بسيار انعطاف پذير و قدرتمند استw3cاين زبان توسط •
مثال: تمام کالسهايي که از کالس دوربين ديجيتال مشتق مي شوند را •. نشان دهيد
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?name WHERE { ?person foaf:name ?name . }
SELECT ?p ?o { <http://nasa.dataincubator.org/spacecraft/1968-089A> ?p ?o }
1389/2/26
17
SPARQL
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT * WHERE { ?person foaf:name ?name . ?person foaf:mbox ?email . }
PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?craft ?homepage { ?craft foaf:name "Apollo 7" . ?craft foaf:homepage ?homepage }
1389/2/26
18
SPARQL
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX type: <http://dbpedia.org/class/yago/> PREFIX prop: <http://dbpedia.org/property/>
SELECT ?country_name ?population WHERE { ?country a type:LandlockedCountries ; rdfs:label ?country_name ; prop:populationEstimate ?population . FILTER (?population > 15000000) . }
1389/2/26
19
FOAF: Friend of A Friend
برای توصيف افراد: RDF Vocabluary يک •نام، نام خانوادگی، و بقيه اطالعات درباره شخص•عالقه های آنها•دوستان شخص•شبکه های اجتماعی••FOAF Ontology
1389/2/26
20
SKOS: Simple Knowledge Organization System
RDF Vocabluary يک •
برای مدل کردن و به اشتراک گذاری سيستمهای اطالعاتی•
SKOS:relatedSKOS:BroaderSKOS:Collecion…
مشاهده استاندارد•
1389/2/26
21
تکنولوژی های مورد استفاده در داده های پيوندی
•
1389/2/26
22
(Linked Data Principlesاصول داده های پيوندی )
1389/2/26
23
The Web of Data
The Linking Open Data ProjectLOD Project
1389/2/26
24
LOD project
انجام شد W3Cپروژه ای است که با پشتيبانی •
شروع شد.2007در سال •
تبديل RDFمجموعه داده های موجود در وب را گرفته و آنها را به فرمت •کردند.
داده ها را با داده های ديگر لينک دادند•
1389/2/26
25
مشارکت کنندگان
• Massachusetts Institute ofTechnology (US)• University of Southampton (UK)• Freie Universitat Berlin (DE)• DERI (IE)• KMi, Open University (UK)• University of London (UK)• Universitat Hannover (DE)• University of Pennsylvania (US)• Universitat Leipzig (DE)• Universitat Karlsruhe (DE)• Joanneum (AT)• University of Toronto (CA)
1389/2/26
• BBC (UK)• Talis (UK)• Garlik (UK)• OpenLink (UK)• Thomson Reuters (US)• Zitgist (US)• Mondeca (FR)• Cyc Foundation (US)
26
•
1389/2/26
27
DBPediaفرايند ساخت
1389/2/26
مثال ديگر: شهر برلين•
28
DBPediaفرايند ساخت
1389/2/26
29
DBPediaفرايند دسترسی به
1389/2/26
Semantic Web browsers Disco Tabulator OpenLink Data Web Browser
Semantic Web crawlers SWSE Swoogle
Semantic Web query Semantic Web Client Library SemWeb client
30
Geonames
•
1389/2/26
31
May 2007در ماه
•
1389/2/26
32
July 2007در
•
1389/2/26
33
August 2007در
•
1389/2/26
34
November 2007در
•
1389/2/26
35
Feb 2008در
•
1389/2/26
36
Sep 2008در
•
1389/2/26
37
2009در سال
•
1389/2/26
38
LOD DataSet
•
1389/2/26
39
Linked Set in LOD
•
1389/2/26
40
مرحله اساسی برای انتشار داده های پيوندی5
(Linked Data Principles فهم اصول انتشار داده ها )1.
شناخت داده هايي که می بايست انتشار يابند2.
برای موجوديت ها در داده هاURI انتخاب 3.
ايجاد زيرساختار 4.
پيوند )لينک( با ديگر داده ها 5.
1389/2/26
41
1 .Linked Data Principles
Use URIs as names for things anything, not just documents you are not your homepage information resources and non-information resources
Use HTTP URIs globally unique names, distributed ownership allows people to look up those names
Provide useful information in RDF when someone looks up a URI
Include RDF links to other URIs to enable discovery of related information
1389/2/26
42
. فهم داده ها2
موجوديت های اساسي در داده ها را شناسايي کنيد•
افراد•مکانها•عکس ها•فيلم ها•کتابها•مفاهيم•نظرات•مرورها•موسيقی ••....
1389/2/26
43
. فهم داده ها2
از چه واژه نامه ای برای توصيف اين داده ها استفاده شود•اصل•
تا حد ممکن استفاده مجدد شود، در صورت نياز مجدد تعريف شود.•
آنتولوژي های ممکن که می توانند مورد استفاده قرار گيرند••Geo•FOAF•GoodRelations•Review•SIOC•SKOS•Dbpedia•RDFS•
1389/2/26
44
برای موجوديت های شناسايي URI. انتخاب 3
• http://dbpedia.org/resource/New_York_City ← Thing• http://dbpedia.org/data/New_York_City ← RDF data• http://dbpedia.org/page/New_York_City ← HTML page
• http://kmi.open.ac.uk/people/tom/ ← Thing• http://kmi.open.ac.uk/people/tom/rdf ← RDF data• http://kmi.open.ac.uk/people/tom/html ← HTML page
1389/2/26
45
. لينک به ديگر داده ها4 تعدادی ازpredicateهای معروف برای لينک دادن
owl:sameAs
foaf:homepage
foaf:topic
foaf:based_near
foaf:maker/foaf:made
foaf:depiction
foaf:primaryTopic
rdfs:seeAlso
1389/2/26
46
. لينک دادن به مجموعه داده های ديگر4
الگوريتم های لينک دهی•(String Matchingتطابق رشته ای )•
تطابق مبتنی بر کليد مشترک• UNSPSC و ISBNمثال •
تطابق مبتنی بر خصوصيات•اگر دو موجوديت دارای برچسب يکسان، نوع يکسان و ... يکسان •
باشند
1389/2/26
47
چرا داده های پيوندی انتشار يابند؟
سادگی يافتن•
سادگی مصرف•اشتراک داده به صورت استاندارد•
کاهش تکرار•
ارزش افزوده•
1389/2/26
48
مزايای داده های پيوندی
(Publishing Dataروش برای انتشار داده ها بر روی وب )•
استفاده مجدد را باال می برد•
تکرار را کاهش می دهد.•
سادگي مصرف، اشتراک داده به صورت استاندارد•
اتصاالت داخلی را افزايش می دهد.•
باعث افزايش ارزش برای داده ها می شود.•
1389/2/26
49 1389/2/26
Linked Data Applications
50
تعدادی از برنامه های که از داده های پيوندی استفاده می کنند
1389/2/26
51
تعدادی از ابزارهای توسعه يافته شده
مرورگرها••Marbles & DBPedia Mobile
جستجو•Falconsبا استفاده از •
•Mashup• Revyu ، BBC Music
1389/2/26
52
SPARQL و RDFa،GRDDLاليه اول :
•RDFa
1389/2/26
53
RDFaتوصيف يک مقاله با استفاده از
•
1389/2/26
54
RDFaبا استفاده از توصيف يک عکس
•
1389/2/26
55
RDFaتوصيف يک شخص در سند با استفاده از
•
1389/2/26
56
آينده داده های پيوندی
همه گير شدن استفاده از تکنولوژی نياز به زمان و شرايط محيطی دارد.•
داده های پيوندی در حوزه های دولتی و سازمانی اعمال خواهد 2010در سال •شد
ابزارها و کتابخانه های داده های پيوندی همه گير خواهد شد. 2011 در سال • در برنامه هايشان همچون يک پايگاه داده محلی استفاده LODبرنامه نويسان از
می کنند.
به وجود خواهد آمد. و مسايل LOD هزاران مجموعه داده 2012در سال • و مجموعه داده های پويا حل خواهد شد. Provananceمربوط به
•Special Issue of Web Semantic Journal Sep 2010
راه حلهای مبتنی بر داده های پيوندی به عنوان راه حلهايي 2013در سال •SOA.سازمانها خواهد شد
داده های پيوندی همچون يک درس ابتدايي خواهد شد. 2014در سال •بازی تمام شده است•1389/2/26معما چو حل گشت آسان شود.•
57
؟
1389/2/26
58/
با تشکر از حoسن توجه شما
1389/2/26
59
رتبه بندی در داده های پيوندی موتورهای جستجو در وب سنتی دارای بخشي برای رتبه بندی هستند
،هدف اصلي رتبه بندی اسناد است در وب ستنی
.در وب جديد، هدف اصلی رتبه بندی موجوديت ها است
هر چقدر لينک به يک موجوديت بيشتر شود احتماال آن موجوديت در بين موجوديت های مشابه خودش دارای اعتبار بيشتری است.
عالوه بر تعداد لينک به يک داده در اين ساختار، معيارهای ديگری نيز الزم است اين که يک داده چقدر اعتبار دارد، چفدر به روز است، منشا آن مدنظر قرار گيرند.
تواند در رتبه کجاست و مفاهيم ديگری که همگی مرتبط با کيفيت داده است میبندی مفاهيم مدنظر باشد.
1389/2/26
60 1389/2/26
موتور جستجوی مبتنی بر داده های پيوندی