28
recap http://www.centrefordigitalhumanities.nl/files/2014/06/CrashCourseBiographyNet.pdf

recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

recap

http://www.centrefordigitalhumanities.nl/files/2014/06/CrashCourseBiographyNet.pdf

Page 2: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

?מה רוצים

איזה , dataאיזה כלים נדרשים לו כדי לעבוד על נתונים : מהצד של מדעי הרוח?dataאיך נראה ה ? שאלות יכולות להשאל

כיצד ניתן לנתח טקסטים באופן שיפיק את המידע : בלשנות חישוביתמדויק /מקיף/רלוונטי/הנכון

תצוגה של הנתונים באופן שמאפשרת לחוקרת לנתח ממצאים אבל : מדעי המחשבלא לצמצם את צורת המחשבה שלה

תיוג

סיווג

ייצוג

Page 3: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

נושאים עליהם דיברנו

(שפה-צורה, תוכן)רמות שונות של תיוג , הצורך בתיוג

(שפה-צורה, תוכן)סיווג

תיוג חלקי דיבר ולימוד מכונה

(topic modeling)ייצוג של תוכן , (ייצוג מסמכים, ידע עולם, ידע לקסיקלי)ייצוג של ידע

חיפוש

Page 4: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

dataשלבים בהכנת ה

..(סריקה, "הורדה", איתור מקורות)איסוף המידע -

זיהוי ותיוג הרכיבים במידע- parseניתוח -

(לפי קריטריון)הסרה או שליפה של מידע –סינון -

..הסתברויות, מציאת תבניות–" כריה"-

ייצוג ויזואלי -

עידון התצוגה, עידון הנתונים-

(הערות, בקרה, הוספה, שינוי)כלים לאינטראקציה -

Page 5: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

חמשת הכללים–data/ נתונים

פתוח ונגיש לכולם•

; structuredמובנה •

פורמט שאינו מחויב לתוכנה•

URIשימוש ב •

•Linked RDF

•http://data.dws.informatik.uni-mannheim.de/lodcloud/2014/

•http://inkdroid.org/lod-graph/

Page 6: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

data/ נתונים

ארכיון הקשרים: דוגמא•

?מה הבעיות•

עיתונות דיגיטלית היסטורית, פרויקט הספריה הלאומית של האפמרה: דוגמא•

?מה הבעיות•

Page 7: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

הנחת העולם הפתוח The open world assumption

.לא קיים, אם לא נמצא–בבסיסי נתונים

Linked data-ניתן להוסיף או ניתן להקיש, המידע תמיד חלקי.

Page 8: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

תכנון סכמה חדשה

שימוש במה שקיים•

התאמה למידע של אחרים•

מבנה לוגי•

•Self explained (as much as possible)

(לאורך זמן)יציבות והתקיימות •

מאפשר קישור וחיבור של משאבים•

Page 9: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס
Page 10: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס
Page 11: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

named entity recognitionזיהוי שמות פרטיים

'שונות'מוסדות ו, מקומות, זיהוי שמות אנשים

Page 12: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס
Page 13: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס
Page 14: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס
Page 15: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

איך עושים סגמנטציה

Page 16: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס
Page 17: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס
Page 18: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס
Page 19: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס
Page 20: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

http://nlp.stanford.edu/software/CRF-NER.shtml

Page 21: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס
Page 22: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

עברית

http://www.cs.bgu.ac.il/~nlpproj/demo

Page 23: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

זיהוי תאריכים

זיהוי ביטויי זמן •

( 7/5/2014== 5.7.2014== 2014ביולי 5)' נירמול'•

תאריכים עבריים •

Page 24: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

Word sense disambiguation

Page 25: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

Semantic role labeling

Page 26: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס
Page 27: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס
Page 28: recap - BGU · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות( גוית לש תונוש תומר גויתב ךרוצה)הפש הרוצ ןכות( גוויס

http://sappingattention.blogspot.co.il/2012/11/reading-digital-sources-case-study-in.html

http://sappingattention.blogspot.de/2012/11/when-you-have-mallet-everything-looks.html