Chương 3: Độ đo tương tự dựa trên ontology3.1. Khái niệm độ đo tương tự 3.2. Độ đo tương tự khái niệm dựa trên ontologyĐối với mục đích của đồ án là nghiên cứu độ tương tự giữa các khái niệm trong một ontology để phục vụ cho việc sánh các dịch vụ web ngữnghĩa, do đó mục tiêu đầu tiên là đo độ tương tự giữa các khái niệm trong cùng một ontology. Độ tương tự rõ ràng sẽ phụ thuộc vào thiết kế của ontology và nó dựa vào khái niệm rằng các cạnh trong một ontology thể hiện các khoảng cách giống nhau, nghĩa là tất cả các liên kết ngữ nghĩa là có trọng số như nhau.Trong [3] đã đưa ra một số phân tích về độ tương tự dựa trên cấu trúc phân loại, dựa trên nội dung thông tin và đo độ liên quan vector ngữ cảnh. Do ontology có cấu trúc phân cấp nên trong đồ án quan tâm đến phân tích độ tương tự dựa trên cấu trúc phân loại như [3] đã đề xuất với các độ đo cơ bản đã từng được đưa ra bởi Renisk, Wu và Palmer, Leacock và Chodorow... Có rất nhiều độ đo, và để chọn một độ đo tốt nhất cho việc cài đặt, đồ án sẽ xem xét cấu trúc phân cấp một ontology, và thống kê độ tương tự giữa hai khái niệm bất kì trong ontolog y đó sử dụng các độ đo đã nêu để so sánh. Ngoài ra [3] còn đưa ra một độ đo mới để tính toán độ tương tự ngữ nghĩa sau khi phân tích những ưu nhược điểm của các độ đo trên.Các độ đo đầu tiên khai thác cácmôhìnhhình họcđược cung cấp bởihệ thống phân cấpkhái niệm. Tri thức miềnđượcmô hìnhmột cách rõ ràngtrong mộtngôn ngữ máycó thể đọc đượcmà chính thức hóacác khái niệmmiềnbằngcáchsửdụngmộtthuật ngữphổ biếnvàđại diện chocác quan hệ phân loại vàkhông phân loạithông qua các liên kếtngữnghĩa.Trong trường hợp này, cơ sở để tính toángiống vớikhái niệmlàkhoảng cáchliênkết(inter-link distance). Độ đo tương tự như trực quan nhất của các khái niệm trong một ontology là khoảng cách của chúngtrong ontology đượcđịnh nghĩa là số lượng các quan hệkhái niệm cha/con (is-a) giữa chúng. Những đọ đonày sử dụng cấu trúc ontology phân cấp để xác định sự tương tựngữ nghĩa giữa các khái niệm. Cácontology có thể được thể hiệnbởicác câycó nút gốc, các nhãn và không theo thứ tựtrong khi các cạnh giữa các khái niệm thể hiện cho các quan hệ, khoảng cách giữa các khái niệm có thể được tính bằng cách đếm số lượng của các cạnh trên đường dẫnkết nối hai khái niệm. Việc tính toán khoảng cách ontology dựa trên đồ thị chuyên biệt của các khái niệm trong một ontology. Đồ thị đại diệncho một framework đa kế thừa không phải là một cây nhưnglàmột đồ thị có hướngkhông tuần hoàn. Trong một đồ thịnhư vậy,khoảng cách ontology thường được xác định là đườngdẫnngắn nhất đi qua một tổ tiên chung hoặc đườngdẫnngắn nhất chung, có khả năng kết nối hai khái niệm thông qua các con cháu chung. Theo mục đích của nghiên cứu này, chúng tôi quyết định triển khaiđặc tả dựa trên tổ tiên chung, dường như phản ánh tốt hơn sự hiểu biết cảm giác chung của sự gần gũi của hai đối tượng trong một phân loại.