Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
Mardi 18 décembre 2007 1
Master Web Intelligence 2007/2008
Web Sémantique
Philippe BeauneENSMSE
mailto : [email protected]
Mardi 18 décembre 2007 3
Ex de réseau sémantique 1
● UMLS (Unified Medical Language System)● http://www.nlm.nih.gov
Mardi 18 décembre 2007 8
Web actuel
● http : comment transférer des données● URI : comment adresser les données● html : comment organiser les données
pour une lecture humaine● Problème : retrouver des documents,
extraire des infos pertinentes, combiner l'information de plusieurs documents
Mardi 18 décembre 2007 9
Web : solution
● Publier dans un langage traitable par les machines (pas de langage naturel)
● Poser des questions de façon interprétable par les machines
● Être sûr que toutes les machines comprendront les termes de la question
Mardi 18 décembre 2007 10
Web : inférences ...
● Publication :● B enrelationavec A● C enrelationavec A● D enrelationavec C
● Question = ?x enrelationavec A● Réponse :
● ?x = B● ?x = C
Mardi 18 décembre 2007 11
Web : inférences (cont')
● Et si l'ontologie contient :● Si ?x enrelationavec ?y● et ?y enrelationavec ?z● alors ?x enrelationavec ?z
● Réponse += :● ?x = D
Mardi 18 décembre 2007 12
Web sém. in organisations● Les entreprises externalisent leurs fonctions non essentielles. Elles
se concentrent sur leur coeur de métier. L'intégration verticale disparaît petit à petit au profit de réseaux. Les frontières de l'entreprise sont de plus en plus floues.
● Autrefois une application concernait un seul secteur de l'entreprise. Éventuellement il y avait des passerelles adhoc pour l'interopérabilité.
● Maintenant il faut adapter le système d'information (notamment informatique) à ces évolutions. Une solution est d'encapsuler des fonctions métiers pour les rendre accessibles aux partenaires (internes et externes) actuels et futurs : c'est l'intégration par composition de services.
● Problème : l'interopérabilité sémantique de tout ça.
Mardi 18 décembre 2007 13
Futur du Web ?
Hypertexte Web
Représentationdes connaissances
Web sémantique ?
Mardi 18 décembre 2007 14
Plan général provisoireprovisoire(6 séances)
● mardi 27 novembre am : repr. des connaissances● mardi 18 décembre am : DL & ontologies● mardi 8 janvier am : TP ontologies/Protégé
● lundi 21 janvier pm : le Web Sémantique ?● mercredi 23 janvier am : TP Web Sémantique ?● mardi 29 janvier am : TP Web Sémantique ? exam
Mardi 18 décembre 2007 15
Plan du cours● Logiques de description
● Notions de base, définitions● Raisonnement● Complexité● Implémentations● Applications
● Ontologies● Définitions, exemples● Représentations● Constructions● Utilisations
Mardi 18 décembre 2007 16
Origines● Dans les 70's, 2 tendances en représentation des
connaissances :● À base de logique● Formalismes nonlogiques spécifiques puis à
vocation générale (réseaux, graphes, ..., réseaux sémantiques, frames, ...) : manque de précision sémantique (différents systèmes, différents comportements)
● Puis recherche d'une base logique pour une sémantique des frames et des réseaux sémantiques (d'abord FOL, puis fragments décidables de la FOL)
Mardi 18 décembre 2007 17
Logiques de description
● Aussi appelées : logiques terminologiques● Issues des travaux sur les réseaux
sémantiques, les langages de frames, et la logique des prédicats
● Objectif : représenter formellement des connaissances en distinguant syntaxe et sémantique, et permettant un raisonnement sur une base terminologique
Mardi 18 décembre 2007 18
Logiques de description
● Famille de formalismes logiques, pour la représentation des connaissances, et le raisonnement
● Ensemble de constructeurs pour fabriquer des concepts et des rôles complexes, à partir d'atomes :● Concepts = ensembles d'objets (d'individus)● Rôles = relations binaires sur les objets
Mardi 18 décembre 2007 19
DL : principes
● Concepts et rôles : description structurée à partir de constructeurs ; sémantique par interprétation
● Connaissances au niveau terminologique (concepts et rôles) mais aussi au niveau factuel
● Recherche de subsomption, satisfiabilité, équivalence, disjonction
● Opérations de classification et instanciation
Mardi 18 décembre 2007 22
ABox & TBox, syntaxe et sémantique
● TBox : boite terminologique ; on y définit les concepts (classes) et les relations entre concepts (rôles) ; composante intentionnelle
● ABox : boite d'assertions ; donnée des individus (extension des concepts, objets) ; composante extensionnelle
● Classiquement : TBox détermine les assertions possibles de la ABox
Mardi 18 décembre 2007 23
DL : constructeurs
A est un concept atomique (ex. Human) est le concept universel⊥ est le concept vide
● ¬A est la négation atomique de concept● C ⊓ D est l'intersection de concepts● ∀R.C est la quantification universelle de rôle● ∃R. est la quantification existentielle restreinte de
rôleL'ensemble de ces 4 constructeurs définit le langage AL
Mardi 18 décembre 2007 24
DL : autres constructeurs
● C ⊔ D est l'union de concepts (U)● ∃R.C est la quantification existentielle complète (E)● ¬C est le complémentaire d'un concept (C)● ≥nR et nR sont des restrictions numériques de rôles ≤ (N)● S ⊓ T est l'intersection de rôles (R)● R_ est le rôle inverse (I)● etc...Ça permet de définir AL[U][E][C][N][R][I] ...
Mardi 18 décembre 2007 25
DL : sémantique● L'interprétation d'un concept est la donnée d'un domaine
ΔI et d'une fonction d'interprétation • I qui associe à tout concept un sousensemble de ΔI et à tout rôle un sousensemble de Δ I × Δ I (et à tout individu 'a' un élément de ΔI )
● I = ΔI et ⊥ I = ∅ ● (C ⊓ D) I = C I ∩ D I et (C ⊔ D) I = C I ∪ D I ● (¬ A) I = ΔI \ A I ● (∀R.C) I = {a ∈ ΔI / ∀b (a,b) ∈ R I → b ∈ C I }
Mardi 18 décembre 2007 26
DL : sémantique (suite)
● (∃R.) I = {a ∈ ΔI / ∃b (a,b) ∈ R I } ● (∃R.C) I = {a ∈ ΔI / ∃b (a,b) ∈ R I ∧ b ∈ C I} ● (≥nR) I = {a ∈ ΔI / card{b / (a,b) ∈ R I } ≥ n}● Etc...● Une interprétation I est un modèle du concept C
si C I ≠ ∅ (C est cohérent)
Mardi 18 décembre 2007 27
équivalence
● C et D sont équivalents (noté C ≡ D) ssi pour toute interprétation :I C I = D I
● Exemple : montrez l'équivalence entre ces 2 concepts :
● (∀hasChild.Female) ⊓ (∀hasChild.Student)● ∀hasChild.(Female ⊓ Student)
Mardi 18 décembre 2007 28
TBox : interprétation● La TBox est un ensemble d'axiomes décrivant la
structure du domaine● Définitions de concepts : A ≗ C
Father ≗ Man ⊓ ∃haschild.Human
Human ≗ Mammal ⊓ ∀haschild.Human● Inclusions (GCIs) : C ⊑ D
hasdegree.Masters ⊑ hasdegree.Bachelors● C ≗ D équivaut à (C ⊑ D et C ⊒ D)● Une interprétation I satisfait :
A ≗ C ssi AI = CI C ⊑ D ssi C I ⊆ D I
Mardi 18 décembre 2007 29
DL : exemple [Euzenat]● Personne ⊑ ● Ensemble ⊑ ● Homme ⊑ Personne● Femme ⊑ Personne ⊓ (Ø Homme)● membre ⊑ toprole● chef ⊑ membre● Équipe ≗ Ensemble ⊓ (∀ membre.Personne) ⊓ (≥ 2 membre))● Petiteéquipe ≗ Équipe ⊓ (≤ 5 membre)● Équipemoderne ≗ Équipe ⊓ (≤ 4 membre) ⊓ (≥ 1 chef)
⊓ (∀ chef.Femme))
Mardi 18 décembre 2007 30
TBox : propriétés
● L'ensemble de définitions ne doit pas être équivoque : un nom symbolique est défini au plus une fois
● Distinction entre symboles de nom (en partie gauche de certains axiomes) et symboles de base (uniquement en partie droite d'axiomes)
● Attention aux cycles dans les axiomes :● Human ≡ Animal ⊓ ∀ hasParent.Human
Mardi 18 décembre 2007 31
ABox : interprétation
● La ABox est un ensemble d'axiomes décrivant une situation concrète
● Assertions de concept : a:C
John : Man ⊓ ∀haschild.(Female ⊓ Happy)● Assertions de rôle : <a,b> : R
<John,Mary> : haschild● Une interprétation I satisfait :
a:C ssi a I ∈ C I <a,b> : R ssi <a I,b I> ∈ R I
Mardi 18 décembre 2007 32
KB : interprétation● Une interprétation I satisfait une TBox T ssi elle
satisfait tout axiome de T (I |=T )
● Une interprétation I satisfait une ABox A ssi elle satisfait tout axiome de A (I |= A )
● Une interprétation I satisfait une KB ∑ = <T ,A > ssi elle satisfait à la fois T et A (I |= ∑ )
Mardi 18 décembre 2007 33
DL : raisonnement● Satisfiabilité : un concept C est satisfiable (ou
cohérent) ssi il existe une interprétation I / C I ≠Ø● Subsomption : C I ⊆ D I pour tout I ?
et subsomption par rapport à une TBox● Équivalence : C I = D I pour tout I ?
et équivalence par rapport à une TBox● Incompatibilité : C I ∩ D I = ∅ pour tout I ?
et incompatibilité par rapport une TBox
Mardi 18 décembre 2007 34
DL : raisonnement (suite)
● C est insatisfiable ssi C ⊑ ⊥ (ie C et ⊥ sont équivalents, ie C et sont incompatibles)
● C ⊑ D ssi C ⊓ ¬ D est insatisfiable● C et D sont incompatibles ssi C ⊓ D est
insatisfiable● Si la TBox est sans cycle alors on peut réduire
les raisonnements selon cette TBox à des raisonnements selon une TBox vide
Mardi 18 décembre 2007 35
DL : complexité
● On montre que les procédures de décision sur la satisfiabilité suffisent ...
● Choix du langage dans la famille ...L● Problèmes de décidabilité ...● Problèmes de complexités algorithmiques ...● Mise en correspondance des DLs avec des sous
ensembles de la FOL ...● De même avec les logiques modales ...
Mardi 18 décembre 2007 36
Algorithmes pour tester la subsomption
● Algorithmes NC (normalisationcomparaison) :● Correction facile à vérifier● Complétude difficile à montrer
● Méthodes des tableaux sémantiques :● Correction, complétude et complexité plus
faciles● Décidabilité plus facile
Mardi 18 décembre 2007 37
Complexité du raisonnement etrichesse du langage [Napoli 97] 1
● Le test de subsomption est correct, complet et de complexité polynomiale pour :● FL = {C ⊓ D , ∀R.C , ∃R}● FLN = {C ⊓ D , ∀R.C , ≥nR , ≤nR}
● Le test de subsomption devient de complexité exponentielle et les algos (polynomiaux) proposés sont incomplets dès que des constructeurs portant sur les rôles comme and ou restrict y sont ajoutés
Mardi 18 décembre 2007 38
Complexité du raisonnement etrichesse du langage [Napoli 97] 2
● Le raisonnement terminologique est de complexité polynomiale pour des langages comme AL, ALN, -FL , ou encore pour :● PL1 = { , ⊥ , ¬A , C ⊓ D , ∀R.C , ≥nR , ≤nR , R1}● PL2 = {C ⊓ D , ∀R.C , ∃R , R1⊓R2 , R
1 , R1oR2}● Fautil avoir un langage plutôt pauvre et une procédure
d'inférence correcte, complète et de complexité polynomiale; ou un langage plus riche et une procédure de complexité exponentielle et complète ; ou encore non complète ?
Mardi 18 décembre 2007 39
Exemple : algo NC pour FL● FL : { C ⊓ D , ∀r.C , ∃r }● Normalisation : mise sous forme conjonctive● Comparaison : C = C1 ⊓ C2 ... et D = D1 ⊓ D2 ...
D⊑C ssi pour chaque Ci● Si Ci primitif alors il existe un Dj tel que Dj = Ci ou Dj ⊑ Ci● Si Ci = (∃r) alors il existe un Dj tel que Dj = Ci● Si Ci = (∀r.X) alors il existe un Dj tel que Dj = (∀r.Y) avec Y ⊑ X
Mardi 18 décembre 2007 40
Exemple : algo NC pour FL
● Homme ⊑ Personne● D ≗ Homme ⊓ ( ∃enfant) ⊓
( ∀ ami ( Docteur ⊓ ( ∃ spécialité)))● C ≗ Personne ⊓ (∀ ami Docteur)
● Montrez que D est subsumé par C
Mardi 18 décembre 2007 41
DL : implémentations
● KLOne, Krypton, ... LOOM, Flex, ...● Accès de base : Tell&Ask, spécifications KRSS● Classic, NeoClassic, ...● Accès distants (par CORBA par exemple)● Actuellement :
● Fact (optimisations, sans ABox) ● Racer (meilleures optimisations, SHIQ)● ...
Mardi 18 décembre 2007 42
DL : applications● Initialement : représentation de connaissances
terminologiques● Donc construction et maintenance d'ontologies● Web Sémantique, DAML, OIL, OWL, ...● Configuration de systèmes complexes
(télécom, ...)● Génie logiciel (documentation, groupes, ...)● Base de données (modèle conceptuel, intégration,
...)● Médecine, Digital Libraries, NLP, ...
Mardi 18 décembre 2007 43
DLs : pour aller plus loin● Un site de référence :
http://dl.kr.org● Des auteurs :
● Ian Horrocks (Univ. Of Manchester)● Ulrich Sattler (TU Dresden)● Amedeo Napoli (LORIA)● Jérôme Euzenat (INRIALPES), ....
● Un livre :● The Description Logic Handbook : Theory,
Implementation and Applications, janvier 2003