44
Mardi 18 décembre 2007 1 Master Web Intelligence 2007/2008 Web Sémantique Philippe Beaune ENSM-SE mailto : [email protected]

Master Web Intelligence - emse.fr

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Mardi 18 décembre 2007 1

Master Web Intelligence 2007/2008

Web Sémantique

Philippe BeauneENSM­SE

mailto : [email protected]

Mardi 18 décembre 2007 2

Matrice de Nonaka & Tekeuchi

Mardi 18 décembre 2007 3

Ex de réseau sémantique ­ 1

● UMLS (Unified Medical Language System)● http://www.nlm.nih.gov

Mardi 18 décembre 2007 4

Ex de réseau sémantique ­ 2

Mardi 18 décembre 2007 5

Ex de réseau sémantique ­ 3

Mardi 18 décembre 2007 6

Ex de réseau sémantique ­ 4Wordnet (http://wordnet.princeton.edu/)

Mardi 18 décembre 2007 7

Ex de réseau sémantique ­ 5

Wordnet

Logiciel pourPC dispo

Mardi 18 décembre 2007 8

Web actuel

● http : comment transférer des données● URI : comment adresser les données● html : comment organiser les données 

pour une lecture humaine● Problème : retrouver des documents, 

extraire des infos pertinentes, combiner l'information de plusieurs documents

Mardi 18 décembre 2007 9

Web : solution

● Publier dans un langage traitable par les machines (pas de langage naturel)

● Poser des questions de façon interprétable par les machines

● Être sûr que toutes les machines comprendront les termes de la question

Mardi 18 décembre 2007 10

Web : inférences ...

● Publication :● B en­relation­avec A● C en­relation­avec A● D en­relation­avec C

● Question = ?x  en­relation­avec A● Réponse :

● ?x = B● ?x = C

Mardi 18 décembre 2007 11

Web : inférences (cont')

● Et si l'ontologie contient :● Si ?x en­relation­avec ?y● et ?y en­relation­avec ?z● alors ?x en­relation­avec ?z

● Réponse += :● ?x = D

Mardi 18 décembre 2007 12

Web sém. in organisations● Les entreprises externalisent leurs fonctions non essentielles. Elles 

se  concentrent  sur  leur  coeur  de  métier.  L'intégration  verticale disparaît  petit  à  petit  au  profit  de  réseaux.  Les  frontières  de l'entreprise sont de plus en plus floues.

● Autrefois  une  application  concernait  un  seul  secteur  de l'entreprise. Éventuellement il y avait des passerelles ad­hoc pour l'interopérabilité.

● Maintenant  il  faut  adapter  le  système  d'information  (notamment informatique) à  ces évolutions. Une solution est d'encapsuler des fonctions  métiers  pour  les  rendre  accessibles  aux  partenaires (internes  et  externes)  actuels  et  futurs  :  c'est  l'intégration  par composition de services.

● Problème : l'interopérabilité sémantique de tout ça.

Mardi 18 décembre 2007 13

Futur du Web ?

Hypertexte Web

Représentationdes connaissances

Web sémantique ?

Mardi 18 décembre 2007 14

Plan général provisoireprovisoire(6 séances)

● mardi 27 novembre am : repr. des connaissances● mardi 18 décembre am : DL & ontologies● mardi 8 janvier am : TP ontologies/Protégé

● lundi 21 janvier pm : le Web Sémantique ?● mercredi 23 janvier am : TP Web Sémantique ?● mardi 29 janvier am : TP Web Sémantique ? exam

Mardi 18 décembre 2007 15

Plan du cours● Logiques de description

● Notions de base, définitions● Raisonnement● Complexité● Implémentations● Applications

● Ontologies● Définitions, exemples● Représentations● Constructions● Utilisations

Mardi 18 décembre 2007 16

Origines● Dans les 70's, 2 tendances en représentation des 

connaissances :● À base de logique● Formalismes non­logiques spécifiques puis à 

vocation générale (réseaux, graphes, ..., réseaux sémantiques, frames, ...) : manque de précision sémantique (différents systèmes, différents comportements)

● Puis recherche d'une base logique pour une sémantique des frames et des réseaux sémantiques (d'abord FOL, puis fragments décidables de la FOL)

Mardi 18 décembre 2007 17

Logiques de description

● Aussi appelées : logiques terminologiques● Issues des travaux sur les réseaux 

sémantiques, les langages de frames, et la logique des prédicats

● Objectif : représenter formellement des connaissances en distinguant syntaxe et sémantique, et permettant un raisonnement sur une base terminologique

Mardi 18 décembre 2007 18

Logiques de description

● Famille de formalismes logiques, pour la représentation des connaissances, et le raisonnement

● Ensemble de constructeurs pour fabriquer des concepts et des rôles complexes, à partir d'atomes :● Concepts =  ensembles d'objets (d'individus)● Rôles = relations binaires sur les objets

Mardi 18 décembre 2007 19

DL : principes

● Concepts et rôles : description structurée à partir de constructeurs ; sémantique par interprétation

● Connaissances au niveau terminologique (concepts et rôles) mais aussi au niveau factuel

● Recherche de subsomption, satisfiabilité, équivalence, disjonction

● Opérations de classification et instanciation

Mardi 18 décembre 2007 20

DL : exemple [Horrocks]

Mardi 18 décembre 2007 21

DL system : architecture [Horrocks]

Mardi 18 décembre 2007 22

ABox & TBox, syntaxe et sémantique

● TBox : boite terminologique ; on y définit les concepts (classes) et les relations entre concepts (rôles) ; composante intentionnelle

● ABox : boite d'assertions ; donnée des individus (extension des concepts, objets) ; composante extensionnelle

● Classiquement : TBox détermine les assertions possibles de la ABox

Mardi 18 décembre 2007 23

DL : constructeurs

A est un concept atomique (ex. Human)  est le concept universel⊥  est le concept vide

● ¬A est la négation atomique de concept● C ⊓ D est l'intersection de concepts● ∀R.C est la quantification universelle de rôle● ∃R. est la quantification existentielle restreinte de 

rôleL'ensemble de ces 4 constructeurs définit le langage AL

Mardi 18 décembre 2007 24

DL : autres constructeurs

● C ⊔ D est l'union de concepts (U)● ∃R.C est la quantification existentielle complète (E)● ¬C est le complémentaire d'un concept (C)● ≥nR et  nR sont des restrictions numériques de rôles ≤ (N)● S ⊓ T est l'intersection de rôles (R)● R_ est le rôle inverse (I)● etc...Ça permet de définir AL[U][E][C][N][R][I] ...

Mardi 18 décembre 2007 25

DL : sémantique● L'interprétation d'un concept est la donnée d'un domaine 

ΔI et d'une fonction d'interprétation • I qui associe à tout concept un sous­ensemble de ΔI et à tout rôle un sous­ensemble de Δ I × Δ I  (et à tout individu 'a' un élément de ΔI  )

● I = ΔI  et ⊥ I = ∅  ● (C ⊓ D) I = C I ∩ D I  et (C ⊔ D) I = C I ∪ D I  ● (¬ A) I = ΔI \ A I  ● (∀R.C) I = {a ∈ ΔI / ∀b (a,b) ∈ R I  →  b ∈ C I } 

Mardi 18 décembre 2007 26

DL : sémantique (suite)

● (∃R.) I = {a ∈ ΔI / ∃b (a,b) ∈ R I } ● (∃R.C) I = {a ∈ ΔI / ∃b (a,b) ∈ R I ∧  b ∈ C I} ● (≥nR) I = {a ∈ ΔI / card{b / (a,b) ∈ R I } ≥ n}● Etc...● Une interprétation I est un modèle du concept C

si C I ≠ ∅ (C est cohérent)

Mardi 18 décembre 2007 27

équivalence

● C et D sont  équivalents (noté C ≡ D) ssi pour toute interprétation  :I  C I =  D I  

● Exemple : montrez l'équivalence entre ces 2 concepts :

● (∀hasChild.Female) ⊓ (∀hasChild.Student)● ∀hasChild.(Female ⊓ Student)

Mardi 18 décembre 2007 28

TBox : interprétation● La TBox est un ensemble d'axiomes décrivant la 

structure du domaine● Définitions de concepts : A ≗ C

Father ≗ Man ⊓ ∃has­child.Human

Human ≗ Mammal ⊓ ∀has­child­.Human● Inclusions (GCIs) : C ⊑ D

has­degree.Masters ⊑ has­degree.Bachelors● C ≗  D équivaut à (C ⊑ D et C ⊒ D)● Une interprétation I  satisfait :

A ≗  C ssi AI  = CI C ⊑ D ssi C I  ⊆  D I

Mardi 18 décembre 2007 29

DL : exemple [Euzenat]● Personne ⊑ ● Ensemble ⊑ ● Homme ⊑ Personne● Femme ⊑ Personne ⊓ (Ø Homme)● membre ⊑ toprole● chef ⊑ membre● Équipe ≗ Ensemble ⊓ (∀ membre.Personne) ⊓ (≥ 2 membre))● Petite­équipe ≗ Équipe ⊓ (≤ 5 membre)● Équipe­moderne ≗ Équipe ⊓ (≤ 4 membre) ⊓ (≥ 1 chef)

                                           ⊓ (∀ chef.Femme))

Mardi 18 décembre 2007 30

TBox : propriétés

● L'ensemble de définitions ne doit pas être équivoque : un nom symbolique est défini au plus une fois

● Distinction entre symboles de nom (en partie gauche de certains axiomes) et symboles de base (uniquement en partie droite d'axiomes)

● Attention aux cycles dans les axiomes :● Human ≡ Animal ⊓ ∀ hasParent.Human

Mardi 18 décembre 2007 31

ABox : interprétation

● La ABox est un ensemble d'axiomes décrivant une situation concrète

● Assertions de concept : a:C

 John : Man ⊓ ∀has­child.(Female ⊓ Happy)● Assertions de rôle : <a,b> : R

<John,Mary> : has­child● Une interprétation I  satisfait :

a:C   ssi   a I  ∈ C I <a,b> : R   ssi   <a I,b I> ∈ R I

Mardi 18 décembre 2007 32

KB : interprétation● Une interprétation I  satisfait une TBox T  ssi elle 

satisfait tout axiome de T  (I  |=T )

● Une interprétation I  satisfait une ABox A ssi elle satisfait tout axiome de A  (I  |= A )

● Une interprétation I  satisfait une KB ∑ = <T ,A > ssi elle satisfait à la fois T et A  (I  |= ∑ )

Mardi 18 décembre 2007 33

DL : raisonnement● Satisfiabilité : un concept C est satisfiable (ou 

cohérent) ssi il existe une interprétation I  / C I ≠Ø● Subsomption : C I ⊆  D I pour tout I  ?

et subsomption par rapport à une TBox● Équivalence : C I =  D I pour tout I  ?

et équivalence par rapport à une TBox● Incompatibilité : C I ∩  D I = ∅  pour tout I  ?

et incompatibilité par rapport une TBox

Mardi 18 décembre 2007 34

DL : raisonnement (suite)

● C est insatisfiable ssi C ⊑ ⊥ (ie C et ⊥ sont équivalents, ie C et  sont incompatibles)

● C ⊑ D ssi C ⊓ ¬ D est insatisfiable● C et D sont incompatibles ssi C ⊓ D est 

insatisfiable● Si la TBox est sans cycle alors on peut réduire 

les raisonnements selon cette TBox à des raisonnements selon une TBox vide

Mardi 18 décembre 2007 35

DL : complexité

● On montre que les procédures de décision sur la satisfiabilité suffisent ...

● Choix du langage dans la famille  ...L● Problèmes de décidabilité ...● Problèmes de complexités algorithmiques ...● Mise en correspondance des DLs avec des sous­

ensembles de la FOL ...● De même avec les logiques modales ...

Mardi 18 décembre 2007 36

Algorithmes pour tester la subsomption

● Algorithmes NC (normalisation­comparaison) :● Correction facile à vérifier● Complétude  difficile à montrer

● Méthodes des tableaux sémantiques :● Correction, complétude et complexité plus 

faciles● Décidabilité plus facile

Mardi 18 décembre 2007 37

Complexité du raisonnement etrichesse du langage [Napoli 97] ­ 1

● Le test de subsomption est correct, complet et de complexité polynomiale pour :● FL­ = {C ⊓ D , ∀R.C , ∃R}● FLN = {C ⊓ D , ∀R.C , ≥nR , ≤nR}

● Le test de subsomption devient de complexité exponentielle et les algos (polynomiaux) proposés sont incomplets dès que des constructeurs portant sur les rôles comme and ou restrict y sont ajoutés

Mardi 18 décembre 2007 38

Complexité du raisonnement etrichesse du langage [Napoli 97] ­ 2

● Le raisonnement terminologique est de complexité polynomiale pour des langages comme AL, ALN,  -FL , ou encore pour :● PL1 = { , ⊥ , ¬A , C ⊓ D , ∀R.C , ≥nR , ≤nR , R­1}● PL2 = {C ⊓ D , ∀R.C , ∃R , R1⊓R2 , R

­1 , R1oR2}● Faut­il avoir un langage plutôt pauvre et une procédure 

d'inférence correcte, complète et de complexité polynomiale; ou un langage plus riche et une procédure de complexité exponentielle et complète ; ou encore non complète ?

Mardi 18 décembre 2007 39

Exemple : algo NC pour FL­● FL­ : { C ⊓ D ,  ∀r.C ,  ∃r }● Normalisation : mise sous forme conjonctive● Comparaison : C = C1 ⊓ C2  ...     et D = D1 ⊓ D2  ... 

D⊑C ssi pour chaque Ci● Si Ci primitif alors il existe un Dj  tel que    Dj = Ci ou Dj ⊑ Ci● Si Ci = (∃r) alors il existe un Dj  tel que Dj = Ci● Si Ci = (∀r.X) alors il existe un Dj  tel que   Dj = (∀r.Y) avec Y ⊑ X

Mardi 18 décembre 2007 40

Exemple : algo NC pour FL­

● Homme ⊑ Personne● D ≗ Homme ⊓ ( ∃enfant) ⊓ 

       ( ∀ ami ( Docteur ⊓ ( ∃ spécialité)))● C ≗ Personne ⊓ (∀ ami Docteur)

● Montrez que D est subsumé par C

Mardi 18 décembre 2007 41

DL : implémentations

● KL­One, Krypton, ... LOOM, Flex, ...● Accès de base : Tell&Ask, spécifications KRSS● Classic, NeoClassic, ...● Accès distants (par CORBA par exemple)● Actuellement :

● Fact (optimisations, sans ABox) ● Racer (meilleures optimisations, SHIQ)● ...

Mardi 18 décembre 2007 42

DL : applications● Initialement : représentation de connaissances 

terminologiques● Donc construction et maintenance d'ontologies● Web Sémantique, DAML, OIL, OWL, ...● Configuration de systèmes complexes 

(télécom, ...)● Génie logiciel (documentation, groupes, ...)● Base de données (modèle conceptuel, intégration, 

...)● Médecine, Digital Libraries, NLP,  ...

Mardi 18 décembre 2007 43

DLs : pour aller plus loin● Un site de référence :

http://dl.kr.org● Des auteurs :

● Ian Horrocks (Univ. Of Manchester)● Ulrich Sattler (TU Dresden)● Amedeo Napoli (LORIA)● Jérôme Euzenat (INRIALPES), ....

● Un livre :● The Description Logic Handbook : Theory, 

Implementation and Applications, janvier 2003

Mardi 18 décembre 2007 44

Exercice

● Donnez une description des concepts suivants :

● Un homme, marié à un docteur, qui a au moins 5 enfants, et qui sont tous professeurs.

● Seuls les humains peuvent avoir des enfants humains.