Ontologas Sesin 15 Eduardo Morales / L. Enrique Sucar Sesin 15
Eduardo Morales / L. Enrique Sucar
Diapositiva 2
El conocimiento se puede ver como informacin acerca de
informacin. Bsicamente es informacin semnticamente rica.
Introduccin
Diapositiva 3
Un conjunto de conocimiento formalmente representado se basa en
una conceptualizacin: los objetos y otras entidades que se asumen
existir en un rea de inters y las relaciones entre ellas. Un
conjunto de conocimiento formalmente representado se basa en una
conceptualizacin: los objetos y otras entidades que se asumen
existir en un rea de inters y las relaciones entre ellas.
Diapositiva 4
Una conceptualizacin es un vista abstracta, simplificada del
mundo que queremos representar con un propsito. Cada base de
conocimiento, sistema basado en conocimiento o agente a nivel de
conocimiento est sujeto, explcita o implcitamente, a una
conceptualizacin. Cada base de conocimiento, sistema basado en
conocimiento o agente a nivel de conocimiento est sujeto, explcita
o implcitamente, a una conceptualizacin.
Diapositiva 5
Una ontologa es una especificacin explcita de una (o una parte
de una) conceptualizacin. Una ontologa es una especificacin
explcita de una (o una parte de una) conceptualizacin.
Diapositiva 6
Lo que incluye es un vocabulario de trminos y especificacin de
su sentido. El grado de formalidad de esta especificacin va desde:
muy informal, semi-informal, semi-formal, rigurosamente formal. Lo
que incluye es un vocabulario de trminos y especificacin de su
sentido. El grado de formalidad de esta especificacin va desde: muy
informal, semi-informal, semi-formal, rigurosamente formal.
Diapositiva 7
Conceptualizaciones compartidas incluyen ambientes para modelar
conocimiento del dominio; protocolos de comunicacin de contenidos
especficos para agentes inter-operativos; y acuerdos acerca de la
representacin de teoras de dominios particulares. Ontologas son
acuerdos acerca de conceptualizaciones compartidas.
Diapositiva 8
El trmino es tomando de filosofa, donde Ontologa se refiere a
Existencia. Para IA, lo que existe es aquello que puede ser
representado. El trmino es tomando de filosofa, donde Ontologa se
refiere a Existencia. Para IA, lo que existe es aquello que puede
ser representado. Un agente se asocia a una ontologa. Esto
garantiza consistencia, pero no complets.
Diapositiva 9
Diapositiva 10
Diapositiva 11
La creciente automatizacin de procesos en general ha provocado
una proliferacin de sistemas de informacin con semnticas que se
traslapan. La creciente automatizacin de procesos en general ha
provocado una proliferacin de sistemas de informacin con semnticas
que se traslapan. Motivacin Por otro lado existe la necesidad de
reutilizacin de conocimiento, para eficientar esta
automatizacin.
Diapositiva 12
Los desarrollos de sistemas basados en conocimiento y de
software en general, normalmente se hacen en diferentes contextos,
puntos de vista y suposiciones acerca de su materia de estudio.
Cada uno usa su propio vocablo, pueden tener diferentes conceptos
que a veces se traslapan y diferentes mtodos y estructuras.
Diapositiva 13
La inter-operabilidad El potencial de reutilizar y compartir
informacin La inter-operabilidad El potencial de reutilizar y
compartir informacin Esto ha provocado problemas de comunicacin por
falta de entendimiento compartido. Esto limita:
Diapositiva 14
Cmo resolverlo: Teniendo un entendimiento compartido que
unifique los diferentes puntos de vista y que sirva para: Cmo
resolverlo: Teniendo un entendimiento compartido que unifique los
diferentes puntos de vista y que sirva para: (i) Propsitos de
comunicacin, (ii) Inter-operabilidad entre sistemas, (iii)
Re-utilizacin, (iv) Confiabilidad, (v) Especificacin (i) Propsitos
de comunicacin, (ii) Inter-operabilidad entre sistemas, (iii)
Re-utilizacin, (iv) Confiabilidad, (v) Especificacin
Diapositiva 15
Comunicacin
Diapositiva 16
Una posibilidad es tener un modelo de conocimiento, haciendo
una analoga con un modelo de datos. Un modelo de datos describe la
estructura lgica de los datos y su aplicacin. Uno de los trabajos
seminales fue el del modelo de entidad-relacin. Una posibilidad es
tener un modelo de conocimiento, haciendo una analoga con un modelo
de datos. Un modelo de datos describe la estructura lgica de los
datos y su aplicacin. Uno de los trabajos seminales fue el del
modelo de entidad-relacin.
Diapositiva 17
El modelo es una descripcin esquemtica de las instancias del
modelo. Estas instancias, representan los datos que son usados por
la aplicacin. Se han hecho muchas extensiones al modelo
entidad-relacin para tratar de capturar el significado de los datos
(la parte semntica). Una extensin comn es usar jerarquas de
clases-subclases. El modelo es una descripcin esquemtica de las
instancias del modelo. Estas instancias, representan los datos que
son usados por la aplicacin. Se han hecho muchas extensiones al
modelo entidad-relacin para tratar de capturar el significado de
los datos (la parte semntica). Una extensin comn es usar jerarquas
de clases-subclases.
Diapositiva 18
El modelo de datos toma un solo punto de vista del mundo.
Describe los objetos o instancias de inters, pero bajo una sola
posible interpretacin. El modelo de datos toma un solo punto de
vista del mundo. Describe los objetos o instancias de inters, pero
bajo una sola posible interpretacin. Algunas de sus limitaciones
son: Si uno quiere re-utilizar algn trmino, se hace evidente que el
trmino puede tener diferentes interpretaciones dependientes del
contexto.
Diapositiva 19
La reutilizacin de conocimiento complejo es imposible sin tomar
en cuenta los diferentes puntos de vista. Esto es, los puntos de
vista no aaden informacin, por lo que la visin global es limitada.
Algo de esto existe en bases de datos, pero toda la informacin
tiene que estar presente.
Diapositiva 20
Puntos de Vista
Diapositiva 21
Por otro lado, existen desarrollos en modelo de datos
orientados a objetos. Sin embargo, siguen siendo pobres en su
representacin de relaciones entre objetos. La jerarqua y herencia
basada en la relacin IS-A es slo una de las posibles relaciones que
pueden existir. Por otro lado, existen desarrollos en modelo de
datos orientados a objetos. Sin embargo, siguen siendo pobres en su
representacin de relaciones entre objetos. La jerarqua y herencia
basada en la relacin IS-A es slo una de las posibles relaciones que
pueden existir.
Diapositiva 22
Una posible solucin es hacer accesible la semntica de la
informacin almacenada: Qu contiene?, Qu propiedades? y Cmo puede
usarse? Qu contiene?, Qu propiedades? y Cmo puede usarse? Si algn
agente entiende la ontologa puede usar la informacin.
Diapositiva 23
Las ontologas en s mismas tambin puede ser reutilizadas. As
como existe una frontera difusa entre conocimiento e informacin,
existe una frontera difusa entre ontologas y modelos de datos. Las
ontologas en s mismas tambin puede ser reutilizadas. As como existe
una frontera difusa entre conocimiento e informacin, existe una
frontera difusa entre ontologas y modelos de datos. Finalmente, una
ontologa se puede ver como un modelo de datos de conocimiento.
Diapositiva 24
La representacin de objetos del mundo real siempre depende del
contexto en el que los objetos son usados. Este contexto puede
verse como un punto de vista tomado del objeto. Es generalmente
imposible enumerar de antemano todos los posibles puntos de vista
tiles de (o clases de) objetos. La representacin de objetos del
mundo real siempre depende del contexto en el que los objetos son
usados. Este contexto puede verse como un punto de vista tomado del
objeto. Es generalmente imposible enumerar de antemano todos los
posibles puntos de vista tiles de (o clases de) objetos. Principio
1 :
Diapositiva 25
La reutilizacin de algn pedazo de conocimiento requiere de una
descripcin explcita de los puntos de vista que estn inherentemente
presentes en el conocimiento. De otra forma, no hay forma de saber
si el pedazo de conocimiento es aplicable a una nueva aplicacin y
porqu. La reutilizacin de algn pedazo de conocimiento requiere de
una descripcin explcita de los puntos de vista que estn
inherentemente presentes en el conocimiento. De otra forma, no hay
forma de saber si el pedazo de conocimiento es aplicable a una
nueva aplicacin y porqu. Principio 2 :
Diapositiva 26
El propsito de una ontologa es hacer explcito algn punto de
vista. A veces necesitamos combinar dos o ms ontologas. Algunas de
las caractersticas tpicas de las ontologas son: Pueden existir
ontologas mltiples: Cada ontologa introduce conceptualizaciones
especficas. Cada ontologa introduce conceptualizaciones
especficas.
Diapositiva 27
Podemos identificar niveles de abstraccin de las ontologas.
Estos niveles de generalizacin nos da una topologa de ontologas.
Podemos identificar niveles de abstraccin de las ontologas. Estos
niveles de generalizacin nos da una topologa de ontologas. La idea
es caracterizar una red de ontologas usando multiplicidad y
abstraccin. Podemos pensar en una estrategia de construccin gradual
de abajo hacia arriba.
Diapositiva 28
Multiplicidad de la representacin. Un concepto puede ser
representado de muchas formas que pueden coexistir Multiplicidad de
la representacin. Un concepto puede ser representado de muchas
formas que pueden coexistir Mapeo de ontologas. Establecer
relaciones entre los elementos de una o ms ontologas, para
establecer conexiones, especializaciones, generalizaciones, etc.
Mapeo de ontologas. Establecer relaciones entre los elementos de
una o ms ontologas, para establecer conexiones, especializaciones,
generalizaciones, etc.
Diapositiva 29
Tipos de Ontologas En KACTUS identificaron 4 tipos de ontologas
de acuerdo a su alcance de aplicabilidad: 1. Ontologa de la
aplicacin: Usadas por la aplicacin. Ontologa de procesos de
produccin, de diagnstico de fallas, de diseo intermedio de barcos,
etc. Tipos de Ontologas En KACTUS identificaron 4 tipos de
ontologas de acuerdo a su alcance de aplicabilidad: 1. Ontologa de
la aplicacin: Usadas por la aplicacin. Ontologa de procesos de
produccin, de diagnstico de fallas, de diseo intermedio de barcos,
etc.
Diapositiva 30
2. Ontologa del dominio: Especficas para un tipo de artefacto,
generalizaciones sobre tareas especficas en algn dominio. Por
ejemplo, ontologa del proceso de produccin de hidrocarburos, de la
red elctrica, de barcos, etc. 2. Ontologa del dominio: Especficas
para un tipo de artefacto, generalizaciones sobre tareas especficas
en algn dominio. Por ejemplo, ontologa del proceso de produccin de
hidrocarburos, de la red elctrica, de barcos, etc.
Diapositiva 31
3. Ontologas tcnicas bsicas: Describe caractersticas generales
de artefactos. Por ejemplo: componentes, procesos, funciones. 3.
Ontologas tcnicas bsicas: Describe caractersticas generales de
artefactos. Por ejemplo: componentes, procesos, funciones. 4.
Ontologas genricas: Describe la categora de ms alto nivel. 4.
Ontologas genricas: Describe la categora de ms alto nivel.
Diapositiva 32
Diapositiva 33
1. Claridad: Una ontologa debe de poder comunicar de manera
efectiva el significado de sus trminos. Las definiciones deben de
ser objetivas y comentadas en lenguaje natural 1. Claridad: Una
ontologa debe de poder comunicar de manera efectiva el significado
de sus trminos. Las definiciones deben de ser objetivas y
comentadas en lenguaje natural Criterios de Diseo de Ontologas
Diapositiva 34
2. Coherencia: Debe de permitir hacer inferencias que sean
consistentes con las definiciones 2. Coherencia: Debe de permitir
hacer inferencias que sean consistentes con las definiciones 3.
Extendible: Debe de anticipar usos y permitir extensiones y
especializaciones monotnicas 3. Extendible: Debe de anticipar usos
y permitir extensiones y especializaciones monotnicas
Diapositiva 35
4. Sesgo de codificacin mnimo ( minimal encoding bias ):
Especificar al nivel de conocimiento sin depender de una
codificacin particular a nivel de smbolo. 5. Mnimo compromiso
ontolgico: Hacer la menor cantidad de suposiciones acerca del mundo
modelado. 5. Mnimo compromiso ontolgico: Hacer la menor cantidad de
suposiciones acerca del mundo modelado. En estos criterios de
decisin se tienen que hacer balances.
Diapositiva 36
1. Comunicacin: Modelos normativos, red de relaciones,
consistencia y falta de ambigedad, integracin de diferentes
perspectivas de usuarios, etc. 1. Comunicacin: Modelos normativos,
red de relaciones, consistencia y falta de ambigedad, integracin de
diferentes perspectivas de usuarios, etc. Usos de Ontologas
Diapositiva 37
2. Inter-operabilidad: Usar ontologas como una inter-lingua. 2.
Inter-operabilidad: Usar ontologas como una inter-lingua. 3.
Ingeniera de sistemas: Especificacin, confiabilidad y reutilizacin
3. Ingeniera de sistemas: Especificacin, confiabilidad y
reutilizacin
Diapositiva 38
Diapositiva 39
Diapositiva 40
1. Identificar propsito y alcance (usuarios potenciales) 1.
Identificar propsito y alcance (usuarios potenciales) Metodologa
Genrica 2. Construccin de ontologa: Captura: (i) Identificacin de
conceptos y relaciones claves, (ii) Produccin de definiciones no
ambigas, (iii) Identificacin de trminos Captura: (i) Identificacin
de conceptos y relaciones claves, (ii) Produccin de definiciones no
ambigas, (iii) Identificacin de trminos
Diapositiva 41
Codificacin: Representacin explcita de la conceptualizacin en
un lenguaje formal Codificacin: Representacin explcita de la
conceptualizacin en un lenguaje formal Integracin de ontologas
existentes: cmo, cules y si vamos a usar alguna ontologa existente
Integracin de ontologas existentes: cmo, cules y si vamos a usar
alguna ontologa existente 3. Evaluacin 4. Documentacin
Diapositiva 42
Metodologa de Construccin (KACTUS) 1. Especificar: Metodologa
de Construccin (KACTUS) 1. Especificar: El contexto de aplicacin:
el dominio, los objetos de inters y las tareas que se van a
realizar por la ontologa (para qu se va a construir). El contexto
de aplicacin: el dominio, los objetos de inters y las tareas que se
van a realizar por la ontologa (para qu se va a construir).
Diapositiva 43
El punto de vista del modelado: Describe el tipo de modelo,
tales como, dinmico - esttico, funcional - causal, etc. El punto de
vista del modelado: Describe el tipo de modelo, tales como, dinmico
- esttico, funcional - causal, etc. Por ejemplo: en el sector
elctrico podemos pensar en 4 grandes conceptos: generacin,
distribucin, transporte y consumo.
Diapositiva 44
Los componentes de la funcionalidad son: generadores, lneas de
transmisin, capacitores, transformadores, cargas, etc. Algunas
variables son: voltaje, corriente, potencia, y sus leyes. Los
componentes de la funcionalidad son: generadores, lneas de
transmisin, capacitores, transformadores, cargas, etc. Algunas
variables son: voltaje, corriente, potencia, y sus leyes.
Diapositiva 45
2. Hacer un diseo preliminar basndose en una ontologa
existente. Implica una etapa de anlisis y de mapeo de ontologas. 2.
Hacer un diseo preliminar basndose en una ontologa existente.
Implica una etapa de anlisis y de mapeo de ontologas. El mapeo
puede ser:
Diapositiva 46
De formalizacin: de la especificacin o del modelado. De
formalizacin: de la especificacin o del modelado. Para aumentar la
parte declarativa de la ontologa Para aumentar la parte declarativa
de la ontologa Para especializar trminos creando subtipos o
restricciones de tipos Para especializar trminos creando subtipos o
restricciones de tipos Mezcla de todos
Diapositiva 47
Por ejemplo, una lnea de transmisin es un elemento que
transporta energa elctrica, genera prdidas y baja el voltaje. Este
paso es el ms difcil e implica mayor trabajo. El proceso de
transporte de energa es un caso especfico de un proceso fsico, por
lo que podemos tomar una ontologa de procesos fsicos.
Diapositiva 48
Por otro lado, la descomposicin de procesos es otro aspecto que
podemos incorporar usando una ontologa de descomposicin. Despus
tenemos que verificar que los conceptos encontrados en las
ontologas son adecuados para nuestro propsito. Por otro lado, la
descomposicin de procesos es otro aspecto que podemos incorporar
usando una ontologa de descomposicin. Despus tenemos que verificar
que los conceptos encontrados en las ontologas son adecuados para
nuestro propsito.
Diapositiva 49
Bsicamente debemos de considerar que la ontologa construida va
a ser reutilizada. 3. Hacer un diseo definitivo y evaluarlo Algunos
principios generales de reutilizacin son: abstraccin (lo ms
abstracto posible, pero suficientemente concreto) modularizacin
(aislar conceptos), jerarquizacin (orden) y estandarizacin (e.g.,
STEP).
Diapositiva 50
La documentacin tiene que hacerse en forma paralela a los
puntos anteriores y debe de tener el tipo de mapeo en que se basa
la nueva teora, diferencias semnticas con las ontologas
seleccionadas, justificacin de las decisiones tomadas, evaluacin,
conocimiento adicional para usarla, etc. La documentacin tiene que
hacerse en forma paralela a los puntos anteriores y debe de tener
el tipo de mapeo en que se basa la nueva teora, diferencias
semnticas con las ontologas seleccionadas, justificacin de las
decisiones tomadas, evaluacin, conocimiento adicional para usarla,
etc. 4. Documentacin y reutilizacin.
Diapositiva 51
Hacer tormentas de ideas para producir todos los trminos
relevantes y frases, y estructuracin inicial para identificar
referencias cruzadas entre las reas Hacer tormentas de ideas para
producir todos los trminos relevantes y frases, y estructuracin
inicial para identificar referencias cruzadas entre las reas
Metodologa (tips) para la definicin de trminos Producir
definiciones Determinar la meta-ontologa: inicialmente no casarse
con ninguna Determinar la meta-ontologa: inicialmente no casarse
con ninguna
Diapositiva 52
Dividir en reas que tengan el traslape semntico ms grande y
trabajar primero en ellas. Dividir en reas que tengan el traslape
semntico ms grande y trabajar primero en ellas. Proceder de en
medio hacia afuera: esto es definir los trminos considerados
fundamentales y moverse a niveles ms abstractos y especficos.
Proceder de en medio hacia afuera: esto es definir los trminos
considerados fundamentales y moverse a niveles ms abstractos y
especficos.
Diapositiva 53
Una metodologa de abajo hacia arriba produce demasiado nivel de
detalle, aumenta esfuerzo, difcil identificar cuestiones comunes
entre conceptos relacionados, lo cual aumenta el riesgo de tener
inconsistencias.
Diapositiva 54
Una metodologa de arriba a abajo, puede resultar en establecer
una categorizacin arbitraria, con posible poca estabilidad y puede
no identificar cuestiones comunes en una red compleja.
Diapositiva 55
Diapositiva 56
Formato de proceso de intercambio ( Process Interchange Format
- PIF): es un proyecto para intercambiar modelos de procesos de
negocios usando diferentes representaciones. Formato de proceso de
intercambio ( Process Interchange Format - PIF): es un proyecto
para intercambiar modelos de procesos de negocios usando diferentes
representaciones. Proyectos de Ontologas Ontologs de planes:
proyecto ARPA para desarrollar un lenguaje de especificacin de
representacin de conocimiento (KRSL) para representar planes e
informacin de planificacin. Ontologs de planes: proyecto ARPA para
desarrollar un lenguaje de especificacin de representacin de
conocimiento (KRSL) para representar planes e informacin de
planificacin.
Diapositiva 57
CYC proyecto de MCC (Microelectronics and Computer technology
Corporation) da los fundamentos para razonamiento de sentido comn
mediante el desarrollo de ontologas. CYC proyecto de MCC
(Microelectronics and Computer technology Corporation) da los
fundamentos para razonamiento de sentido comn mediante el
desarrollo de ontologas. TOVE (TOronto Virtual Enterprise):
Desarrollar una ontologa para empresas. TOVE (TOronto Virtual
Enterprise): Desarrollar una ontologa para empresas. Se puede ver
la ontologa de CYC, ms que una ontologa monoltica, como una red de
microteoras.
Diapositiva 58
Enterprise: Proyecto parecido a TOVE pero Ingls, y el nfasis es
sobretodo en proveer un ambiente de integracin de herramientas y
mtodos usados en los negocios. Enterprise: Proyecto parecido a TOVE
pero Ingls, y el nfasis es sobretodo en proveer un ambiente de
integracin de herramientas y mtodos usados en los negocios.
Diapositiva 59
KACTUS: Proyecto ESPRIT para el desarrollo de una metodologa de
reutilizacin de conocimiento tcnico. KACTUS: Proyecto ESPRIT para
el desarrollo de una metodologa de reutilizacin de conocimiento
tcnico. Plinius: El objetivo es la extraccin semi-automtica de
conocimiento a partir de textos en lenguaje natural enfocado a
materiales cermicos. Plinius: El objetivo es la extraccin
semi-automtica de conocimiento a partir de textos en lenguaje
natural enfocado a materiales cermicos.
Diapositiva 60
En principio podemos usar cualquier lenguaje de programacin,
pero a veces carecen de expresividad para escribir lo que queremos
decir. Algunas de las primitivas que se aaden son: En principio
podemos usar cualquier lenguaje de programacin, pero a veces
carecen de expresividad para escribir lo que queremos decir.
Algunas de las primitivas que se aaden son: Lenguajes de
especificacin de ontologas
Diapositiva 61
Contructores para agregados, multiples jerarquas
clase-subclase, reglas y axiomas Contructores para agregados,
multiples jerarquas clase-subclase, reglas y axiomas Varias formas
de modularizacin, para poder escribir diferentes ontologas y sus
inter- relaciones. Varias formas de modularizacin, para poder
escribir diferentes ontologas y sus inter- relaciones. La
posibilidad de tomar una visin a un meta-nivel. La posibilidad de
tomar una visin a un meta-nivel.
Diapositiva 62
KIF (Knowledge Interchange Format) y grfos conceptuales KIF
(Knowledge Interchange Format) y grfos conceptuales Algunos
lenguajes utilizados son: STEP (STandard for the Exchange of
Product model data) y su lenguaje de especificacin EXPRESS STEP
(STandard for the Exchange of Product model data) y su lenguaje de
especificacin EXPRESS
Diapositiva 63
CML (Conceptual Modelling Language) Desarrollado como parte de
KADS dentro del proyecto de CommonKADS. CML (Conceptual Modelling
Language) Desarrollado como parte de KADS dentro del proyecto de
CommonKADS. Ontolingua (Stanford)
Diapositiva 64
CORBA (The Common Object Request Broker Arquiteture) y el
lenguaje IDL (Interface Definition Languaje) CORBA (The Common
Object Request Broker Arquiteture) y el lenguaje IDL (Interface
Definition Languaje) Workflow management coalition (WfMC) Workflow
management coalition (WfMC)
Diapositiva 65
Se busca en el lenguaje: (i) expresividad y (ii) uso. Se busca
en el lenguaje: (i) expresividad y (ii) uso. Todava no hay un
estndar. Lo importante es el contenido ms que la sintaxis.
Diapositiva 66
Existe un servidor puesto por el laboratorio de sistemas de
conocimiento de la Universidad de Stanford que permite:...
Herramientas de Soporte: El servidor de ontologas (KSL)
Herramientas de Soporte: El servidor de ontologas (KSL)
Diapositiva 67
Permite trabajo colaborativo a travs de internet. Usa
Ontolingua (parecido a KIF). Crear, editar, evaluar, publicar,
mantener y revisar ontologas (http://www-ksl.stanford.edu/).
Diapositiva 68
Desarrollo de ontologas como soporte de inter-lingua e
interoperabilidad entre herramientas en algn dominio (traductores e
integracin) Desarrollo de ontologas como soporte de inter-lingua e
interoperabilidad entre herramientas en algn dominio (traductores e
integracin) Trabajo Futuro Desarrollo de herramientas para apoyar
el diseo y evaluacin de ontologas Desarrollo de herramientas para
apoyar el diseo y evaluacin de ontologas
Diapositiva 69
Desarrollo de bibliotecas de ontologas Metodologas de diseo y
evaluacin de ontologas Metodologas de diseo y evaluacin de
ontologas Desarrollo e integracin de nuevas ontologas Desarrollo e
integracin de nuevas ontologas