Upload
lidia-pivovarova
View
1.325
Download
0
Embed Size (px)
Citation preview
ОНТОЛОГИИ ВЕРХНЕГО УРОВНЯ. ОБЗОР
Пивоварова Лидия Михайловна
СПбГУ2010
Top-level онтологии: список
1. BFO2. ConceptNet3. DOLCE4. OCHRE5. PROTON6. SUMO7. UpperCYC8. YAGO9. YAMATO
Принципы описания
1. Название2. Разработчики3. Объем4. Meta/top-level/domain5. Категоризация6. Тематическая направленность7. Язык8. Приложения9. URL
BFO
• IFOMIS (Institute for Formal Ontology and Medical Information Science, Saarland University)
• 36 концептов• Meta• Классы, экземпляры, отношения.• Онтология реальности (а не представлений о ней).• Имплементирована на различных формальных
языках, в том числе OWL и KIF• Более сорока доменных онтологий, разработанных
на основе BFO; почти все они описывают ту или иную область биологии или медицины.
• http://www.ifomis.org/bfo
Continuant(Континуант)
Spatial Region(Пространственный регион)
Independent Continuant(Независимый континуант)
Dependent Continuant(Зависимый континуант)
Volume(Объем)
Line(Линия)
Surface(Поверхность)
Point(Точка)
Site(Пространство)
Object Aggregate
(Объединение объектов)
Object(Объект)
Fiat Part of Object
(«Назначенная» часть объекта)
Boundary of Object
(Граница объекта)
Reliable Entity(Относительная
сущность)
Disposition(Поведение)
Role(Роль)
Quality(Качество)
Function(Функция)
SNAP
Occurent (Оккурент)
Processual Entity(Процессная сущность)
Temporal Region(Временной регион)
Processual Context(Процессуальный
контекст)
Process Aggregate
(Объединение процессов)
Process(Процесс)
Boundary of Process
(Граница процесса)
SPAN
Scattered Spatiotemporal
Region(Разрозненный
пространственно-временной регион)
Connected Spatiotemporal
Region(Связный
пространственно-временной регион)
Spatiotemporal Interval
(Пространственно-временной интервал)
Spatiotemporal Instant
(Пространственно-временной экземпляр)
Scattered Temporal Region
(Разрозненный временной регион)
Connected Temporal Region
(Связный временной регион)
Temporal Interval(Временной интервал)
Temporal Instant(Временной экземпляр)
Fiat Part of Process
(«Назначенная» часть процесс)
Spatiotemporal Region(Пространственно-временной
регион)
ConceptNet • MIT Media Lab• 1029711 утверждений для английского языка 356277 для
китайского, 233423 для португальского, около 15000 для японского и корейского, а также утверждения на датском, венгерском, французском, испанском и итальянском языках
• Иеррархия отсутствует; онтология представляет собой сеть
• Сетевая структура: узлы и отношения.• Повседневные знания (common sence).• Непосредственно на языке программирования (Python) • Использовалась для распознавания речи и изображений,
человеко-машинные интерфейсы, рекомендательные системы, поисковые системы
• http://csc.media.mit.edu/conceptnet
DOLCE• Laboratory for Applied Ontology (LOA)• Приблизительно 100 концептов, 100 свойств и 20 аксиом• Скорее Meta - в том же смысле, в котором BFO; однако
большее число концептов предполагает и большую детализацию, т.е. приближение к top-level в нашем смысле
• Концепты и аксиомы• Онтология языковых и когнитивных представлений.• First-Order Logic; перевод на OWL, части, для который не
хватает выразительности OWL приведены в качестве комментариев на KIF
• Первый модуль в библиотеке WonderWeb• http://www.loa-cnr.it/DOLCE.html
EntityСущность
AbstractАбстрактное
QualityКачествоPerdurant
Динамическое
EndurantСтатическое
Physical Endurant
Физическое статическое
Arbitrary SumПроизвольная
сумма
Non-physical Endurant
Нефизическ. статическое
Amount of Matter
Часть материи
Physical ObjectФизический
объект
FeatureПризнак
Agentive Physical Object
Агентивный физический
объект
Non-Agentive Physical Object Неагентивный
физический объект
Non-physical Object
Нефизический объект
Mental ObjectМентальный
объект
Social ObjectСоциальный
объект
Agentive Social Object
Агентивный социальный
объект
Non-Agentive Social Object
Неагентивный социальный
объект
Social AgentСоциальный
Агент
SocietyОбщество
StativeПостоянное
EventСобытие
AccomplishmentИсполнение
AchievementДостижение
ProcessПроцесс
StateСостояние
EntityСущность
AbstractАбстрактное
QualityКачество
PerdurantДинамическое
EndurantСтатическое
Abstract QualityАбстрактное
Качество
Physical QualityФизическое
Качество
Temporal QualityВременное Качество
Temporal LocationВременное
месторасположение
Spatial LocationПространственное
месторасположение
SetМножество
RegionРегион
FactФакт
Abstract RegionАбстрактный
Регион
Physical RegionФизический
Регион
Temporal RegionВременной Регион
Time IntervalВременной интервал
Space RegionПространственный
регион
OCHRE
• University of Chicago• Около 20 концептов• Meta• Концепты, свойства, ссылки.• Информация о культурном наследии.• XML, XMLSchema• Более десятка археологических и
филологических баз знаний.• http://ochre.lib.uchicago.edu/index.htm
ItemЕдиница
Базовые концепты
Spatial unitПространственная
единица
Taxonomic unitТаксономическая
единица
Temporal unitВременная
единица
Agency unitАгентивная
единица
Resource unitВнешний ресурс
Bibliographic unitБиблиографическая
единица
Discourse unitДискурсивная
единица
Epigraphic unitЭпиграфическая
единица
Script unitРукописная
единица
Lexical unitЛексическая
единица
Концепты, необходимые для
группировки других концептов
List Список
HierarchyИеррархия
Relationship Отношения
Query Запрос
TextТекст
TaxonomyТаксономия
PROTON
• Ontotext Lab, Sirma Group• 300 классов и 100 свойств• top-level• Классы и свойства.• Онтология реальности.• OWL Lite• SEKT Project (Semantic Web)• http://proton.semanticweb.org/
EntityСущность
AbstractАбстрактноеObject
Объект
HappeningПроисходящее
EventСобытие
SituationПоложение
Time IntervalВременной интервал
RoleРоль
Job PositionДолжность
StatementУтверждение
AgentАгент
ServiceСервис
ProductПродукт
LocationМестоположение
GroupГруппа
PersonПерсона
OrganizationОрганизация
Information Resource
Информационный ресурс
DocumentДокумент
Contact InformationКонтактная
информация
General TermОбщий термин
NumberЧисло
TopicТема
LanguageЯзык
SUMO
• IEEE (Institute of Electrical and Electronics Engineers)
• 1000 концептов и 5000 аксиом• top-level• Концепты и аксиомы.• Попытка объединения существующих
онтологий верхнего уровня.• KIF, переведена на OWL• Доменные онтологии и лексические базы.• http://www.ontologyportal.org/index.html
physical(физическое)
process(процесс)
object(объект)
self connected object
(связный объект)
region(регион)
collection(коллекция)
agent(агент)
substance(материя)
corpuscular object (корпускулярный
объект)
content bearing object
(несущий содержание
объект)
food(еда)
hole(дыра)
astronomical body (астрономическое
тело)
geographic area(географический
регион)
group(группа)
organization(организация)
sentient agent(чувствующий
агент)
geopolitical area (геополитический
регион)
group (группа)
organism(организм)
dual object process(двухобъектный
процесс)
intentional process(интенциональный
процесс)
motion(движение)
internal change(внутреннее изменение)
shape change(изменение
формы)
abstract(абстрактное)
graph element(элемент графа)
graph(граф)
proposition(пропозиция)
relation(отношение)
set or class(множество или класс)
attribute(атрибут)
quantity(количество)
number(число)
real number(вещественное
число)
imaginary number(мнимое число)
complex number(комплексное
число)
physical quantity(физическое количество)
constant quantity(постоянное количество)
unit of measure(единица
измерения)
function quantity(функциональное
количество)
internal attribute(внутренний атрибут)
relational attribute(относительный
атрибут)
saturation attribute(атрибут
пропитанности)
physical state(физическое состояние)
breakability attribute (атрибут
членимости)
perceptual attribute
(перцептивный атрибут)
biological attribute
(биологический атрибут)
shape attribute(атрибут формы)
positional attribute(атрибут
положения)
truth value(истинностное
значение)
social role (социальная роль)
biological attribute(биологический
атрибут)
time zone(часовой пояс)
single valued relation(отношение с одним
значением)
total valued relation(отношение с
интервальным значением)
partial valued relation(отношение с
частичным значением)
binary relation(бинарное
отношение)
ternary relation(тернарное отношение)
spatial relation(пространственн
ое отношение)temporal relation
(временное отношение)
quaternary relation
(отношение четырех
объектов)
list(список)
predicate(предикат)
UpperCYC
• Cycorp, Inc.• 3000 терминов• Meta и top-level• Коллекции, индивидуумы, предикаты,
отношения, функции.• Универсальная.• CycL• Интегрирована в онтологии CYC и OpenCYC• http://glotta.ntua.gr/StateoftheArt/Ontologies/
cover.html
YAGO• 2 миллиона сущностей и 20 миллионов фактов• Meta-модель с наполнением конкретной фактографической
информацией; в качестве промежуточного уровня выступает WordNet
• Сущности, классы, экземпляры, отношения, факты (каждая сущность является экземпляром какого-либо класса; факты также являются сущностями и могут вступать в отношения).
• База фактов (главным образом - концептуализация Википедии).
• Текстовый формат• Извлечение информации, логический вывод, вопросно-
ответные системы.• http://www.mpi-inf.mpg.de/yago-naga/yago/downloads.html
YAMATO
• Mizoguchi Lab, Osaka University• Около 1000 концептов• Meta и top-level• Концепты, роли, носители ролей, отношения.• Универсальная онтология с упором на
концептуализацию свойств и репрезентаций.• XML (формат HOZO)• Несколько отраслевых онтологий: в том числе
медицинская, генетическая, онтология поведения и др.
• http://www.ei.sanken.osaka-u.ac.jp/hozo/onto_library/upperOnto.htm
EntityСущность
Dependent EntityЗависимая сущностьEntity
Сущность
SubstrateОснова
TimeВремя
SpaceПространство
SubstanceМатерия
FunctionalФункционал
Morphologial wholeМорфологическое
целое
AgentАгент
Occurent (Оккурент)
Continuant(Континуант)
Quality valueЗначение качества
QualityКачество
Non-unitaryНецелостное
ObjectОбъект
Living organism
Живой организм
Chemical compoundХимическое соединение
ArtifactАртефакт
PhysicalФизическое
AbstractАбстрактное
Semi-abstractПолу-абстрактное
MindСознание Content
СодержаниеRepresentationРепрезентация
Representation form
Форма репрезентации
Quality-Quantity
Качество-Количество
RoleРоль
FeatureСвойство
Generic qualityОригинальное
качество
PropertyСвойство
CategoricalКатегориальное
QuantityКоличество
Выводы и впечатления• На сегодняшний день сложилось некое общее место самого
верхнего уровня – разделение на объекты, процессы и отношения.
• OWL является общепринятым языком импорта-экспорта, но он является не достаточным – в большинстве проектов не используется, или используется как вспомогательный.
• Большинство проектов не ориентированы на обработку естественного языка как основную задачу. Скорее, онтологии используются для организации и переорганизации знаний предметной области и поиска по ним.
• При этом анализ текста рассматривается как важнейший инструмент пополнения онтологии.
• Методологии создаются ad hoc, их очевидно недостаточно.
• Иногда создание онтологии становится самоцелью – гигантские проекты заканчиваются созданием неиспользуемого продукта.
Спасибо за внимание!