семинар Spb ling_v3

Preview:

DESCRIPTION

 

Citation preview

Санкт-Петербург, 2012

Анализ естественного языка в моделировании требований

в CASE-технологиях

В.Р. Нуриахметов

CASE – система PowerDesigner

2

Принцип моделирования требований

3

Требования

Модель требований

Матрица связи

Объекты модели

CASE-модель

Диаграммы

Создание/Обновление

Создание ссылок

Создание объектов CASE - модели

Создание требований

Процесс разработки

Документ MS Word

Свойства требований в PowerDesigner

4

Связь требований с объектами других моделей в PowerDesigner

5

Анализ связей требований с другими объектами

6

Связи между требованиями

7

Методы анализа связей требований

8

• Анализ влиянияАнализ входящих связей с целью ответа на вопрос: «Что будет если изменить это требование?»

• Анализ последствийАнализ исходящих связей с целью ответа на вопрос: «Нам это действительно нужно?»

• Анализ покрытияАнализ связей с целью ответа на вопрос:«Все ли учтено?» Обычно используется для оценки прогресса работы.

Анализ связей между требованиями в PowerDesigner

9

Проблема моделирования требований

10

Дальнейшая интеллектуализация возможностей PowerDesigner

11

На основе модели требований формируются концептуальные CASE-модели.

Основной концептуальной моделью является модель «сущность-связь» (ERD)

Задача: извлекать информацию о сущностях из текстов требований.

Решение: использовать концептуальные графы

Модель «сущность-связь»

12

• Сущность - это объект, который может быть идентифицирован неким способом, отличающим его от других объектов.

• Сущность состоит из множества атрибутов, которые описывают ее свойства.

• Ключ сущности - это один или более атрибутов уникально определяющих данную сущность.

• Связь  - это ассоциация, установленная между несколькими сущностями.

Концептуальные графы

13

Концептуальный граф - это двудольный направленный граф, состоящий из двух типов узлов: концептов и концептуальных отношений, или просто отношений.

Пример визуализации концептуального графа системой TextAnalyst

14

«Система управления контентом - программный продукт, представляющий собой комплексную систему для управления содержанием сайта».

Концептуальная модель требований

Концептуальная модель требований на контексте (E, A, R) есть набор формальных понятий, концептами которого являются подматрицы, образующие блочно-диагональную структуру.

E – множество сущностей;A – множество атрибутовсущностей;R – множество отношений между сущностями и атрибутами.

15

Пример блочно-диагональных разложений матрицы контекста

16

kE~

2

~E... . . .

...1A 2A kA

1

~E

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

kE~

2

~E... . . .

...1A 2A kA

1

~E

1

1

1

1

1

1

1

1

1

1

1

1

kE~

2

~E

... . . .

...1A 2A kA

1

~E

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

EA

- множество сущностей

- множество атрибутов

Этапы построения концептуального графа

17

1. Разделение текста ЕЯ на предложения.2. Разделение предложений на слова, знаки пунктуации и

другие символы.3. Удаление стоп-слов.4. Стэмминг.5. Определение морфологических признаков элементов

предложения.6. Определение концептуальных отношений

(синтаксический разбор предложения).7. Выбор концептов из списка элементов предложения.

Алгоритм добавления атрибутов объектов

18

Вход

Выход

1

11

2-й концепт доб-ся в список атр.

найденной сущности

1-й концепт доб-ся в список атр.

найденной сущности

«атрибут» «гентеив»

Поиск отношений «атрибут» и «генетив» в

списке отношений

11

11

Нахождение 1-ого концепта в списке сущностей

Нахождение 2-ого концепта в списке сущностей

Добавление 2-ого концепта в

список сущностей.

Добавление 1-ого концепта в

список атрибутов этой сущности.

Добавление 1-ого концепта в

список сущностей.

Добавление 2-ого концепта в

список атрибутов этой сущности.

2

3 7

4 8

5 106 9

Да Нет

Да

Нет Нет

Нет НетДаДа

Пример визуализации концептуального графа и выявления объектов и атрибутов из предложения текста требований

19

объем

публикациябольшой

информация

объем

интернетоъем

портал

информационный

Детализация требований

20

«В условиях отсутствия внешнего источника электроэнергии телекоммуникационная система должна поддерживать телефонную связь».

«В условиях отсутствия внешнего источника электроэнергии телекоммуникационная система должна поддерживать телефонную связь с активными абонентами».

«В условиях отсутствия внешнего источника электроэнергии телекоммуникационная система должна поддерживать радиосвязь».

«В условиях отсутствия внешнего источника электроэнергии телекоммуникационная система должна поддерживать радиосвязь с дежурными водителями скорой помощи».

Концептуальный граф первого требования

21

система

телекоммуникационный

источник

отсутствиевнешний

связь

телефонный

электропитание

источник

Концептуальный граф второго требования

22

система

телекоммуникационный

источник

отсутствиевнешний

связь

телефонный

абонент

активный

Концептуальный граф третьего требования

23

система

телекоммуникационный

источник

отсутствиевнешний

электропитание

источник

Концептуальный граф четвертого требования

24

система

телекоммуникационный

источник

отсутствиевнешний

электропитание

источник

водитель

дежурный

помощь

водительскорый

Детализация анализируемых требований

25

Экспериментальные результаты

26

Вид технического задания

Корректные объекты

Корректные атрибуты для выявленных

объектов

1. Текст ТЗ написан без терминов и определений

37 % 28%

2. Текст ТЗ содержит небольшое число терминов и определений

44% 41%

3. Текст ТЗ содержит большое число терминов и определений

49% 60%

Выводы

27

1. Результаты, полученные из экспериментов показывают, что концептуальные графы применимы для извлечения объектов и их атрибутов из текстов требований на естественном языке и могут обеспечивать существенно новой информацией разработчиков CASE – моделей.

2. Формальный контекст служит инструментом для выбора значимых объектов при построении CASE – моделей.

Будущая работа

28

1. Адаптация текстового анализатора к конкретной педметной области.

2. Использование большего набора отношений для выявления объектов и атрибутов.

3. Расширение набора грамматических шаблонов для русского и английского языка.

Спасибо за внимание!