29
Санкт-Петербург, 2012 Анализ естественного языка в моделировании требований в CASE-технологиях В.Р. Нуриахметов

семинар Spb ling_v3

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: семинар Spb ling_v3

Санкт-Петербург, 2012

Анализ естественного языка в моделировании требований

в CASE-технологиях

В.Р. Нуриахметов

Page 2: семинар Spb ling_v3

CASE – система PowerDesigner

2

Page 3: семинар Spb ling_v3

Принцип моделирования требований

3

Требования

Модель требований

Матрица связи

Объекты модели

CASE-модель

Диаграммы

Создание/Обновление

Создание ссылок

Создание объектов CASE - модели

Создание требований

Процесс разработки

Документ MS Word

Page 4: семинар Spb ling_v3

Свойства требований в PowerDesigner

4

Page 5: семинар Spb ling_v3

Связь требований с объектами других моделей в PowerDesigner

5

Page 6: семинар Spb ling_v3

Анализ связей требований с другими объектами

6

Page 7: семинар Spb ling_v3

Связи между требованиями

7

Page 8: семинар Spb ling_v3

Методы анализа связей требований

8

• Анализ влиянияАнализ входящих связей с целью ответа на вопрос: «Что будет если изменить это требование?»

• Анализ последствийАнализ исходящих связей с целью ответа на вопрос: «Нам это действительно нужно?»

• Анализ покрытияАнализ связей с целью ответа на вопрос:«Все ли учтено?» Обычно используется для оценки прогресса работы.

Page 9: семинар Spb ling_v3

Анализ связей между требованиями в PowerDesigner

9

Page 10: семинар Spb ling_v3

Проблема моделирования требований

10

Page 11: семинар Spb ling_v3

Дальнейшая интеллектуализация возможностей PowerDesigner

11

На основе модели требований формируются концептуальные CASE-модели.

Основной концептуальной моделью является модель «сущность-связь» (ERD)

Задача: извлекать информацию о сущностях из текстов требований.

Решение: использовать концептуальные графы

Page 12: семинар Spb ling_v3

Модель «сущность-связь»

12

• Сущность - это объект, который может быть идентифицирован неким способом, отличающим его от других объектов.

• Сущность состоит из множества атрибутов, которые описывают ее свойства.

• Ключ сущности - это один или более атрибутов уникально определяющих данную сущность.

• Связь  - это ассоциация, установленная между несколькими сущностями.

Page 13: семинар Spb ling_v3

Концептуальные графы

13

Концептуальный граф - это двудольный направленный граф, состоящий из двух типов узлов: концептов и концептуальных отношений, или просто отношений.

Page 14: семинар Spb ling_v3

Пример визуализации концептуального графа системой TextAnalyst

14

«Система управления контентом - программный продукт, представляющий собой комплексную систему для управления содержанием сайта».

Page 15: семинар Spb ling_v3

Концептуальная модель требований

Концептуальная модель требований на контексте (E, A, R) есть набор формальных понятий, концептами которого являются подматрицы, образующие блочно-диагональную структуру.

E – множество сущностей;A – множество атрибутовсущностей;R – множество отношений между сущностями и атрибутами.

15

Page 16: семинар Spb ling_v3

Пример блочно-диагональных разложений матрицы контекста

16

kE~

2

~E... . . .

...1A 2A kA

1

~E

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

kE~

2

~E... . . .

...1A 2A kA

1

~E

1

1

1

1

1

1

1

1

1

1

1

1

kE~

2

~E

... . . .

...1A 2A kA

1

~E

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

EA

- множество сущностей

- множество атрибутов

Page 17: семинар Spb ling_v3

Этапы построения концептуального графа

17

1. Разделение текста ЕЯ на предложения.2. Разделение предложений на слова, знаки пунктуации и

другие символы.3. Удаление стоп-слов.4. Стэмминг.5. Определение морфологических признаков элементов

предложения.6. Определение концептуальных отношений

(синтаксический разбор предложения).7. Выбор концептов из списка элементов предложения.

Page 18: семинар Spb ling_v3

Алгоритм добавления атрибутов объектов

18

Вход

Выход

1

11

2-й концепт доб-ся в список атр.

найденной сущности

1-й концепт доб-ся в список атр.

найденной сущности

«атрибут» «гентеив»

Поиск отношений «атрибут» и «генетив» в

списке отношений

11

11

Нахождение 1-ого концепта в списке сущностей

Нахождение 2-ого концепта в списке сущностей

Добавление 2-ого концепта в

список сущностей.

Добавление 1-ого концепта в

список атрибутов этой сущности.

Добавление 1-ого концепта в

список сущностей.

Добавление 2-ого концепта в

список атрибутов этой сущности.

2

3 7

4 8

5 106 9

Да Нет

Да

Нет Нет

Нет НетДаДа

Page 19: семинар Spb ling_v3

Пример визуализации концептуального графа и выявления объектов и атрибутов из предложения текста требований

19

объем

публикациябольшой

информация

объем

интернетоъем

портал

информационный

Page 20: семинар Spb ling_v3

Детализация требований

20

«В условиях отсутствия внешнего источника электроэнергии телекоммуникационная система должна поддерживать телефонную связь».

«В условиях отсутствия внешнего источника электроэнергии телекоммуникационная система должна поддерживать телефонную связь с активными абонентами».

«В условиях отсутствия внешнего источника электроэнергии телекоммуникационная система должна поддерживать радиосвязь».

«В условиях отсутствия внешнего источника электроэнергии телекоммуникационная система должна поддерживать радиосвязь с дежурными водителями скорой помощи».

Page 21: семинар Spb ling_v3

Концептуальный граф первого требования

21

система

телекоммуникационный

источник

отсутствиевнешний

связь

телефонный

электропитание

источник

Page 22: семинар Spb ling_v3

Концептуальный граф второго требования

22

система

телекоммуникационный

источник

отсутствиевнешний

связь

телефонный

абонент

активный

Page 23: семинар Spb ling_v3

Концептуальный граф третьего требования

23

система

телекоммуникационный

источник

отсутствиевнешний

электропитание

источник

Page 24: семинар Spb ling_v3

Концептуальный граф четвертого требования

24

система

телекоммуникационный

источник

отсутствиевнешний

электропитание

источник

водитель

дежурный

помощь

водительскорый

Page 25: семинар Spb ling_v3

Детализация анализируемых требований

25

Page 26: семинар Spb ling_v3

Экспериментальные результаты

26

Вид технического задания

Корректные объекты

Корректные атрибуты для выявленных

объектов

1. Текст ТЗ написан без терминов и определений

37 % 28%

2. Текст ТЗ содержит небольшое число терминов и определений

44% 41%

3. Текст ТЗ содержит большое число терминов и определений

49% 60%

Page 27: семинар Spb ling_v3

Выводы

27

1. Результаты, полученные из экспериментов показывают, что концептуальные графы применимы для извлечения объектов и их атрибутов из текстов требований на естественном языке и могут обеспечивать существенно новой информацией разработчиков CASE – моделей.

2. Формальный контекст служит инструментом для выбора значимых объектов при построении CASE – моделей.

Page 28: семинар Spb ling_v3

Будущая работа

28

1. Адаптация текстового анализатора к конкретной педметной области.

2. Использование большего набора отношений для выявления объектов и атрибутов.

3. Расширение набора грамматических шаблонов для русского и английского языка.

Page 29: семинар Spb ling_v3

Спасибо за внимание!