25
Тема 1-2. Виды и свойства АИС В этой теме рассматриваются классификация АИС, АРМы, интеграция информационных ресурсов, а также вопросы, связанные с. информационным поиском и автоматизированными информационно- поисковыми системами. Разновидностью автоматизированных систем, широко используемых в самых различных областях человеческой деятельности, являются автоматизированные информационные системы. Добавление к понятию «система» термина «информационная» отражает цель еѐ создания и функционирования. Целью автоматизации в информационной системе вообще и в библиотеках, в частности, является повышение производительности и эффективности труда информационных работников, улучшение качества информационной продукции и услуг, повышение сервиса и оперативности обслуживания пользователей. Последние аспекты составляют сущность библиотечной деятельности. Реализуется эта цель, главным образом, путѐм хранения, обеспечения эффективного поиска и передачи информации пользователям по соответствующим их запросам для наиболее полного удовлетворения информационных запросов большого числа пользователей. Средством реализации данной цели являются компьютерные аппаратно-технические средства, на базе которых формируются автоматизированные информационные системы (АИС). Автоматизированная информационная система (англ. «Automated information system», AIS) это совокупность программных и аппаратных средств, предназначенных для хранения и (или) управления данными и информацией, а также для производства вычислений. Классификация АИС Информационные системы, как многие другие системы и объекты, принято делить на классы. Для распределения объектов по классам на основании общего признака используют их классификацию. Классификация это процесс соотнесения содержания документов с понятиями, зафиксированными в заранее составленных систематических схемах. Каждый класс относительно других классов занимает определѐнное место в образующей его системе. Рассмотрим основные разновидности классификации АИС. По сфере возможного применения различают универсальные и специализированные (или проблемно-ориентированные) автоматизированные информационные системы. АИС могут быть локальными, присутствующими и функционирующими на одном ПК, и сетевыми.

Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

Тема 1-2. Виды и свойства АИС

В этой теме рассматриваются классификация АИС, АРМы,

интеграция информационных ресурсов, а также вопросы, связанные с.

информационным поиском и автоматизированными информационно-

поисковыми системами.

Разновидностью автоматизированных систем, широко используемых в

самых различных областях человеческой деятельности, являются

автоматизированные информационные системы. Добавление к понятию

«система» термина «информационная» отражает цель еѐ создания и

функционирования.

Целью автоматизации в информационной системе вообще и в

библиотеках, в частности, является повышение производительности и

эффективности труда информационных работников, улучшение качества

информационной продукции и услуг, повышение сервиса и оперативности

обслуживания пользователей. Последние аспекты составляют сущность

библиотечной деятельности.

Реализуется эта цель, главным образом, путѐм хранения, обеспечения

эффективного поиска и передачи информации пользователям по

соответствующим их запросам для наиболее полного удовлетворения

информационных запросов большого числа пользователей.

Средством реализации данной цели являются компьютерные

аппаратно-технические средства, на базе которых формируются

автоматизированные информационные системы (АИС).

Автоматизированная информационная система (англ. «Automated

information system», AIS) – это совокупность программных и аппаратных

средств, предназначенных для хранения и (или) управления данными и

информацией, а также для производства вычислений.

Классификация АИС

Информационные системы, как многие другие системы и объекты,

принято делить на классы. Для распределения объектов по классам на

основании общего признака используют их классификацию.

Классификация – это процесс соотнесения содержания документов с

понятиями, зафиксированными в заранее составленных систематических

схемах.

Каждый класс относительно других классов занимает определѐнное

место в образующей его системе. Рассмотрим основные разновидности

классификации АИС.

По сфере возможного применения различают универсальные и

специализированные (или проблемно-ориентированные) автоматизированные

информационные системы.

АИС могут быть локальными, присутствующими и

функционирующими на одном ПК, и сетевыми.

Page 2: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

По топологии хранения данных различают локальные и распределѐнные

АИС.

В АИС размещают различные виды информации:

● библиографические данные (записи);

● фактографические данные (записи);

● полнотекстовые документы (записи);

● справочные данные (в том числе указатели);

● математические или численные (цифровые, табличные) данные;

● графические данные;

● мультимедийные данные.

Различают три типа задач, для которых создаются автоматизированные

информационные системы:

структурированные (формализуемые),

неструктурированные (не формализуемые),

частично структурированные.

Структурированная (формализуемая) задача – это задача, где

известны все еѐ элементы и взаимосвязи между ними.

В структурированной задаче удаѐтся выразить еѐ содержание в форме

математической модели, имеющей точный алгоритм решения. Подобные

задачи обычно приходится решать многократно, и они носят рутинный

характер. Целью использования АИС для решения структурированных задач

является полная автоматизация их решения, т. е. сведение роли человека к

нулю.

Неструктурированная (не формализуемая) задача – это задача, в

которой невозможно выделить элементы и установить между ними связи.

Решение неструктурированных задач из-за невозможности создания

математического описания и разработки их алгоритма связано с большими

трудностями. В этом случае возможности использования АИС невелики.

Решение принимается человеком на основе его опыта и, возможно косвенной

информации, полученной им из разных источников.

На практике существует сравнительно немного полностью

структурированных или совершенно неструктурированных задач. В

большинстве случаем можно сказать, что известна лишь часть элементов

задач и связей между ними. Такие задачи называются частично

структурированными. В этих условиях можно создать автоматизированную

информационную систему. Получаемая в ней информация анализируется

человеком. Более того, человек принимает участие и в функционировании

АИС.

По типам информации выделяют: документальные, фактографические,

документально-фактографические, мультимедийные и иные АИС.

Документальные АИС включают информационно-поисковые системы

(ИПС), информационно-логические и информационно-семантические

системы.

Фактографические АИС делятся на две категории:

1) системы обработки данных (СОД),

Page 3: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

2) автоматизированные информационные системы и

автоматизированные системы управления (АСУ).

Фактографическая АИС может превратиться в документальную и

наоборот, этим свойством обусловлено появление комбинированных

документально-фактографических АИС.

К документально-фактографическим АИС относят:

1) автоматизированные документально-фактографические

информационно-поисковые системы, например, научно-технической

информации (АДФИПС НТИ) и

2) автоматизированные документально-фактографические

информационно-поисковые системы (АДФИПС), например, входящие в

состав автоматизированной системы нормативно-методического обеспечения

управления (АСНМОУ).

К мультимедийным относят картографические, видео, аудио,

графические и другие АИС.

Существуют и такие АИС, как: бухгалтерские, банковские, АИС

управления (ИСУ), системы поддержки принятия решений (СППР),

экспертные системы (ЭС), гибридные экспертные системы (ГЭС), АИС

мониторинга (ИСМ) и др.

По степени доступности выделяют: общедоступные АИС и с

ограниченным доступом пользователей (также как и информационные

ресурсы). В последнем случае речь идѐт об управляемом доступе,

индивидуально определяющем не только набор доступных данных, но и

характер доступных пользователю операций.

По характеру использования информации различают:

● справочные и поисково-справочные,

● информационно-поисковые,

● информационно-справочные,

● информационно-решающие АИС.

Следует отметить, что наиболее часто АИС являются справочными и

широко используются в различных областях жизнедеятельности людей.

Справочные системы являются наиболее распространѐнным типом

функций АИС. Они предоставляют абонентам, а часто и

незарегистрированным пользователям, возможность получать

зафиксированные в системе и доступные им данные, то есть они просто

сообщают информацию («экспресс-информация», «09», реклама и др.).

Поисково-справочные системы предназначены для сбора, хранения и

поиска информации справочного характера. Такие системы не заменимы в

конкретных областях знаний: медицине, юриспруденции, программировании

и др.

Наиболее распространѐнным классом информационных систем

являются информационно-поисковые системы.

Информационно-поисковые системы вводят, систематизируют, хранят,

выдают информацию по запросам пользователя без сложных преобразований

данных. Более подробно они рассматриваются в следующих параграфах.

Page 4: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

Автоматизированные информационно-справочные системы (АИСС)

предназначены для сбора, хранения, поиска и выдачи в требуемом виде

потребителям информации справочного характера. В зависимости от

характера работы с информацией можно выделить следующие их виды:

автоматизированные архивы (АА);

автоматизированные системы делопроизводства (АСД);

автоматизированные справочники (АСп) и картотеки (AK);

автоматизированные системы ведения электронных карт местности

и другие.

Заметим, что автоматизированные картотеки с библиографическими

описаниями источников в библиотеках принято называть электронными

каталогами.

АИСС формируются с использованием технологий баз данных. Для их

создания, как правило, не требуется высокопроизводительная

вычислительная техника.

Существует множество разновидностей АИСС. Простота создания и

высокий положительный эффект применения определили их активное

использование во всех сферах профессиональной (в том числе и

управленческой) деятельности.

Обширный класс автоматизированных информационно-справочных

систем нашедших развитие в Интернете основан на использовании

гипертекстовых документов и мультимедиа.

Гипертекстовые информационно-справочные системы относятся к

классу гипертекстовых систем, позволяющих пользователям по

гиперссылкам легко и непринуждѐнно находить нужные им тексты,

документы, фрагменты документов, термины, графические и иные объекты.

Мультимедийные информационно-справочные системы представляют собой совокупность логически связанных текстовых,

графических, аудио- и видеоматериалов. Они широко применяются в

Интернет/Интранет структурах и обеспечивают доступ к базам данных на

Веб-сайтах и Веб-серверах.

Информационно-решающие системы осуществляют все операции

переработки информации по определѐнному алгоритму. Среди них проводят

классификацию по степени воздействия выработанной информации на

процесс принятия решений и выделяют два класса: управляющие и

советующие.

Управляющие АИС вырабатывают информацию, на основании которой

принимается решение, то есть выходной результат в них является не советом,

а управляющим воздействием на объект. Для этих систем характерны задачи

расчѐтного характера и обработка больших объѐмов данных.

Советующие АИС вырабатывают информацию, принимаемую

человеком к сведению и не требующую немедленных конкретных действий,

то есть они представляют варианты и оценки по различным критериям этих

вариантов. Такие системы обладают более высокой степенью интеллекта и

для них характерна обработка знаний, а не данных.

Page 5: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

Суда же можно отнести аналитические информационные системы.

Аналитическими системами принято называть АИС или компоненты

АИС, ориентированные на анализ находящихся в них данных.

Зачастую их называют системами поддержки принятия решений,

поскольку в большинстве случаев они ориентированы на оказание помощи

управляющему персоналу организации в принятии правильных и

своевременных решений. В России их часто называют «информационно-

аналитическими системами» (ИАС).

Анализ данных осуществляется при помощи современных

инструментов делового анализа данных. Например, ИАС мониторинга

предприятий может осуществлять: сбор первичной информации о состоянии

предприятий и организаций; финансово-экономический анализ и мониторинг

их текущего состояния и др. В мировой практике используются термины

«Business Intelligence» (BI), переведѐнный на русский язык как «деловой

интеллект» и «Business Analytics» (BA − бизнес-аналитика). При этом BI по

сути является базовым сегментом BA. Понятия объединяют различные

средства и технологии анализа и обработки данных масштаба предприятия, и

являются разновидностями интеллектуального анализа данных (ИАД).

Интеллектуальный анализ данных (англ. «Data Mining»)

представляет собой процесс поддержки принятия решений, основанный на

поиске в данных скрытых закономерностей (шаблонов информации).

Инструменты интеллектуального анализа данных используются

конечными пользователями (не программистами) для доступа к информации,

еѐ визуализации, выборки, многомерного анализа и формирования

предопределѐнных по форме и составу, а так же произвольных отчѐтов,

создаваемых управленцами, аналитиками и др.

Создание реально отвечающих целям и задачам организаций ИАС

является сложной задачей, включающей этапы формирования концепции,

проектирования, разработки, внедрения и сопровождения. Одним из

вариантов, используемым для решения подобных задач может быть

отечественная программа TextAnalyst – инструментарий семантического

анализа, навигации и поиска неструктурированных текстов.

Поскольку практически все АИС представляют собой базы или банки

данных, то по типу используемой модели данных выделяют три классических

класса БД: иерархические, сетевые, реляционные. Развитие технологий

обработки данных привело к появлению постреляционных,

объектноориентированных, многомерных БД, в той или иной степени

соответствующих упомянутым классическим моделям.

С точки зрения реализации процессов выделяют четыре типа АИС:

1) Охватывающий один процесс (операцию) в одной организации;

2) Объединяющий несколько процессов в одной организации;

3) Обеспечивающий функционирование одного процесса в масштабе

нескольких взаимодействующих организаций;

4) Осуществляющий работу нескольких процессов или систем в

масштабе нескольких организаций.

Page 6: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

Рис. 1.

При этом наиболее распространѐнными и перспективными считаются:

фактографические, документальные, интеллектуальные (экспертные) и

гипертекстовые АИС.

Удобство работы с АИС обеспечивают специальные рабочие места

различных категорий пользователей (в том числе работников), получившие

название АРМ.

Термин «автоматизированное рабочее место» (АРМ) математика и

инженера возникает в России с появлением первых отечественных

вычислительных машин серии «Мир» (Рис. 1).

АРМ – это набор аппаратуры на

рабочем места пользователя, как правило,

соединенной с другими ЭВМ,

предназначенный для быстрого и

качественного выполнения пользователем

своих функций; это также комплекс

средств, различных устройств и мебели,

предназначенных для решения конкретных

информационных задач.

В первой половине 1970-х годов за

рубежом появился термин «work station»,

смысл которого во многом совпадает с понятием АРМ.

Общими требованиями, предъявляемыми к АРМ, являются: удобство и

простота общения с ними, в том числе настройка АРМ под конкретного

пользователя и эргономичность конструкции; оперативность ввода,

обработки, размножения и поиска документов; возможность оперативного

обмена информацией между персоналом организации, с различными лицами

и организациями за еѐ пределами; безопасность для здоровья пользователя.

АРМ адаптируют под работу на нѐм конкретного работника, то есть на

использование АРМа как инструмента решения соответствующих задач без

дополнительного изучения способов и методов использования этого АРМ.

В 1980-е годы рабочие места библиотечных работников, оборудуемые

ЭВМ, стали называть АРМ библиотекаря и АРМ библиографа. При этом в

библиотеках получили распространение следующие АРМы: АРМ

библиотекаря; АРМ пользователя; АРМ комплектатора; АРМ библиографа;

АРМ администратора сети и др. Причѐм АРМ справочно-

библиографического обслуживания может быть ориентирован на ведение

поиска в локальном и удалѐнных ЭК, формирование различных

библиографических списков, и содержать кроме ОС и соответствующей

подсистемы АБИС, прикладные программы, предназначенные для обработки

текстов, формирования отчѐтов, справок и др.

Основные виды АИС, классифицируют по их масштабу. В этом

случае они делятся на:

одиночные;

групповые;

корпоративные,

Page 7: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

настольные;

сетевые;

масштаба предприятия.

Одиночные АИС реализуются, как правило, на автономном

персональном компьютере (сеть не используется). Такая система может

содержать несколько простых приложений, связанных общим

информационным фондом, и рассчитана на работу одного пользователя или

группы пользователей, разделяющих по времени одно рабочее место.

Подобные приложения создаются с помощью так называемых настольных

или локальных систем управления базами данных. Среди локальных СУБД

наиболее известны Clarion, Clipper, FoxPro, Paradox, dBase и Microsoft Access.

Групповые АИС ориентированы на коллективное использование

информации членами рабочей группы и чаще всего строятся на базе

локальной вычислительной сети. Однотипные или специализированные

рабочие места обеспечивают вызов одного или нескольких конкретных

приложений. Общий информационный фонд представляет собой базу данных

или совокупность файлов документов.

При разработке таких приложений для рабочих групп используются

серверы баз данных, называемые также SQL-серверами1. Существует

большое количество различных коммерческих и свободно распространяемых

SQL-серверов. Среди них наиболее известны такие серверы баз данных, как

Oracle, DB2, Microsoft SQL Server, InterBase, SQLBase, Sybase, Informix,

MySQL.

Корпоративные АИС являются развитием систем для рабочих групп.

Они ориентированы на крупные компании и могут поддерживать

территориально разнесѐнные узлы или сети.

Корпоративная АИС является системой, участниками которой может

быть ограниченный круг лиц, определѐнный еѐ владельцем или соглашением

участников этой системы. Главная особенность таких АИС заключается в

обеспечении доступа из подразделения к центральной или распределѐнной

базе данных организации помимо доступа к информационному фонду

рабочей группы.

АИС масштаба предприятия могут быть групповыми,

корпоративными и интегрированными. Отнесение их к тому или иному виду

связано с назначением, потребностями и возможностями предприятий

(корпораций, организаций, учреждений и т. п.), внедряющих и

использующих у себя АИС.

Всѐ чаще предприятиям требуется использование комплексных АИС с

общими данными (интегрированными информационными ресурсами),

направленных на выработку единых и эффективных процессов и методов их

применения. Очевидно, что объединение различных АИС должно привести к

их интеграции. При этом должна обеспечиваться интеграция любого

приложения в создаваемую или эксплуатируемую корпоративную

1 SQL (англ. «Structured Query Language») − язык структурированных запросов.

Page 8: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

информационную систему, а также используемых в такой системе различных

информационных ресурсов (ИР).

Под интеграцией информационных ресурсов понимается их

объединение с целью использования различной информации с сохранением

еѐ свойств, особенностей представления и пользовательских возможностей

манипулирования ей.

Объединение ресурсов может быть как физическим, так и

виртуальным. Главное – оно должно обеспечивать пользователю восприятие

доступной информации как единого (интегрированного) информационного

пространства.

Применительно к информационной среде интеграцию понимают как

объединение разнородных, порой территориально разъединѐнных,

аппаратных и программных средств, систем и устройств, как правило,

входящих в состав информационных сетей с доступными пользователям

внутренними и внешними ИР и приложениями. Кроме групповых сред

появляются и личные информационные системы, объединившие в рамках

одной технологии все функции поддержки и организации рабочего места,

например, для планирования рабочего времени, ведения адресно-

телефонного и других справочников.

Интегрированная АИС представляет собой совокупность

взаимосвязанных и хранящихся вместе данных при такой минимальной

избыточности, которая допускает их использование оптимальным образом

для одного или нескольких приложений и при этом обеспечивается

независимость данных от программ, а для актуализации данных используется

общий способ управления.

Интегрированным компьютерным системам необходимо поддерживать

единый способ представления данных и взаимодействия пользователей с

компонентами системы, обеспечивая информационные и вычислительные

потребности различных категорий пользователей.

Интеграция информационных систем обусловлена двумя основными

факторами:

1. потребностью сокращения дублетной информации и эффективного

применения связанных между собой отдельных АИС организации;

2) сетевым, и как правило, распределѐнным, использованием АИС.

Интеграция АИС включает использование: распределѐнных систем

обработки данных; технологии «клиент-сервер»; информационных

хранилищ; систем электронного документооборота; геоинформационных и

глобальные систем; систем групповой работы и корпоративных

информационных систем.

Информационный поиск и автоматизированные информационно-

поисковые системы

Поиск информации – это извлечение из каких-либо баз данных

хранимой в них информации.

Page 9: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

Поиск информации или информационный поиск представляет один из

основных информационных процессов. Важнейшей функцией любых ИСС

является предоставление пользователям осуществлять в них оперативный и

эффективный поиск необходимой им информации. Практически любая ИС

(не только ИСС) должна уметь отвечать на любые вопросы в своей

предметной области, находить нужную информацию, не просматривая все

записи.

Информационным поиском (ИП, англ. «information retrieval»)

называют некоторую последовательность операций, выполняемых с целью

отыскания документов, содержащих определѐнную информацию (с

последующей выдачей самих документов или их копий), или с целью выдачи

фактических данных, представляющих ответы на поставленные вопросы.

Информационный поиск определяется как нахождение в

информационном массиве документов, соответствующих информационному

запросу пользователей.

Считается, что первые средства поиска (навигации) в текстовой

информации появились в Библии. В 1247 году (Hugo de St. Caro) было

задействовано 500 монахов для составления конкорданса2 ключевых слов к

Библии. Затем, в средние века индексирование стало применяться в журналах

(журнальные индексы – Королевское научное общество, 1600 годы).

Собственно термин «информационный поиск» ввѐл американский

математик К. Муэрс. Он заметил, что побудительной причиной такого поиска

является информационная потребность, выраженная в форме

информационного запроса. К объектам информационного поиска К. Муэрс

отнѐс документы, сведения об их наличии и (или) местонахождении,

фактографическую информацию.

Решать проблемы фактографического поиска первыми стали

представители библиотек. Они разработали средства информационного

поиска, получившие название «справочно-поисковый аппарат» (каталоги,

библиографические указатели и др.). В профессиональной отечественной

печати данный термин используется с 1970-х годов.

Библиотекари определяют «информационный поиск» как нахождение

в информационном массиве документов, соответствующих

информационному запросу пользователей.

С точки зрения использования компьютерной техники

«информационный поиск» – это совокупность логических и технических

операций, осуществляемых в одной или нескольких базах (банках) данных, и

имеющих конечной целью нахождение релевантных запросу потребителя

документов, сведений о них, фактов и данных.

«Релевантность» – это устанавливаемое при информационном поиске

соответствие содержания документа информационному запросу или

поискового образа документа поисковому предписанию.

2 Конкорданс − перечень всех слов, входящих в некоторый текст, с указанием их

места в этом тексте.

Page 10: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

Однако, особенно это заметно при проведении поиска в Интернете,

пользователь может получить очень большое количество документов

(информации), даже релевантных его запросу. Поэтому эффективность

проведѐнного поиска характеризуется и таким понятием, как

«пертинентность».

Пертинентность – это соответствие содержания документа

(например, полученного в результате поиска) информационной потребности

конкретного специалиста.

Различают следующие зависимости ИП:

• от цели – адресный (формально-механический) и семантический

(тематический);

• от объекта поиска – документный и фактографический;

• от степени использования технических средств – ручной или

автоматизированный.

• от функциональной роли – доминирующие/второстепенные,

центральные/периферические, устойчивые/ситуативные потребности.

Легко заметить, что виды ИП пересекаются, а их цели и объекты часто

взаимосвязаны. Например, документный и фактографический виды поиска

могут быть как адресными, так и семантическими.

Выделяют два вида поиска информации:

1) поиск целостного объекта и

2) поиск по содержанию.

При этом результаты поиска характеризуются точностью и полнотой.

Точность поиска – это способность системы отфильтровывать все

нерелевантные документы.

Процесс поиска информации представляет последовательность шагов,

приводящих при посредстве системы к некоторому результату, и

позволяющих оценить его полноту.

Полнота поиска определяется способностью системы выдавать все

релевантные документы.

Обобщѐнно выделяют следующие методы поиска информации:

● непосредственное наблюдение;

● общение со специалистами по интересующему вопросу;

● чтение соответствующей литературы;

● просмотр видео, телепрограмм;

● прослушивание радиопередач, аудиокассет;

● работа в библиотеках и архивах;

● запрос к информационным системам, базам и банкам компьютерных

(электронных) данных;

● другие методы.

Актуальной проблемой нахождения для пользователей необходимой

им информации является организация эффективного автоматизированного

поиска. Упоминавшееся выше индексирование наибольшее распространение

получило в библиотеках для организации информационного поиска.

Первоначально оно отражалось в традиционных карточных каталогах,

Page 11: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

позволяя находить необходимые читателям материалы по автору, названию и

тематике. Автоматизация в библиотеках, в первую очередь, привела к

созданию электронных каталогов (ЭК), в которых для организации более

точного поиска запрашиваемых читателями документов появились поля

тематических и иных рубрик, а также ключевых слов.

После поиска документов по их автору и названию, широкое

распространение получил тематический поиск. Данное обстоятельство в

большей степени связано с тем, что в начале поиска пользователь, как

правило, имеет общее представление о своей информационной потребности.

Поэтому он формулирует запрос общего характера. Однако тематический

поиск применяется и по прямому назначению, когда необходимо отобрать

документы по определѐнной тематике, как правило, за определѐнный период,

а порой и конкретного автора. Дальнейшее развитие этого направления часто

связывают с включением в ЭК полей для организации электронного

тезауруса.

Обычно поисковые процессы включают четыре стадии:

1) формулировка (осуществляется до начала поиска);

2) начало поиска;

3) обзор полученных результатов;

4) модификация поиска (после обзора полученных результатов может

потребоваться уточняющий поиск).

Более удобная нелинейная схема поиска информации состоит из

следующих этапов:

1) фиксация информационной потребности на естественном языке;

2) выбор поисковых сервисов сети и формализация записи

информационной потребности на конкретных информационно-поисковых

языках;

3) выполнение созданных запросов;

4) предварительная обработка полученных списков ссылок на

документы;

5) обращение по выбранным адресам за искомыми документами;

6) предварительный просмотр содержимого найденных документов;

7) сохранение релевантных документов для последующего изучения;

8) извлечение из релевантных документов ссылок для расширения

запроса;

9) Изучение всего массива сохраненных документов;

10) возврат к первому этапу, если информационная потребность не

полностью удовлетворена.

Элементарной единицей информационного поиска, как правило,

является документ.

Очевидно, что хранящаяся в различных документах текстовая

информация в общем случае является слабо структурированной. Чтобы

можно было находить нужный пользователю документ, последний должен

включать некоторые специальные компоненты, позволяющие его

идентифицировать. С этой целью формирую поисковый образ документа.

Page 12: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

ИП проводится с помощью информационно-поисковых систем.

Структура процесса информационного поиска представлена на Рис. 2.

Стратегия ИП зависит от типа поисковой задачи, критериев выдачи и

характера диалога между потребителями информации и ИПС.

Терминологически «информационно-поисковая система» (англ.

«information retrieval system», IRS) представляет собой систему,

предназначенную для поиска и хранения информации; это также пакет

программного обеспечения, реализующий процессы создания, актуализации,

хранения и поиска в информационных базах и банках данных.

Рис. 2. Структура процесса информационного поиска

Методы поиска

Обычно ИП производится не по текстам документов, а по кратким

характеристикам содержания или определѐнным внешним признакам

документов. Для этого каждый документ снабжается поисковым образом

документа (ПОД) – характеристикой, кратко выражающей основное

смысловое содержание документа. Следовательно, для получения

необходимых пользователям документов им необходимо сформулировать

информационный запрос – поисковый образ запроса (ПОЗ), являющийся

такой же краткой характеристикой, поисковым предписанием. Таким

образом, процедура ИП сводится к сопоставлению ПОД с заданным ПОЗ.

Отметим, что простейшими ПОД являются заглавие документа и фамилия

его автора.

Методы поиска – это совокупность моделей и алгоритмов реализации

отдельных технологических этапов, таких, как построение поискового образа

запроса, отбор документов (сопоставление поисковых образов запросов и

документов), расширение и реформулирование запроса, локализация и

оценка выдачи.

Page 13: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

ПОЗ является формально описанной моделью информационной

потребности пользователя, поэтому ПОЗ и ПОД должны соответствовать друг

другу.

В ПОД основное смысловое содержание документа выражается в

краткой форме. Такой метод не может обеспечить нахождение всех

документов, содержащих требуемую информацию. При этом среди

найденных документов попадаются фактически не отвечающие на данный

информационный запрос. Эти документы образуют так называемый

«поисковый шум».

Определяющими для понимания методов автоматизации поиска

являются два следующих фактора:

1) сравниваются не сами объекты, а описания – так называемые

«поисковые образы»;

2) сам процесс является сложным (составным и не одноактным) и

обычно реализуется последовательностью операций.

Всѐ более важным становится организация «свободного» поиска по

содержанию документов. Наиболее часто он реализуется с помощью

контекстных операторов с «маскированием» задаваемых терминов

(усечением слов слева, в середине или справа). При автоматизированном

поиске наилучшие результаты достигаются, когда он осуществляется по ПОД

и (или) по их рефератам. В другом случае выписанные словосочетания и

слова сравниваются с фиксированным словарем. При этом слова,

ненайденные в словаре устраняются, а оставшиеся сортируются по алфавиту.

Типология видов поиска приведена в Таблице 2.

Таблица 2

Типология видов поиска

Вид

Поиска

Логическая модель

механизма поиска Состав ПОЗ

Предметный

(атрибутивный)

поиск

Поиск по логическому

выражению над именами

понятий, задаваемыми

терминами или их

комбинацией.

Термины документов,

отнесенные к

семантически заданным

полям.

Тематический

Поиск

Поиск по части известного

понятия, частично

задаваемым комбинацией

характеристических

признаков, с

использованием

накопленных ранее

результатов.

Термины документов и

дополнительных

поисковых структур –

тематических рубрик,

тезаурусов и т.п.,

отнесенные к

семантически заданным

полям.

Проблемный

Поиск

Поиск похожих документов,

и с использованием

технологии «обратной

связи».

Документы, входящие в

итеративно формируемое

пользователем

информационное

Page 14: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

пространство.

Предметному поиску соответствует ситуация формирования (выбора)

знака, устраняющего неопределѐнность знаковой системы в контексте

полноты и точности представления объекта, то есть такого знака, который

позволит эффективно выделить (отличить) объект из множества других при

фиксированном (единственном) концепте.

Для случая тематического поиска ситуация отличается тем, что

имеется упорядоченное ограниченное множество концептов, позволяющих

представлять объект в различных аспектах, а для случая проблемного поиска

имеется неупорядоченное и не жѐстко определѐнное множество концептов.

Большинство ИПС поддерживают механизм поиска по фразе,

операторы включения и исключения, а также булевы операторы. Кратко

рассмотрим их.

Поиск по фразе организуется заключением еѐ в кавычки. В результате

формируется команда выведения списка документов, содержащих только

данную фразу, а не отдельные слова или все слова фразы. Многие

современные ИПС включают такую возможность по умолчанию.

ИПС поддерживают использование специального символа усечения

(«*»), обозначающего неопределѐнность, усечение термина для поиска всех

терминов или фраз, начинающихся с определѐнного набора букв, например, с

другим окончанием. Обычно этот символ означает любое количество букв в

конце слова (правостороннее усечение).

Использование операторов включения (запись слов и всех их

вхождений в запросе) и исключения, а также организация поиска по фразе

позволяют повысить результативность поиска, например,

искусственный + интеллект (оператор включения);

искусственный + интеллект – игра (операторы включения и

исключения).

Для поиска информации в Интернете разработаны специальные

информационно-поисковые системы, содержащие средства организации

поиска (строку для поиска, тематический каталог, ссылки). Для вызова такой

системы пользователю достаточно ввести еѐ адрес в адресную строку

браузера. В Интернете используется несколько типов информационно-

поисковых языков (ИПЯ), например, координатные и булевы.

При координатном поиске запрос содержит список терминов,

называемых ключевыми словами. Этот список сравнивается со списками

терминов документов. Причѐм для каждого документа вычисляется степень

его соответствия запросу (формальная релевантность3), в соответствии с

которой все ссылки на документы ранжируются. В качестве ключевого

3 Формальная релевантность – наличие в документе контекстных ситуаций,

затребованных пользовательским запросом. Кроме формальной, выделяют

содержательную и индивидуально-прагматическую релевантность. Содержательная

релевантность – соответствие содержания документа информационной потребности

пользователя. Индивидуально-прагматической релевантностью называют

пертинентностью.

Page 15: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

термина можно использовать устойчивое словосочетание, например,

«Информационно-поисковая система», являющееся ключевой фразой или

ключевым словосочетанием. Для системы поиска оно не отличается от

обычного ключевого слова, поэтому, как правило, такой поиск считается

простым.

Булевы (логические) операторы «AND» («И»), «OR» («ИЛИ») и «NOT»

(«НЕТ») являются эквивалентом операторов включения, пересечения и

исключения. В таблице 3 приведены возможные варианты формирования

запросов.

Кроме того, существует оператор близости «NEAR» или символ «~»,

определяющий нахождение в тексте двух слов близко друг от друга (от

смежных до разделѐнных некоторым количеством слов, чаще в пределах 10

слов). Обычно он используется для координирования поиска при уточнении

поискового предписания запроса.

Операторы обладают разным приоритетом. В любом выражении

сначала выполняются оператор «NEAR», затем «NOT», потом «AND» и,

наконец, «OR». Чтобы изменить порядок операторов, используются

выражения с круглыми скобками подобно выполнению арифметических

операций. ИПС оценивает такое выражение слева направо, кроме тех слов,

которые заключены в скобки и будут восприняты первыми – то есть сначала

выполняется операция внутри скобок, затем – между ними. Например,

выражение:

(дисплей OR монитор) AND (Philips OR Samsung).

Таблица 3 Операторы для формирования запросов

Оператор Синонимы Комментарий

И

AND

или

&

Определяет поиск документов, содержащих оба

слова, соединѐнных оператором. Его можно и не

писать. Например, запрос «информатика и

учебник» эквивалентен запросу «информатика

учебник». Можно формировать запрос более чем

из двух слов, используя между ними оператор

«AND».

ИЛИ

OR

или

|

Позволяет вести поиск документов, содержащих

одновременно оба или одно из двух слов.

Используется по умолчанию.

НЕ

NOT

или

!

Используется для исключения нежелательных

документов. Пренебрегает документами,

содержащими слово после этого оператора.

" "

''

или

Двойные или одинарные кавычки используются

для поиска словосочетаний.

Дата= дата:

date=

Поиск ограничивается документами,

попадающими в заданный интервал дат.

Пример 1. валюта дата=01/07/2009–01/07/2010 –

поиск документов, содержащих слово «валюта» и

Page 16: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

имеющих дату от 1 июля 2009 года до 1 июля

2010 года. Аналогично можно составить запрос

«date=01/07/2010 валюта».

Согласно данным условиям поиска сначала запрашиваются документы,

содержащие слова «дисплей» или «монитор» и документы о фирмах, а затем

выполняется операция AND. В результате будут выданы документы,

содержащие информацию о дисплеях или мониторах, выпущенных фирмами

Philips или Samsung.

При булевом поиске слова и фразы соединяются операторами булевой

алгебры («логическими коннекторами»). Например, в запросе использованы

следующие слова и словосочетания «World Wide Web», «Web»,

«технология». Для осуществления их поиска можно построить запросы,

содержащие два слова (например, «Web and технология»), или «технология

not Web», или «Web or технология» и даже «not (Web & технология)». В

последнем случае речь идѐт о поиске документов, не содержащих ни одного

из указанных в запросе терминов. Кроме логических коннекторов в

некоторых ИПС можно использовать позиционные коннекторы,

учитывающие взаимное расположение слов в тексте относительно друг

друга.

В любой поисковой системе можно получить сведения о том, как в ней

составлять строку запроса.

При простом запросе достаточно ввести одно или несколько слов,

определяющих тему поиска. При этом, как правило, регистр букв

игнорируется.

В запросе можно использовать символы «*» или «?».

Знак «?» в ключевом слове заменяет один символ, на место которого

может быть подставлена любая буква, а знак «*» – последовательность

символов. Например, запрос «информат*» позволит найти документы,

включающие слова «информатика», «информационный», «информативный»

и др.

При формировании запроса для получения более определѐнной

информации часто возникает необходимость комбинирования ключевых

слов. Для этого используют сложный запрос, включающий дополнительные

слова-связки, функции, операторы, символы, разделенные скобками

комбинации операторов. Например, запрос музыка & (beatles OR битлз)

будет означать, что пользователь ищет документы, содержащие слова музыка

и beatles или музыка и битлз. Особенностью размещѐнной в Интернете

информации является еѐ распределѐнность и изменчивость, избыточность и

разнородность, неструктурированность или слабая структурированность

данных.

В расширенной булевской модели взамен бинарных величин термины в

документах и запросах описываются весовыми коэффициентами (значимость

или статистическая оценка). Кроме того, используется аппарат нечѐтких

множеств, т.е. степень принадлежности элемента к множеству задаѐтся

Page 17: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

величиной из интервала [0,1]. Причѐм степень принадлежности элементов

может использоваться для ранжирования результатов запроса.

Достоинство этих моделей в простоте, легко понимаемой структуре

запроса и простоте реализации.

К недостаткам относят: неэффективность описания сложных запросов

(результатов запроса слишком много или слишком мало), проблематичность

ранжирования результатов. При этом следует отметить, что около 80%

запросов не содержат операторов.

Современные поисковые модели включают характеристики

документов (например, можно поводить расчѐт частоты встречаемости

терминов – весовая характеристика) и запроса. Можно предположить, что

лингвистическое подобие документа и запроса подразумевает тематическое

подобие, т. е. выражает фактически релевантность документа.

Существует способ, при котором выбор лексических единиц и

исходного текста производится на основе статистической обработки текста,

слова которого рассматриваются как знаки, не имеющие семантических

значений.

Используется и способ контроля индексирования заданным словарем,

при этом каждое слово исходного текста сравнивается со словарем.

Совпадающие слова или их дескрипторы записываются в поисковый образ.

Выделяют одноаспектное (по одному признаку) и многоаспектное

(параллельно по нескольким признакам) индексирование.

Для поиска в библиотечных сетевых базах данных зачастую

используют поле «Базы данных», позволяет сократить количество

просматриваемых ресурсов. При этом обычно специалисты «выделяют три

способа выбора БД:

а) Выбор из раскрывающегося списка, характерный для большинства

сетевых каталогов. В этом случае пользователь мышью выбирает (выделяет)

нужную организацию или несколько организаций (при этом следует

удерживать нажатой клавишу «Ctrl») и поиск происходит только по этим БД

(по умолчанию выбраны все). Такой способ выбора представлен в

АРБИКОНе.

б) Выбор из представленного списка, когда пользователь галочкой

отмечает нужные базы данных (по умолчанию ни одна из них не выбрана).

Такой способ выбора БД представлен на сайте Корпоративной сети

публичных московских библиотек.

в) Выбор по результатам поиска…»4.

.

4 Беркутова, Л. Интернет в библиотечной работе: технологии и методы

использования/Ляля Беркутова, Елена Панкова [Электронный ресурс]/1 сентября, №20,

2009.‒Режим доступа: http://lib.1september.ru/view_article1.php?id=200901914.

Page 18: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

Для проведения документального поиска используют различные

алгоритмы: полнотекстовое сканирование, файлы сигнатур, инверсия,

кластеризация, обработка естественного языка (англ. «Natural Language

Processing», NLP), латентно-семантическое индексирование (LSI). Кратко

рассмотрим их.

Полнотекстовое сканирование заключается в поиске всех

документов, содержащих искомую строку, представляющую собой

последовательность символов.

Простейший вариант алгоритма включается в себя: посимвольное

сравнение искомой строки с соответствующими символами документа. В

случае несовпадения выполняется сдвиг искомой строки относительно

документа вправо на одну позицию. Цикл повторяется до тех пор, пока в

любой позиции документа не будет найдена искомая строка, или не будет

достигнут конец документа. Данный вариант алгоритма является очень

медленным, однако имеются и более быстрые его алгоритмы.

Файлы сигнатур. В этом алгоритме все термины документа

представляются в виде битовых последовательностей, полученных в

результате применения хэш-функции к исходным строкам-терминам.

Сигнатуры документов размещаются последовательно в отдельном файле –

файле сигнатур.

Данный подход позволяет уменьшить исходный размер файла и

ускорить поиск.

Инверсия подразумевает, что каждый документ представляется

списком терминов, которые хранятся упорядоченными в алфавитном порядке

в индексном файле. Для каждого термина в данном файле имеется указатель

на список содержащих его документов.

Для ускорения поиска при организации индексного файла

используются B-деревья, хэширование и другие подходы.

Кластеризация. Основой этого метода является кластерная гипотеза,

согласно которой тесно связанные между собой документы оказываются

релевантными по отношению к тем же запросам. Кластеризацию можно

применять для распределения документов в коллекции по классам

(автоматической классификации), что позволяет повысить скорость поиска

документов и точность ответа. Также еѐ можно использоваться для

улучшения представления результатов поиска на основе приведѐнных ранее

алгоритмов. Она включает две процедуры: генерацию кластеров и поиск

кластеров по запросу пользователя. Причѐм инвертированный список можно

рассматривать как одну из форм кластеризации документов.

Использование семантической информации включает методы,

основанные на применении грамматического анализа, семантической

информации и NLP в общем; а также латентно-семантическое

индексирование и методы, использующие нейронные сети.

Обработка естественного языка (NLP) заключается в повышении

эффективности путѐм сопоставления семантического содержания запросов

семантическому содержанию документов. Вместо терминов могут

Page 19: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

использоваться целые фразы, расширяется поиск за счѐт привлечения

близких терминов/понятий и можно использовать контролируемый словарь.

Латентно-семантическое индексирование (LSI) является

реализацией двухмодового факторного анализа, позволяющего выявлять

значения/модели, лежащие в основе больших массивов наблюдаемых

данных. Содержащиеся в запросе термины часто не совпадают с

используемыми авторами документов по интересующей тематике. В данном

алгоритме термины и документы представляются в виде векторов в

пространстве «выбираемой» размерности.

Программное обеспечение, использующее элементы вычислительной

лингвистики, появилось на ряде сайтов в Интернете, например, «Анализатор

текста» (http://topwords.lgg.ru/atext/). Оно предназначено для анализа и

составления из введѐнного пользователем текста списка ключевых слов,

ранжируемых по весовому коэффициенту. Если из этого списка выбрать

несколько словоформ, то по ним программа выполнит автоматическое

реферирование и тематическую фиксацию анализируемого текста. В

результате пользователь получает список наиболее значимых предложений

исходного текста.

При этом возникает прецедент, когда, во-первых, отпадает потребность

вводить ключевые слова и создавать специальные электронные рубрикаторы.

Во-вторых, автоматическое реферирование машиночитаемого текста

способствует созданию рефератов документов, что само по себе весьма

значимо особенно для научных, учебных, технических и иных

профессиональных материалов.

В-третьих, такие рефераты можно включать в соответствующие поля

библиографических записей в электронных базах и банках данных (в т.ч.

Электронных каталогов), что будет способствовать максимальному

раскрытию фондов библиотек и не перегрузит аппаратные средства

большими объѐмами машиночитаемых данных. Более того, поиск будет

естественно проходить быстрее, чем при извлечении необходимых сведений

из полных текстов.

В-четвертых, при этом не возникают проблемы с авторским правом,

так как на серверах в открытом доступе будут не полные тексты документов,

а их рефераты.

В-пятых, поиск по ключевым словам, образующим такие рефераты в

сочетании с включенными в тексты метаданными может значительно

улучшить ситуацию с релевантностью.

В-шестых, можно, используя эти рефераты, отказаться от описания

определѐнного количества полей (тэгов) метаданных в гипертекстовых

документах.

И, наконец, в-седьмых, такое решение снимает значительный груз

забот и работ систематизаторов и библиографов при описании документов и

создании соответствующих библиографических записей в ЭК их библиотек.

Page 20: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

Оценкой методов информационного поиска с русскоязычной

информацией в России занимаются различные организации и специалисты,

например, РОМИП (http://romip.narod.ru/).

Важной также является оценка стоимости (себестоимости)

проведѐнного поиска.

Себестоимость запроса рассчитывается как отношение общего объѐма

затрат на создание и поддержку работоспособности ИПС в единицу времени

(например, за год) к количеству запросов, обрабатываемых ИПС за то же

время.

Обработка результатов поиска

С точки зрения ИПС результат поиска в ней есть совокупность

(подмножество) найденных документов или ссылок на них, обычно

представляемых пользователю в виде списка. После получения

пользователем в результате поиска подмножества документов, он выявляет

среди них наиболее релевантные, а затем и пертинентные. При этом наиболее

часто встречаются следующие ситуации:

1. Отсутствие в исследуемом сегменте искомой информации. В этом

случае переходят к другому сегменту, т. е., например, исследуют

информационные ресурсы, созданные на других языках.

2. Найденные ссылки содержат информацию по иной тематике, может

быть даже близкой к искомой.

3. Обнаружено слишком большое количество информационных

ресурсов.

Полученный в результате поиска список ссылок в виде полных или

частичных библиографических описаний (БО), найденных ИР можно тут же

распечатать или послать на какой-либо адрес электронной почты, если такая

возможность предоставляется ИПС и пользователь подключѐн к Интернету.

Обычно оказывается, что полученных документов или ссылок на них

больше чем надо, а также, что некоторые из них не отвечают требованиям

пользователя, сформировавшего данный запрос. Хотя около 80%

пользователей не пытаются изменить запрос, в полученной выборке можно

провести уточняющий запрос или осуществить его модификацию.

Модификация запросов подразумевает переформулировку запроса с

целью его расширения, добавления терминов в запрос для уточнения

информационной потребности.

Используемые для реализации информационных потребностей

поисковые средства и технологии, с одной стороны, определяются типом и

состоянием решаемой пользователем задачи – соотношением его знания и

незнания об исследуемом объекте. С другой стороны, процесс

взаимодействия пользователя с АИС обусловлен уровнем знания

(профессионализмом) пользователем функциональных возможностей данной

и подобных систем.

В последних двух случаях обычно осуществляют перебор найденных

документов с целью определения степени близости их к исходному запросу.

Page 21: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

Для сокращения объѐма рассматриваемых материалов обычно проводят

фильтрацию результатов поиска по различным основаниям. Например,

можно осуществить фильтрацию по типу источников, заранее предполагая,

что искомые документы располагаются на коммерческих сайтах или на

серверах.

Критерии оценки результатов поиска

Критерием результата поиска является получение пользователем

списка документов, одного документа или их частей, максимально

удовлетворяющего его потребностям, сформулированным в поисковом

запросе. В ИПС принято формировать список полученных в результате

поиска документов по их релевантности. Различают критерии смыслового и

формального соответствия между поисковым предписанием и выдаваемым

документом.

Полнота и точность поиска являются взаимосвязанными показателями.

Увеличение одного из них ведѐт к снижению другого. Следует учитывать

ситуацию, при которой список выданных поисковой системой ссылок

содержит несколько, а порой и десятки разных адресов с одним и тем же

текстом. Подобные ссылки характеризуются как дубликаты.

Причѐм важной компонентой найденных искомых документов является

их достоверность, точнее достоверность хранящейся в них информации.

Автоматизация поиска информации в АИС основывается на

технологии индексирования документов.

Заметим, что ИПС фактически являются системами информационного

обеспечения и представляют собой базы и банки данных. В качестве таковых

можно представить картотеки и каталоги, адресные и иные справочники,

указатели, энциклопедии, справочный аппарат к изданиям и другие

материалы.

Автоматизированная информационно-поисковая система (АИПС) –

это программный продукт, предназначенный для реализации процессов ввода,

обработки, хранения, поиска, представления данных т. п.

АИПС, с точки зрения выполняемых задач и представляемых

пользователям возможностей, могут быть как достаточно простыми

(элементарные справочные), так и весьма сложными системами (экспертные

и другие, предоставляющие прогностические решения).

Удачная разработка базы данных АИС обеспечивает простоту еѐ

поддержания.

АИС бывают различного назначения.

По характеру обрабатываемой информации они делятся на:

управленческие, информационно-справочные, фактографические,

документальные и иные.

В свою очередь каждая из них может иметь собственные

разновидности. Так, например, информационно-справочные системы могут

быть непосредственного или удалѐнного доступа (информаторы и различные

табло на вокзалах и в библиотеках, телефонные и иные автоматические

справочные системы, например, в Интернете и др.).

Page 22: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

Управленческие АИС предназначены для решения управленческих и

технико-экономических задач. Обычно они функционируют как отдельные

модули в рамках общей автоматизированной системы организации для

решения задач отдельных служб: собственно управления организацией,

бухгалтерского учѐта, отдела кадров, материально-технического снабжения и

т. п. Чаще всего они автономны, то есть имеют собственные

информационный фонд и программное обеспечение.

Информационно-справочные системы (ИСС) предназначены для

удовлетворения запросов пользователей. Найденная в соответствии с

запросом информация выдаѐтся пользователю, который и распоряжается еѐ в

своих целях вне самой АИС. Это, например, справочно-библиографические

системы, а также различные автоматические информаторы. Основной

операцией в подобных системах является поиск, поэтому они относятся к

классу исключительно информационно-поисковых систем.

С точки зрения пользователей, обычно обращение их к любым

информационным системам обусловлено потребностью получения

оперативных данных, как правило, справочного характера, а также

постоянного или временного пользования документами.

Фактографические АИПС обычно используют табличные реляционные

БД с фиксированной структурой данных (записей). Хранимая и

обрабатываемая информация в них представляет сведения фактического

характера (справочные, статистические, социальные данные и т.п.). Часто эта

информация требует оперативного обновления.

Документальные АИПС отличаются неопределѐнностью или

переменной структурой данных (документов). Для их разработки обычно

применяются оболочки АИС. Объектами обработки являются определѐнные

документы (книги, статьи и другие информационные материалы).

АИПС используют компьютерные программно-технические средства и

технологии и предназначаются для нахождения и выдачи пользователям

информации по заданным критериям.

АИПС (в библиотеках их называют «Автоматизированная

библиотечная информационная система» или «Автоматизированная

информационно-библиотечная система») обычно состоит из реляционной

базы данных, программного обеспечения, которое взаимодействует с базой

данных, и двух графических пользовательских интерфейсов (один для

пользователей, второй для персонала).

Информационно-поисковые системы находят широкое применение в

библиотеках. При этом в некоторых выступлениях и публикациях

специалистов зачастую можно встретить сообщение, что осуществляется

автоматизация библиотек.

Употребление термина «автоматизация библиотек» в большинстве

случаев некорректно, ибо у слушателей или читателей может сложиться

мнение, что речь идѐт о библиотеках-автоматах. Таковые можно создать,

если речь идѐт о формировании полностью автоматизированных

электронных библиотек, потребность в которых окончательно не определена,

Page 23: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

хотя некоторые прототипы существуют.

В нашем случае уместно говорить об автоматизации библиотечно-

библиографических и информационных процессов, которая при правильной

организации мероприятий способна создать комфортные условия для работы

библиотекарей, облегчать выполнение ряда рутинных операций,

обеспечивать конвейерную обработку документов, выдачу пользователям в

минимально короткие сроки релевантной и пертинентной информации и, как

следствие и основная задача любых библиотек, организовать эффективное и

оперативное обслуживание пользователей.

Существуют и иные классификации АИС. Так, АИС в зависимости от

уровня обслуживания производственных процессов на предприятии можно

отнести к трѐм классам:

Класс A – системы (подсистемы) управления технологическими

объектами и (или) процессами.

Класс B – системы (подсистемы) подготовки и учѐта производственной

деятельности предприятия.

Класс C – системы (подсистемы) планирования и анализа

производственной деятельности предприятия.

Системы (подсистемы) класса A, предназначены для контроля и

управления технологическими объектами и (или) процессами и, как правило,

характеризуются следующими свойствами:

● высоким уровнем автоматизации выполняемых функций;

● наличием явно выраженной функции контроля за текущим

состоянием объекта управления;

● наличием контура обратной связи;

● малым интервалом времени для обработки данных;

● слабой временной зависимостью (корреляцией) между динамически

изменяющимися состояниями объектов управления и системы (подсистемы)

управления.

Объектами контроля и управления такой системы выступают:

● технологическое оборудование;

● датчики;

● исполнительные устройства и механизмы.

Примерами систем класса A являются: SCADA (англ. «Supervisory

Control And Data Acquisition» – диспетчерский контроль и накопление

данных), DCS (англ. «Distributed Control Systems» – распределѐнная система

управления), Batch Control (система последовательного управления), АСУ

ТП – автоматизированная система управления технологическими процессами

и др.

Системы (подсистемы) класса B используются для подготовки и учѐта

производственной деятельности предприятия. С их помощью выполняют

задачи, требующие непосредственного участия человека для принятия

оперативных решений, влияющих на ограниченный круг видов деятельности

Page 24: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

или небольшой период работы предприятия. Такие системы могут быть

напрямую не связанными с технологией. Они включают задачи, связанные:

с выполнением возникающих в деятельности предприятия учѐтных

задач;

со сбором, предварительной подготовкой поступающих в АИС

данных из систем класса A, и их передачей в системы класса C;

с подготовкой данных и заданий для автоматического исполнения

задач системами класса A.

С учѐтом прикладных функций системы класса В могут осуществлять:

управление производственными и человеческими ресурсами в

рамках принятого технологического процесса;

планирование и контроль последовательности операций единого

технологического процесса;

управление качеством продукции;

управление хранением исходных материалов и произведенной

продукции по технологическим подразделениям;

управление техническим обслуживанием и ремонтом.

Примерами таких систем являются: MES (англ. «Manufacturing

Execution Systems» – система управления производством), MRP (англ.

«Material Requirements Planning» – система планирования потребностей в

материалах), MRP II (англ. «Manufacturing Resource Planning» – система

планирования ресурсов производства), CRP (англ. «Computing Resource

Planning – система планирования производственных мощностей), CAD (англ.

«Computing Aided Design» – автоматизированная система проектирования,

САПР), CAM (англ. «Computing Aided Manufacturing» – автоматизированная

система поддержки производства), CAE (англ. «Computing Aided

Engineering» – автоматизированная система инженерного проектирования,

САПР), PDM (англ. «Product Data Management» – автоматизированная

система управления данными), SRM (англ. «Customer Relationship

Management» – система управления взаимоотношениями с клиентами),

различные учѐтные системы и т. п.

Системы (подсистемы) класса C ориентированы на планирование и

анализ производственной деятельности предприятия. Они предназначены для

выполнения задач, требующих непосредственного участия человека для

принятия стратегических решений, оказывающих влияние на деятельность

предприятия в целом.

Эти системы решают следующие задачи:

анализа деятельности предприятия на основе данных и информации,

поступающей из систем класса B;

планирования деятельности предприятия;

регулирования глобальных параметров работы предприятия;

планирования и распределения ресурсов предприятия;

подготовки производственных заданий и контроль их исполнения;

взаимодействия с управляющим субъектом (персоналом), при

выполнении стоящих перед ними задач;

Page 25: Тема 1 2. Виды и свойства АИС В этой теме ...laleshin.narod.ru/pto/T-1-2.pdf · 2013-04-03 · Тема 1-2.Виды и свойства АИС В этой

интерактивной обработки информации;

связанные с повышенной длительностью обработки данных (от

нескольких минут до несколько часов или суток);

связанные с длительным периодом принятия управляющего

решения;

связанные с наличием существенных временной и параметрической

зависимостей (корреляций) между обрабатываемыми данными;

связанные с влиянием на деятельность предприятия в целом;

оказывающие влияние на значительный период работы предприятия

(от полугода до нескольких лет);

непосредственного сопряжения с системами класса B.

К ним относятся: ERP (англ. «Enterprise Resource Planning» –

планирование ресурсов предприятия), IRP (англ. «Intelligent Resource

Planning» – системы интеллектуального планирования), АСУП и др.