Upload
kylynn-jones
View
100
Download
0
Embed Size (px)
DESCRIPTION
Итоги и перспективы проектной деятельности АРБИКОН. Племнек Александр Иванович, Ассоциация региональных библиотечных консорциумов (АРБИКОН) Корпоративные библиотечные системы: технологии и инновации 23-29 июня 2008 г . Россия, Финляндия, Швеция. История вопроса. - PowerPoint PPT Presentation
Citation preview
Итоги и перспективы проектной
деятельности АРБИКОНПлемнек Александр Иванович,
Ассоциация региональных библиотечных
консорциумов (АРБИКОН)
Корпоративные библиотечные системы: технологии и инновации
23-29 июня 2008 г.
Россия, Финляндия, Швеция
История вопросаAlvin Toffler(*) обращает наше внимание на тот факт, что «…если
последние 50 000 лет существования человека разделить на отрезки жизни приблизительно в 62 года каждый, то окажется около 800 таких отрезков жизни.
Из этих 800 полных 650 прошли в пещерах. Только за последние 70 таких отрезков жизни стало возможным
эффективно передавать информацию от одного поколения к другому благодаря письменности.
Только в последние шесть отрезков жизни люди использовали печатное слово.
Только за последние четыре стало возможным измерить время с требуемой степенью точности.
Только в последние два использовался электрический двигатель. И подавляющее большинство всех материальных благ, которыми
мы пользуемся в повседневной жизни в настоящее время, были придуманы в течение настоящего, 800-го отрезка жизни».
* Амер социолог и футуролог один из авторов концепции “сверхиндустриальной цивилизации”
Справка
Кило = 10(3) 1KB = 1024B 2(10)
Мега = 10(6) 1MB = 1024KB 2(20)
Гига = 10(9) 1GB = 1024MB 2(30)
Тера = 10(12) 1TB = 1024GB 2(40)
Пета = 10(15) 1PB = 1024TB 2(50)
Экзо = 10(18) 1EB = 1024PB 2(60)
Зетта = 10(21) 1ZB = 1024EB 2(70)
Йотта = 10(24) 1JB = 1024ZB 2(80)
Насколько реальна угроза информационного беспредела?
Информационный бумажный беспредел перешел в информационный цифровой беспредел
Почему возникает проблема объемов информации?
1. Началась эра исследований с высокой скоростью порождения данных
2. Глобальное большинство информации появляется в цифровом виде
3. Данные порождаются в полуавтоматическом либо полностью автоматическом режиме
Информация к размышлению
В 1996 году пользователей Интернет – 48 Млн. человек
В 2006 году пользователей Интернет – 1 100 Млн. человек
К 2010 году ожидается 1 600 Млн. человек
Сегодня темпы роста производства информации в цифровом виде в развивающихся странах выше на 30-40%
Информация к размышлению
В 2002 году суммарный объем:
Cохраненной информации включая бумажные носители, пленки, ленты и пр. составил 5 EB (пять миллиардов миллиардов байт). Из них 92% сохранены на магнитных носителях (50% диски, 42% ленты(фото, аудио, видео))
Переданной по сетям информации составил 18 EB. Из них 97% - телефонные разговоры, 2% - трафик Интернет, <1% CD&DVD
* В исследовании не учитывалось тиражирование информации – только однократная публикация
В 2006 году объем сохраненной информации составил уже 161 EB В 2010 году ожидается увеличение объема до 988 EB что
составляет 6 кратный прирост
Предполагаемый профиль сохраняемого информационного массива к 2010 году
Из 998 EB в 2010 году:
Прирост новой информации составит 25%
Неструктурированная информация составит 95% (мультимедия, нетекстовое представление)
70% новой информации будет создано отдельными пользователями
85% данных будет находиться в институциональных хранилищах и будет контролироваться фирмами (что приведет к решительному изменению системы работы с информацией как в процессе производства так и в процессе использования)
НЕОБХОДИМОСТЬ СМЕНЫ ПАРАДИГМЫ
Библиотеки и читатели в информационном контексте
Совокупный объем информации на бумажных носителях всех видов составляет 0.001% от учтенного общего объема информации (причем эта доля учитывалась не в форме текста а в форме изображения страниц с разрешением 600 точек на дюйм). Большинство из этих документов составляют офисные.
КНИГИ составляют всего 2.4% от 0.001% (в сканированном виде)
БУМАГА – самый дорогой из современных носителей Читающий человек за всю жизнь потребляет максимум 1GB
информации в текстовом формате За год в мире порождается 4 TB информации в текстовом виде
Феномен открытых информационных массивов
1. Новые научные инструменты
Большой Адронный Коллайдер(CERN) генерирует 1.5GB в секунду, что приводит к порождению 1 EB в день! Для сохранения используется дисковый массив площадью 1 кв.км.
2. Новые научные модели
Раскрытие генома человека потребовало анализа 1 Млрд. цепочек
Глобальные модели климата
3. Новые научные коллективы
Для изучения генома мухи дрозофилы создано 195 научных коллективов
4. Новые знания о свойствах больших информационных массивов
Большинство открытий из наблюдений телескопа Hubble сделано при анализе открытых массивов
Мы уже находимся в состоянии кризиса Скорость порождения информации не позволяет
производить даже грубый отбор Современные технологии уже не справляются с
необходимостью регистрации информационного потока
Хранение информации требует существенных затрат
В ряде случаев стоимость затрат на репозитарное хранение значительно превышает стоимость самой информации
Практически не решена проблема сохранности и архивации. Уже были прецеденты потери значительных объемов информации
Человечество не успевает осмыслить накопленные объемы информации
Некоторые факты Уже накоплены значительные информационные массивы – так
банк данных о солнечной системе содержит более 1 миллиарда документов (примерно 250.000 документов о каждой планете). В США есть архивы превышающие 100PB(аэропорты, медклиники, морские порты, военные архивы). Архивы France Telecom превысили 25 PB. Объем цифровой библиотеки LC на сегодня составляет 7 PB
Зачастую извлечение информации из цифровых библиотек занимает часы
Ненадежность устройств хранения влечет проблему логической и физической миграции данных практически не разрешенную на сегодня.
Новые данные порождаются быстрее, чем осуществляется перезапись старых данных
Все чаще термин “архивное хранение” подразумевает ВЕЧНОЕ ХРАНЕНИЕ
Хранение – дорогое удовольствие
Факты Дилемма с дисками –
На сегодня максимальный объем диска = 1 TB. 1PB можно записать примерно на 1200 дисков. Диск потребляет 15 ВТ в час. Таким образом 1200 дисков потребляют 18 КВт в час по цене 0.32 USD = $5.76. За 10 лет - 87.600 часов => 504,576.00 USD
Учитываем примерно равные затраты на охлаждение -- получаем 1,000,000 .00USD
По теореме Мура сумму можно удвоить.
ИТОГО примерно: 2,000,000.00 USD
Факты Дилемма с сохранностью – срок службы носителей
определяет время сохранности.
Срок службы дисков – 5 лет!
Срок службы лент – 7-10 лет (требуется перемотка до 4 раз за этот срок)!
Срок жизни информации от 1 дня до пожизненного. Прочие носители
Папирусы – более 3000 лет.
Низкокислотная бумага – книги Гутенберга живы.
Фотопленка – 140 лет и остаются в приемлемом состоянии
Живопись – 21000 лет и сохраняется в нормальном состоянии (Французские пещеры)
Тенденция изменения стоимости различных систем хранения
Реальность
Необходимость перезаписи архивов каждые 5-7 лет
Время перезаписи в ряде случаев превышает недели и месяцы
Скорость поступления новых данных выше, чем скорость перезаписи архивов
Процесс миграции данных бесконечен, что влечет бесконечные финансовые траты
На сегодня только дисковые массивы гарантируют 100% корректную миграцию информационных массивов
Лавина информации: бедствие или шествие свободы?
Одна из возможных тем для обсуждения на конференции АРБИКОН
Тенденции Использование интеллектуальных обьектно-
ориентированных хранилищь Переход к глобальному сетевому сервису
хранения(архивирования) данных Использование больших файлов(сейчас терабайты,
в перспективе петабайты) Увеличение количества файлов Хранение информации в сети Широкое использование GRID – технологий
Таким образом мы стремимся к обеспечению прозрачного и унифицированного доступа на логическом уровне к гетерогенным информационным ресурсам распределенным в сети
Наше “библиотечное” будущее – БИБЛИОГРИД?
GRID дает возможность объединить вычислительные ресурсы в единое множество и управлять этим множеством как единой системой, что снижает затраты на администрирование. Поскольку невозможно администрировать программное обеспечение на сотнях и тысячах компьютеров одновременно, реализуется целая инфраструктура самонастройки, самотестирования, самоконфигурации. Т.е. необходимость сложного администрирования отдельных узлов отпадает и это тоже снижает затраты на администрирование. Управление всей GRID системой возможно "с единого пульта«
Grid не следует рассматривать как абсолютно новую и не совместимую с существующими технологию, напротив, Grid может успешно использоваться как дополнение к уже существующим протоколам и сервисам для предоставления и получения более качественных услуг в рамках чёткой стандартной модели.
Технологические требования, предъявляемые к Grid, определены следующим образом:
1. Гибкие отношения доступа (client-server, peer-to-peer). 2. Чёткий высокоуровневый контроль над использованием
ресурсов. 3. Многоуровневый контроль прав доступа, локальные и
глобальные политики доступа. 4. Поддержка распределения различных ресурсов - программ,
данных, устройств, вычислительных мощностей. 5. Поддержка различных моделей пользования -
многопользовательской, однопользовательской, режимов performance-sensitive и cost-sensitive.
6. Контроль над качеством предоставляемых услуг, планирование, резервное предоставление услуг.
ВАМ это ничего не напоминает???
Глобальные проекты, косорциумы стран
Итог 10 лет сотрудничества
1 этап (1996 – 2003) – создание инфраструктуры распределенной корпоративной библиотечной сети России
2 этап (2003 -- 2006) – стабилизация межкорпоративной базовой (универсальной) инфраструктуры
3 этап (2006 -- ) – переход к специализированным сервисам на основе базовой инфраструктуры (Реорганизация АРБИКОН)
Направления реорганизации-1
признать созданную базовую инфраструктуру основой для развития корпоративных сервисов АРБИКОН;
дать возможность каждому члену АРБИКОН участвовать только в тех направлениях, которые совпадают с целями и задачами данной конкретной организации;
ввести проектный принцип в развитие новых сервисов, когда заинтересованные организации объединяются для развития нового корпоративного сервиса;
Направления реорганизации -2
отойти от принципа общедоступности всех ресурсов и сервисов– теперь доступными и бесплатными для библиотеки становились сервисы только тех проектов, в которых она участвует, а так же базовый сервис распределенного поиска и заимствования БЗ между партнерами ассоциации;
сделать проекты АРБИКОН открытыми для участия организаций, не являющихся членами АРБИКОН;
ресурсы и сервисы проектов АРБИКОН сделать доступными для внешних пользователей, при этом члены АРБИКОН имеют льготу на их использование.
Основные принципы функционирования проектов АРБИКОН
Интеграция через специализацию – каждая организация обеспечивает качественно подготовленный ИР по своей отрасли знаний
Специализация через интеграцию – каждая организация использует ресурсы партнеров для формирования полного виртуального фонда по своей отрасли знаний
Однократный ввод и многократное использование - минимизация дублирования при создании, вводе и описании ИР
Cервисы проектов
Проект МАРС (межрегиональной аналитической росписи журнальных статей), создающий информационный ресурс аналитической росписи около 1300 российских журналов (800.000 аналитических записей, пополнение – 1000 записей в день)
Проект ЭДД электронного заказа и доставки документов на основе сводного каталога журналов (около 5000 наименований журналов, доставка около 1200 страниц в день)
Проект распределенной электронной библиотеки ЭПОС (электронное полнотекстовое собрание) 38000 документов
Статистика по участникам проектов
МАРС 154 участника (60 – члены АРБИКОН, 94 – не члены
АРБИКОН) 65 пользователей (46 –члены АРБИКОН, 17 – не члены
АРБИКОН, в т.ч. 1 физ. лицо) 16 кандидатов
ЭДД 136 участников (59 – члены АРБИКОН, 77 – не члены
АРБИКОН) 8 кандидатов
ЭПОС 73 участника (51 – члены АРБИКОН, 22 – не члены
АРБИКОН) 9 кандидатов
Проект ЭДД
Цель - создание современной службы электронного заказа и доставки копий статей за счет распределения обязанностей по обслуживанию заказов между организациями – участниками Проекта.
Впервые в стране создается сводный каталог журналов ( с указанием списка библиотек-держателей) на основе оригинальной технологии автоматизированного сбора данных.
Программное обеспечение формирования заказа и доставки информации потребителю предоставляется всем участникам Проекта бесплатно.
Статистика проекта ЭДД
I кв. II кв. III кв. IV кв. I кв.
Поступило, шт.
611 978 673 2464 2270
Отправлено / Получено, шт.
360 / 301
685 / 615
440 / 395
1696 / 1590
1724 / 1660
Отказы, шт. 66 136 85 419 600
Получено, %
49 63 59 65 73
Количество, ед.
1475 3064 1889 7998 10735
Время реакции, ч.
93 110 152 164 577
Инновационные решения
Набор компонентов, позволяющих «собрать» систему требуемой функциональности
Открытые стандарты – гарант совместимости
Использование программных систем с открытым исходным кодом
Портальные компоненты для объединения ресурсов и сервисов
О стандартах
Форматы записей (MARC, DC)
Протоколы: HTTP – интерфейс пользователя Z39.50 – распределенный поиск, доп.
сервисы SRU, SRW, OAI - поиск, доп. сервисы Механизмы взаимодействия компонентов –
XML/RPC, WSDL,…
Новые проекты АРБИКОН 2008 года
1. Проект КОРСАР - Сводный издательский план учебной и методической литературы
2. Проект «Сводный каталог периодики библиотек России»
Проект КОРСАР
- Круглый стол на V конференции АРБИКОН, июль 2007 г. – идея
- Издательство «БХВ-Петербург» (член АРБИКОН)
- Февраль 2008 г. – проект открыт для библиотек
Проект КОРСАРВ рамках проекта предполагается: изучение потребности в переиздании
литературы среди организаций - членов проекта; обобщение заявок и формирование сводного
плана издания учебной и методической литературы;
заключение авторских договоров на переиздание учебной и методической литературы;
издание по согласованному плану учебной и методической литературы, имеющей общий спрос;
поставка изданной литературы участникам проекта по льготным ценам.
Приглашение к участию
Любая библиотека, после прохождения подготовительного этапа, может стать участником проекта вне зависимости от того, какая именно библиотечная система используется для автоматизации библиотечных процессов.
Естественно, более современные библиотечные системы, в состав которых включены функции обмена данными и взаимодействия с библиотеками-партнерами, позволят использовать корпоративные сервисы наиболее эффективно.
Все сервисы АРБИКОН реализованы на основе компонентов АБИС «Руслан».
Сводный каталог периодики библиотек России
обеспечить перевод информационного массива сводного каталога периодики России в формат RUSMARC;
разработать программного и организационно-методического обеспечения для создания и использования сводного каталога периодики России, включающего информационный ресурс аналитических записей из 1500 российских журналов;
обеспечить доступность сводного каталога периодики России для библиотек Росси в режиме 24*7*365;
довести обьем сводного каталога периодики России до 1 000 000 записей;
оказать содействие библиотекам РФ, привлекая их в качестве участников и пользователей сводного каталога периодики, для оптимизации процессов обработки литературы и обслуживания пользователей в части периодических изданий.
Ближайшие перспективы развития Проектов АРБИКОН
Взаимодействие с крупнейшими коммерческими провайдерами контента на взаимовыгодной основе
Привлечение в проекты зарубежных партнеров, локализация технологии на иностранных языках
Установление партнерских отношений с корпоративными сетями ближнего и дальнего зарубежья
Совместный проект с OCLC