28
IV — Администрирование IV — Администрирование © 2011 © 2011 Кузьма Кудим Кузьма Кудим

Administrarea DSpace

Embed Size (px)

DESCRIPTION

Seminarul Internaţional „Implementarea tehnologiei IR (repozitorii instituţionale): Sistemul DSpace”, 14-15 aprilie 2011. Chişinău, Ambasada Regală a Norvegiei în România, Asociaţia Bibliotecarilor din Republica Moldova, Consorţiul REM, Programul EIFL-OA, Biblioteca Ştiinţifică a Academiei de Studii Economice din Moldova. Instructor: Kuzma KUDIM, Institutul Sisteme Software al Academiei de Ştiinţe din Kiev, Ucraina.

Citation preview

Page 1: Administrarea DSpace

IV — АдминистрированиеIV — Администрирование

© 2011© 2011 Кузьма Кудим Кузьма Кудим

Page 2: Administrarea DSpace

1. Резервное копирование1. Резервное копирование

Page 3: Administrarea DSpace

Рекомедуемая схемаРекомедуемая схема

Необходимо скопировать:Сначала базу данныхЗатем дерево файлов

из [dspace-source]из [dspace]

Порядок важенВыполнять регулярноПериодически разворачиватьХранить физически в другом месте

Page 4: Administrarea DSpace

База данныхБаза данных

Копирование

Восстановлениеpg_dump -U dspace dspace > backup.sql

psql -U dspace -d dspace -f backup.sql

psql -U dspace -f [dspace-source]/dspace/etc/update-sequences.sql

Page 5: Administrarea DSpace

Дерево файловДерево файлов

Копирование и архивирование

Восстановление

tar -сvfz dspace-source.tar.gz [dspace-source]tar -сvfz dspace.tar.gz [dspace]

tar -xvf dspace-source.tar.gztar -xvf dspace.tar.gz

Page 6: Administrarea DSpace

Удалённое копированиеУдалённое копирование

WindowsУтилита pscp из набора puttyПланировщик заданий

LinuxУтилита scpcron

Page 7: Administrarea DSpace

2. Реорганизация архива2. Реорганизация архива

Page 8: Administrarea DSpace

Реорганизация разделовРеорганизация разделов

Родители/дети/сиротыСвязать раздел с подразделом:

Разорвать связь:

Например:

[dspace]/bin/dspace community-filiator -s -p ИдРод -c ИдДет

[dspace]/bin/dspace community-filiator -r -p ИдРод -c ИдДет

[dspace]/bin/dspace community-filiator -r -p 12345/3 -c 12345/8

Page 9: Administrarea DSpace

Перемещение документовПеремещение документов

На странице редактирования документа:→Переместить документ

Выбрать целевую коллекциюНаследовать права от целевой коллекции?

Page 10: Administrarea DSpace

3. Пакетное редактирование 3. Пакетное редактирование метаданныхметаданных

Page 11: Administrarea DSpace

Для чегоДля чего

Массовое однотипное изменениеМассовое добавление метаданныхМассовое перемещение документов

[dspace]/bin/dspace metadata-export Параметры

[dspace]/bin/dspace metadata-import Параметры

Page 12: Administrarea DSpace

КомандыКоманды

Экспорт

Импорт

Добавление новых документов (без файлов)

[dspace]/bin/dspace metadata-export -f Файл -i Ид

[dspace]/bin/dspace metadata-import -f Файл

[dspace]/bin/dspace metadata-import -f Файл -e Email

Page 13: Administrarea DSpace

Формат файлаФормат файла

CSV (Microsoft Excel, OpenOffice Calc)Первая строка — заголовок

id,collection,dc.title,dc.contributor,dc.date.issued,...Остальные строки — метаданные

350,2292,Какое-то название,"Иванов, Иван",2010,...

Page 14: Administrarea DSpace

Редактирование метаданныхРедактирование метаданных

Переместить в другую коллекциюСтолбец collection

Добавить документПоставить + в поле id

Удалить данныеУдалить значение в строкеОтсутствующие столбцы не удаляются

Page 15: Administrarea DSpace

IV — АдминистрированиеIV — Администрирование

© 2011© 2011 Кузьма Кудим Кузьма Кудим

Page 16: Administrarea DSpace

1. Резервное копирование1. Резервное копирование

Page 17: Administrarea DSpace

Рекомедуемая схемаРекомедуемая схема

Необходимо скопировать:Сначала базу данныхЗатем дерево файлов

из [dspace-source]из [dspace]

Порядок важенВыполнять регулярноПериодически разворачиватьХранить физически в другом месте

Порядок копирования — сначала база, затем файлы — важен для сохранения целостности базы данных, чтобы не возникло ссылок на несуществующие файлы.

Регулярное копирование обеспечит сохранность данных. Лучше всего организовать автоматическое регулярное копирование. Например, на сервере DSpace по заданию cron выполняется копирование и архивирование, а с удалённой машины тоже по заданию cron выполняется копирование архивных файлов на эту машину.

Периодическая развертка резервной копии (особенно в первый раз!) необходима для проверки работоспособности резервной копии.

Физическое разделение копии и рабочего сервера — необходимое условие сохранности данных.

Page 18: Administrarea DSpace

Экспортирование базы данных Postgre в виде файла SQL оcуществляется утилитой pg_dump.

Файл, полученный на выходе первой операции, используется для восстановления базы данных с помощью утилиты psql.

Второй вызов psql необходим для восстановления последовательностей первичных ключей, чтобы в новосозданной базе не пересоздавались ключи, совпадающие с существующими.

База данныхБаза данных

Копирование

Восстановлениеpg_dump -U dspace dspace > backup.sql

psql -U dspace -d dspace -f backup.sql

psql -U dspace -f [dspace-source]/dspace/etc/update-sequences.sql

Page 19: Administrarea DSpace

Дерево файловДерево файлов

Копирование и архивирование

Восстановление

tar -сvfz dspace-source.tar.gz [dspace-source]tar -сvfz dspace.tar.gz [dspace]

tar -xvf dspace-source.tar.gztar -xvf dspace.tar.gz

Копирование, архивирование и восстановление дерева файлов можно осуществить с помощью утилиты tar.

Page 20: Administrarea DSpace

Удалённое копированиеУдалённое копирование

WindowsУтилита pscp из набора puttyПланировщик заданий

LinuxУтилита scpcron

Page 21: Administrarea DSpace

2. Реорганизация архива2. Реорганизация архива

Page 22: Administrarea DSpace

Реорганизация разделовРеорганизация разделов

Родители/дети/сиротыСвязать раздел с подразделом:

Разорвать связь:

Например:

[dspace]/bin/dspace community-filiator -s -p ИдРод -c ИдДет

[dspace]/bin/dspace community-filiator -r -p ИдРод -c ИдДет

[dspace]/bin/dspace community-filiator -r -p 12345/3 -c 12345/8

Иерархия разделов объясняется привычной метафорой родительских/дочерних узлов дерева. Так, раздел верхнего уровня, назовём сиротой. Раздел, который является подразделом некоторого другого раздела, назовём дочерним, а его надраздел — родительским. Устанавливая либо убирая связи родительский-дочерний между разделами, мы можем изменять структуру архива.

Это позволяет делать команда community-filiator административной утилиты dspace с соответствующими параметрами. В качестве идентификаторов разделов ИдР и ИдД можно использовать как хэндлы, так и идентификаторы из базы данных.

Page 23: Administrarea DSpace

Перемещение документовПеремещение документов

На странице редактирования документа:→Переместить документ

Выбрать целевую коллекциюНаследовать права от целевой коллекции?

Данный способ хорош, если перемещается один или несколько документов. Если же нужно переместить большое количество документов, то легче воспользоваться способом, описанном в следующем разделе.

Page 24: Administrarea DSpace

3. Пакетное редактирование 3. Пакетное редактирование метаданныхметаданных

Page 25: Administrarea DSpace

Для чегоДля чего

Массовое однотипное изменениеМассовое добавление метаданныхМассовое перемещение документов

[dspace]/bin/dspace metadata-export Параметры

[dspace]/bin/dspace metadata-import Параметры

Существует много ситуаций, когда нужно либо совершить однотипное изменение в большом количестве документов (например, исправить опечатку), либо добавить одинаковое поле метаданных к уже существующему множеству документов, либо переместить документы массово в другую коллекцию (если нужно переместить небольшое количество документов, то проще воспользоваться способом, описанном в предыдущем разделе). Для облегчения этой работы служат две команды, metadata-export и metadata-import административной утилиты dspace.

Page 26: Administrarea DSpace

КомандыКоманды

Экспорт

Импорт

Добавление новых документов (без файлов)

[dspace]/bin/dspace metadata-export -f Файл -i Ид

[dspace]/bin/dspace metadata-import -f Файл

[dspace]/bin/dspace metadata-import -f Файл -e Email

Это команды пакетного экспорта/импорта метаданных с основными параметрами.

Формат файла описан далее.Идентификатор — либо хэндл, либо из базы

данных.Email пользователя, который вносит новые

записи.

Page 27: Administrarea DSpace

Формат файлаФормат файла

CSV (Microsoft Excel, OpenOffice Calc)Первая строка — заголовок

id,collection,dc.title,dc.contributor,dc.date.issued,...Остальные строки — метаданные

350,2292,Какое-то название,"Иванов, Иван",2010,...

Метаданные экспортируются в CSV формате, то есть в виде строк, данные в которых разделены запятыми. Если запятая встречается в данных, то такие значения следует заключитьв двойные кавычки. Если в данных встречается двойная кавычка, то её следует удвоить.

Первая строка-заголовок перечисляет через запятую столбцы — экспортируемые поля метаданных.

Последующие строки содержат значения соответствующих полей через запятую.

Файлы CSV можно удобно редактировать в таких программах, как Microsoft Excel и OpenOffice Calc.

Page 28: Administrarea DSpace

Редактирование метаданныхРедактирование метаданных

Переместить в другую коллекциюСтолбец collection

Добавить документПоставить + в поле id

Удалить данныеУдалить значение в строкеОтсутствующие столбцы не удаляются

Для перемещения документов между коллекциями изменить значения в нужных строках в столбце collection.

Данные из файла "накладываются" на существующие в метаданные, поэтому отсутствующие в файле столбцы удаляться не будут. Этим можно воспользоваться, чтобы удалить ненужные при редактировании столбцы, — такое удаление не отразится в архиве. Напротив, удаление значения в строке без удаления соответствующего заголовка столбца приводит к действительному удалению данных.