32
Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Embed Size (px)

Citation preview

Page 1: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Göttingen10./11.1.2000

Kerstin Zimmermann

TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Page 2: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

2

Inhaltsverzeichnis

Rechtliches

• Promotionsordnung• Musterverträge• Parallelveröffentlichung• Copyrightnote• DC.Rights

Retrieval

• Dissertationsaufkommen• PhysDis• Verteilung• Harvest• Netzwerk• Installation

Page 3: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

3

Rechtliches

• Promotionsordnungen

• Musterverträge- zwischen Kandidatin und UB / DDB- zwischen Kandidatin und FBhttp://elfikom.physik.uni-oldenburg.de/dissonline/vertrag.html

§

Page 4: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

4

Page 5: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

5

Rechtliches

• Promotionsordnungen

• Musterverträge- zwischen Kandidatin und UB / DDB- zwischen Kandidatin und FBhttp://elfikom.physik.uni-oldenburg.de/dissonline/vertrag.html

§

• Beispiele Online- und Verlagsveröffentlichung parallel

• Diskussion in DC.Rights- rights der resource (un-)restricted access / use - rights der Metadaten

Page 6: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

6

Retrieval

Page 7: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

7

Retrieval in der Physik

Phys Dis

Ire lan d

Ita ly

N eth erlan d s

N orw ay

P o lan d

P h ysD is

WWW

Page 8: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

8

Online Theses in Europe

many theses at several places

up to 10 links for theses

some theses found mostly at one place

no theses found yet

updated: December 1999

Page 9: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

9

Arten der Archive (PhysDis)

a) Liste mit Einträgen (Name, Titel, Datum)

b) zusätzlich mit Abstract

c) Volltexte unkommentiert

d) Metadaten und Volltexte

Page 10: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

10

Existente Gatherer und Broker

Page 11: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

11

Abdeckung der Daten

RDF

Dokumente

Dissertationen in EU

Metadaten

D

Page 12: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

eprint, Fachbereich Physik, CvO Universität Oldenburg

12

Harvest

WWW-SERVER

http://www.physik...

Dissertation GATHERER

BROKER

HARVEST

User

Internal Area

NWWW Browser

Result...................................

Request

Result

Page 13: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

13

Warum Harvest?

• dezentrales System

• heterogene Einträge

• plattformunabhängig

• Software public domain (-> Kostenersparnis)

• open sourcecode ( -> offene Schnittstellen)

Page 14: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

14

Globale Harvest Serverstruktur

global

national

fach-spezifisch

europaweit

D D BO P A C

N D L TD

C h em ieS U B

E rz ieh u n g sw issen sch a ftenU B

In fo rm atikR Z

F ach b ere ich / In s titu tU B

M ath em atikIM P R E S S

F ach b ere ich / In s titu tU B

P h ys ikP h ysD is

D iss B roke rD issN et

Page 15: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

15

Harvest Anleitung• indexierbare Formate

• Softwarelink

• Handbuch

• Installationshilfe

• Fehlerquellen

http://www.dissonline.org/harvest.html

Page 16: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

16

Indexierbare Formate• html X

• ps X Text, Vorsicht bei einigen Druckertreibern kein

Grafikmodus sondern ASCII erforderlich • pdf X Text, bei folgenden Destiller-Optionen:

asciipdf=on, commpressed Text= off im exchange darf die optimize Einstellung nicht verweden werden

• doc X

• rtf X

• tex X

• dvi X

Page 17: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

17

<tags> und MetadatenHTML Element SOIF-Element

<A HREF> url-reference{}

<ADDRESS> address{}

<H1 ... H6> headings{}

<TITLE> title{}

...

Metadaten SOIF-Element

DC.title dc.title{}

DC.author dc.author{}

...

Page 18: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

18

Harvest-Sources:

ftp://ftp.tardis.ed.ac.uk/pub/harvest/develop/snapshots/

Page 19: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

19

Requirements for Harvest-Servers

Hardware:• fast processor (e.g. Sparc5...)• fast I/O• much MEMORY ( > 64 MB)• 1-2 GB free disk-space (sources take approx 25 MB)

Page 20: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

20

Requirements for Harvest-Servers

Platforms:• DEC OSF/1 2.0 or newer• SunOS 4.1.x or newer• SunSolaris 2.3 or newer• HPUX• AIX 3.x or newer• Linux all Kernel from 1999 on...• ... beginning with Version 1.5 Harvest should run under all Unix-Platforms, but WindowsNT

Page 21: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

21

Requirements for Harvest-Servers

Software:• Perl v4.0 or higher (v5.0 preferred)• gzip• tar• HTTP-Server (may be on remote machine)• GNU gcc v2.5.8 or higher• flex v2.4.7• bison v1.22

Page 22: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

22

Harvest-Configuration

Provider

Provider

Provider

Gatherer

Broker

Broker

Page 23: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

23

Harvest-Configuration

Provider

Provider

Provider

Gatherer

Broker

Broker

gdbm

objects

glimpse

SOIF

SOIFHTTP

HTTP

HTTP

Page 24: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

24

Harvest-Configuration

Provider

Provider

Provider

Gatherer

Broker

Broker

gdbm

objects

glimpse

SOIF

SOIFHTTP

HTTP

HTTP

CGIPORT

Page 25: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

25

Harvest-Configuration

Gatherer

Broker

Broker

gdbm

objects

glimpse

CGIPORT2

PORT1

PORT3

Port-Numbers mustbe unique !!!!

Page 26: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

26

Port-Nummern• Harvest 8500

• Webserver http 80

• ftp 21 tcp

• telnet 23

• smtp (email) 25

• pop3 110

• time-server 123

Page 27: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

27

@FILE { http://www.physik.uni-oldenburg.de/Docs/THEO3/publications/metadocs/ebs.shell.structure.htmlupdate-time{9}: 938935362url-references{208}: http://www.physik.uni-oldenburg.de/Docs/THEO3/publications/ebs.shell.structure.pdfmailto:[email protected]://www.physik.uni-oldenburg.de/Docs/THEO3/publications/ebs.shell.structure.pdftitle{59}: Shell Structure and Stability of Very Neutron-Rich Isotopeskeywords{97}:

and author date eberhard ebs files hilf isotopes neutron pdf rich shell stability structure very

head{16}: -Version 1.0 -->dc.type{59}: InProceedings(SCHEME=Freetext)publication-status=publisheddc.title{59}: Shell Structure and Stability of Very Neutron-Rich Isotopesdc.publisher{18}: IKDA, TH Darmstadtdc.language{18}: (SCHEME=Z39.53)ENGdc.format{15}: application/pdfdc.date{75}: (SCHEME=ANSI.X3.30-1985)1975(SCHEME=ANSI.X3.30-1985)(TYPE=current)19990408dc.creator{126}: Eberhard R. Hilf(TYPE=email)[email protected](TYPE=phone)+49-(0)441-798-2543(TYPE=fax)+49-(0)441-798-3201body{190}: =+4>Shell Structure and Stability of Very Neutron-Rich Isotopes Author:Eberhard R. Hilf Phone: +49-(0)441-798-2543 Fax:+49-(0)441-798-3201 Files: ebs.shell.structure.pdf Date: 1975md5{32}: bc1f2750a042a8175cce710030c60d76file-size{4}: 2440type{4}: HTMLgatherer-version{6}: 1.5.19gatherer-host{31}: egoiste.physik.uni-oldenburg.degatherer-name{17}: Physics Oldenburgrefresh-rate{5}: 86400time-to-live{7}: 3888000last-modification-time{9}: 928224570description{186}: =+4>Shell Structure and Stability of Very Neutron-Rich Isotopes Author:Eberhard R. Hilf Phone: +49-(0)441-798-2543 Fax:+49-(0)441-798-3201Files: ebs.shell.structure.pdf Date: 1975}

SOIF: Example

Page 28: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

28

Installationrlogin

Password:

cp harvest-1.5.20.tar.gz

gunzip harvest-1.5.20.tar.gz

tar -xf harvest-1.5.20.tar

cd harvest-1.5.20

login on remote machine

type in and forget...

copy source...

uncompress sources

unpack sources

change into sources dir

Page 29: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

29

Installation

RunHarvest

•Tuning:• Gatherer

• Editing the Gatherername.cf• Editing the RunGatherer and RunGatherd

• Broker• Editing the admin/Collection.conf• Editing the CGI-Files

Page 30: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

30

Fehlermeldungen / -quellen

Broker findet nichts

-> Glimpse-Server läuft nicht

Gatherer tut nicht

-> port-Nummer belegt

Page 31: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

31

Laufzeit und DatenmengenDFN-Netz 3 Doks pro Minute

Ladezeit vgl. Browser

indizieren [ms]

Speicherplatz 9 MB

PhysDis (Jan.‘00) 306 ‚echte‘ links

1475 Dokumente

112 Server

Gatherer 2h 4min

Page 32: Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

32

Zusammenfassung

Dissertation an Beispielfachbereichen

Suchdienst in der Physik (Prototyp)

geplante Suchdienststruktur

bundesweit / weltweit

Harvest

technische Details

Installationshilfen