Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
IT ur arkivperspektiv
Henrik Landtmanson
Arkivarie
Kommunarkivet, Karlstads kommun
Två delar
Digitalisering Bevarande i digital form
Att göra något som tidigare varit
analogt, t.ex. i pappersform,
digitalt.
Att istället för att bevara
information, som t.ex. endast har
funnits digital form eller
digitaliserats, i pappersform,
bevara den i digital form
Digitalisering
Varför digitalisering?
Digitalisering görs för att:
•Effektivisera det dagliga arbetet
•Skydda ömtåliga handlingar
•Förbättra tillgången till arkivmaterial
•Förenkla distribution av arkivmaterial
Vad digitaliseras?
Exempel på handlingar som digitaliseras är:
• Diarieförda handlingar i verksamheten
• Fakturor för användning i ekonomi system
•Kyrkböcker p.g.a stor efterfrågan efter materialet och att
slitaget då blir stort på orginalen
• Historiska kartor för att förbättra tillgång och distribution
Hur görs digitalisering?
Digitalisering görs genom:
• Skanning från original
•Skanning från mikrofilm
•Fotografering från original
•Annan datorbehandling
(t.ex. ljud och film)
Att bevara information i digital form är annorlunda mot att
bevara information på papper.
Att bevara information i digital form innebär att många nya
problem måste lösas.
Bevarande i digital form
Vad är problemen?
Information på papper kan bevaras i många hundra år, utan att påverkas
särskilt mycket, enbart genom en lämplig miljö och försiktig hantering.
Digital information kräver datorer och program som stämmer överens
med den fil som innehåller informationen för att filen ska kunna öppnas
och man ska kunna ta del av informationen.
Datorer och program blir idag omoderna på ca. 10 år, ofta snabbare och
byts då ut och informationen i filen går då inte att ta del av.
Men… en fil innehåller intressant information som man vill ska bevaras.
Hur ska man då kunna ta del av informationen i framtiden?
Alternativa lösningsmodeller idag
Datormuseer Emulering Migrering
Att spara datorer och
program som kan läsa filer
från olika tidsperioder.
Detta skulle med utveck-
lingstakten för datorer och
alla olika typer av filer som
finns snart bli ett ohanter-
ligt stort lager av datorer
och programvara.
Att digitalt skapa ett
program som imiterar en
annan en annan dator och
andra program, t.ex. äldre,
än man normalt använder.
Det här är ett tillväga-
gångssätt som det arbetas
en del med, men som är
komplicerat.
Att vid arkivering av en fil,
och så länge den
bevaras, spara filen på
ett sådant sätt att den går
att ta del av med den
aktuella generationens
datorer och program. Den
här modellen används
mest av de här tre.
VARFÖR ARKIVERA DIGITALT???
• Bibehållna sökmöjligheter
• Bibehållna sammanställningsmöjligheter
• Nya sammanställningsmöjligheter
• Bibehållna distributionsmöjligheter
• Effektivare hantering vid arkivinstitutionen
HårdvaraDatorerna, dvs. själva maskinerna, utvecklas snabbt vilket gör det svårt att
veta hur länge man kan ta del av den information man sparat.
Exempel:
• Diskettstationer är inte längre standard i nya datorer
•Joysticken som fungerade till min Comodore 64 1984 fungerar inte till min Fujitsu-
Siemens från 2005, som ändå är gammal
•Sparar man information på en CD idag kanske datorerna inte har cd-spelare om
10 år
Forts. Hårdvara
Digitala lagringsmedia är t.ex. disketter, band, cd/dvd-skivor och hårddiskar
Papper vet man håller i flera hundra år i bra klimat och efter försiktig användning.
Digitala media vet man, nu:
•Varierar mycket i tillverkningskvalitet, vilket gör att de kan innehålla fel som gör
informationen på dem oläslig redan vid första användning.
•Bryter ner sig själva över tiden. Det spelar ingen roll hur bra klimat de förvaras i
eller hur försiktigt man använder dem, de kommer ändå bli oläsliga med tiden.
Lagringsmedia
Forts. Hårdvara
P.g.a. de här problemen måste man byta
lagringsmedia över tid, för att kunna fortsätta
ta del av den arkiverade informationen
MjukvaraMjukvara , eller programvara, är de datorprogram som behövs för att kunna ta
del av informationen i en datafil i en dator.
Mjukvaran verkar utvecklas, om möjligt, ännu snabbare än hårdvaran.
Mjukvaran finns i flera varianter för samma ändamål.
Exempel:
• Man kan inte öppna ett dokument som man skrev på sin dator för fem år sedan
trots att man ser att den ligger där
•Man kan inte öppna en fil som någon skickat till en fast man vet att man har t.ex.
ett bildspelsprogram
P.g.a. den här typen av problem måste man
tänka efter vilken mjukvara som ska kunna
öppna filen man arkiverar, för att kunna fortsätta
ta del av informationen under lång tid
Forts. Mjukvara
Typer av informationOlika typer av mjukvara producerar olika typer av information, med olika
informationsinnehåll
Exempel:
• Dokument (protokoll, brev, affischer, utlåtanden)
• Databaser (ärendehanteringssystem, andraverksamhetssystem, register)
• Bilder (fotografier, CAD-ritningar, kartor)
Givetvis finns det fler typer av information och de kan också förekomma
kombinerade med varandra
FilformatMed filformat menar man det sätt som digitala filer är skrivna, eller programmerade.
Exempel:
• text lagras i en textfil som kan läsas av ett ordbehandlingsprogram
• en bild lagras i en bildfil som kan visas i ett bildredigeringsprogram
Att välja rätt filformat är mycket viktigt vid arkivering i digital form. Beroende på
filformatet behövs längre eller kortare tid mellan konverteringar och det är troligare
att fler användare kan öppna filerna i det format de är arkiverade.
Filformat för arkivering ska vara leverantörsoberoende och helst
standardiserade enligt ISO.
LeverantörsoberoendeDe allra flesta filformat vi använder i vardagen är leverantörsberoende.
De här formaten ägs av en leverantör, ett företag, och leverantören visar
inte för någon utanför företaget hur formatet är uppbyggt, det är
affärshemligheter.
Det här är affärsmässigt förståeligt och formaten kan fungera mycket bra i
det dagliga arbetet, men det är inte bra ur arkivsynpunkt.
Exempel på leverantörsberoende format:
• .doc (word), .xls(excel), .ppt (power point)
• Databasformat som Oracle, PostgreSQL, SQL Server m.fl.
• Bildfiler som .cdrw (Corel draw), .psp (Paint shop pro), .psd
(Adobe photoshop)
• div. CAD- och GIS-format
• m.fl.
Forts. Leverantörsoberoende
Leverantörsoberoende filformat är format som är öppna för vem som helst
att ta del av uppbyggnaden av.
Flera leverantörer, programvaruföretag, använder leverantörsoberoende
format för användarna att spara information i, eller som ett alternativ att
spara i.
Leverantörsoberoende format ska användas vid långtidslagring!
Forts. Leverantörsoberoende
Format standardiserade av ISO är mycket väl utredda och dokumenterade.
De är väl spridda p.g.a. att de är likformiga och reglerade.
Att använda ISO-standardiserade filformat vid arkivering i digital form
är starkt rekomenderat.
ISO, Internationella standardiseringsorganisationen är ett internationellt
standardiseringsorgan, representerat av nationella standardiseringsinstitutioner
(i Sverige av SIS).
Standard, en norm som gäller för alla aspekter av något.
Forts. Leverantörsoberoende
Exempel på leverantörsoberoende format:
Dokument
PDF/A, TIFF, Jpeg, XML
Bilder
PDF/A, TIFF, Jpeg
Databaser
Teckenseparerade eller positionsbestämda textfiler (.txt), XML
Dokumentation
Arkivhandlingar i digital form behöver dokumenteras för att man ska förstå i
vilket sammanhang de kommit till och vad informationen betyder.
För att man ska förstå i vilket sammanhang de kommit till gör man en
systemdokumentation som bl.a. beskriver vilket system informationen
kommer ifrån, hur systemet användes i verksamheten och till vad systemet
användes i verksamheten.
För att den arkiverade digitala informationen ska gå att ta del av krävs
information om filen som t.ex. filformat, läsare för filformat och ev.
kopplingar till andra filer.
För att den arkiverade digitala informationen ska gå att förstå krävs
information om innehållet om detta inte är självförklarande, t.ex.
förklaringar till förkortningar och koder eller vad informationen i fält 1, 2,
3… betyder.
Denna dokumentation kallas metadata i det här sammanhanget
forts. dokumentation
Kort om uppbyggnad av IT-system och arkivuttag ur dem
• De flesta system bygger på en eller flera databaser.
• Systemet sammanställer och visar information ur databaserna baserat på frågor.
• Databaser består av flera sammankopplade tabeller med information.
• Databaser finns i olika fabrikat, t.ex. Oracle, SQL Server och My SQL, som är
programmerade på olika sätt, är leverantörsberoende.
• När man ska bevara data från system kan man behöva ”gå bakom” det man vanligen ser på
skärmen, användargränssnittet, och titta på informationen direkt i databaserna.
• Från databasernas tabeller kan man sedan sammanställa och exportera information i ett
format som är lämpligt för långtidslagring.
LagringLagring av material arkiverat i digital form görs på:
• CD/DVD (enkla att använda, passar för mindre volymer, lagras i vanligt
arkivmagasin, varierande kvalitet, ”manuella” kontroller och back-uper måste göras)
• ”Lösa” hårddiskar (enkla att använda, passar för större volymer, lagras i vanligt
arkivmagasin, ”manuella” kontroller och back-uper måste göras)
• Hårddiskar på ”server” (Mer komplicerat att använda, passar för större volymer,
enklare åtkomst, lagras i ”datorhallar”, automatiska kontroller och back-uper kan
göras, mer känsliga för ”obehörig åtkomst”)
• Band (Mer komplicerat att använda, passar för mycket stora volymer, lagras på
server eller ”löst” med respektive för- ochh nackdelar)
Vid lagring av arkivmaterial i digital form ska materialet, precis som arkiv i
pappersform, skyddas mot förstörelse, skada, tillgrepp och obehörig
åtkomst.
Exempel på åtgärder:
• Flera kopior av materialet, i olika lokaler och på olika media
• Regelbundna kontroller av lagringsmedia
• Rätt val av lokal och lokalskydd
forts. lagring
Vård
Vård av arkivmaterial i pappersform handlar bl.a. om kontroll av klimatet i
arkivlokaler, kontroll av kartonger och inbindningar, kontroll av skador på
arkivhandlingarna.
För handlingar i digital form innebär det delvis samma sak, t.ex. kontroll av
förvaringsmiljö och kontroll av skador på handlingar men…
p.g.a. de digitala lagringsmediernas känslighet för nedbrytning och de
”digitala handlingarnas” känslighet för i vilken miljö de kan ses behöver
• lagringsmedierna kontinuerligt kontrolleras
• lagringsmedierna kontinuerligt, med ett intervall på 2-10 år,
bytas ut. (Ex. man flyttar de lagrade filerna till nya cd-skivor)
• kontinuerlig kontroll hållas på utvecklingen
av filformat och motsvarande läsare
• arkivfilerna kontinuerligt konverteras till ett annat likvärdigt format, när
utvecklingen visar att filformatet snart kommer vara daterat
forts. vård
Ett annat problem, som jag kopplar till arkivvården, är att
handlingar i digital form är lättare att manipulera än en
pappershandling.
Därför måste också autenticiteten, att det som kom in till
arkivet också är det som finns i och kan komma att lämnas ut
från arkivet kontrolleras kontinuerligt
forts. vård
FramtagningVid framtagning av arkivmaterial i pappersform tas den beställda
handlingen fram, fysiskt, ur magasinet och forskaren kan direkt ta del av
handlingen. Om forskaren önskar kopior görs det oftast med en vanlig
kopiator eller med någon form av skanner eller digitalkamera. Kopior i
pappersformat skickas med vanlig post.
Vid framtagning av handlingar i digital form finns det moment som blir
enklare och moment som blir svårare än vid framtagning i pappersform
Vid framtagning av handlingar i digital form kan man behöva
• se till så att filen går att öppna, t.ex. kontrollera så att det inte är något fel
på filen och så att det program man kan öppna filen med finns på datorn
där filen ska öppnas
• se till så att informationen är läslig, t.ex. lägga in informationen i en
kommaseparerad textfil i en databas eller en tabell för att den ska bli lättare
att läsa
• se till att informationen är förståelig, t.ex. bifoga dokumentation om
systemet informationen kom ifrån och vad respektive fält betyder
forts. framtagning
• arkivmaterial i digital form kan kopieras betydligt enklare och snabbare
än arkivmaterial lagrat på annat media
• arkivmaterial i digital form kan distribueras betydligt enklare och
snabbare än arkivmaterial lagrat på annat media, t.ex. via mail eller en
webb-sida
• arkivmaterial i digital form kan manipuleras betydligt enklare och mindre
tydligt än arkivmaterial lagrat på annat media, handlingens autenticitet kan
därför behöva kontrolleras både vid utlämnandet och vid ”återlämnandet”
av handlingen
forts. framtagning
E-arkivprocessen• Val av information att bevara
• Sammanställning av information att bevara
• Avställning av information att bevara
• Konvertering av information att bevara
• Sammanställning av dokumentation
• Framtagning av sök- och visningsverktyg
• Lagring
• Framtagning
1
1
1
1
Stockholms stadsarkivs handledningar om hantering av digital information
http://www.ssa.stockholm.se/sv/Om-Stadsarkivet/Vi-arbetar-for-god-arkivhantering/Handledningar/
Samrådsgruppen för arkivfrågor
Publikationen ”Allmänna handlingar och IT”
http://www.samradsgruppen.se/index.asp?p=1012
Statens arkivs föreskrifter om ADB-upptagningar
http://www.statensarkiv.se/default.aspx?id=7677&refid=1417 (Sök på Rubrik ”ADB”)
http://www.statensarkiv.se/Sve/Dokumentarkiv/Filer/Remissversion_tekniska%20krav_webben.pdf
Att läsa:
Övningar
• Bildsamling (från
byggprojekt i en stad
1920-1970
digitaliserad):
Lagrings format?
Metadata/sortering?
Visningsmetod?
• Skolsystem (med
uppgifter om person,
klass, betyg, lärare
et.c.):
Lagrings format?
Visnings format?
Utlämnandesätt?
• Digitala dokument
från förening (olika
dokumenttyper och
filformat):
Lagrings format?
Metadata/sortering?
Utlämnandesätt?