Practica Documentacio Audiovisual

Embed Size (px)

Citation preview

  • 8/10/2019 Practica Documentacio Audiovisual

    1/13

    Prctica

    Documentaci audiovisual

    Rediart

    Jaume Reig Carrascosa, desembre de 2014

  • 8/10/2019 Practica Documentacio Audiovisual

    2/13

    2

    ndex

    1. Gesti documental. Rediart. 3

    2. Descipci del cas destudi 3

    3. Exposici del cas i objectius 3

    4. Elements i eines documentals utilitzades 4

    El gestor de continguts web (CMS) 5

    Arquitectura de la informaci 5

    Perfils de publicacdors i administradors CMS 6

    5. Metodologia

    Estimaci temps i fases treball 7

    Metodologia del treball i optimitzaci del temps 8

    Ordre i noms darxius i directoris 9

    Espai disc dur documents 9

    Backups en el procs de treball 10

    6. Punts forts i punts dbils 11

    Anlisis extern 11

    Anlisis intern 12

    Definici objectius a partir de DAFO 12

    7. Conclusions 13

    8. Bibliografia 13

  • 8/10/2019 Practica Documentacio Audiovisual

    3/13

    3

    3.Exposici del cas i objectius

    2.Descripci del cas destudi

    1.Gesti documental. Rediart

    Rediart s una associaci sense afany de lucre encarregada de la gesti, preservaci idifusi de la histria escrita dArts (poblaci del Bages duns 5500 habitants). Lassociaci

    actualment publica i ns portaveu de la revista trimestral LArtesenc, del qual actualmentes va pel nmero 222. Tamb s lencarregada de la conservaci daltres revistes quehan existit al poble en temps passats. Lassociaci compte amb un local social cedit perlajuntament del poble on coordina totes les seves activitats i on guarda exemplars tantde la revista actual com de la majoria de revistes antigues. Al mateix temps guarda tanten format digital com en analgic un ampli fons fotogrfic. A partir del nmero 198 dela revista LArtesenc, aquesta s maquetada totalment en format digital, i sen tenencpies en digital, per no de les revistes anteriors al nmero 198, ni lgicament de lesaltres revistes ms antigues que han existit al poble on tan sols existeixen en format paper.

    Lassociaci vol catalogar, indexar i fer accessible a tothom que ho vulgui el fons documentalde revistes que gestiona, com a part dels mateixos propsits recollits en els estatuts delassociaci. Pesem per exemple en estudiants, historiadors, periodistes, escriptors,economistes,.. que facin treballs de recerca o daltre mena i que estiguin interessats a

    consultar aquest fons documental lliurement.

    Aix doncs el treball consistiria a catalogar i indexar les 222 revistes LArtesenc publicadesactualment en format paper, aix com les que es vagin publicant trimestralment. (Larevista en curs no sortiria publicada, per no desmotivar la compra de la mateixa). A msa ms, tamb sindexarien i es catalogarien entre 152 i 200 publicacions ms (no saben elnombre exacte de moment) daltres revistes que han existit en temps passats al poble (Eldos de Janer, Ptria nova, Gavarresa, Vincit, Veremall i Tot daqu). Al mateix temps decatalogar, indexar i centralitzar tots aquests continguts en un sol espai, lobjectiu tamb

  • 8/10/2019 Practica Documentacio Audiovisual

    4/13

    4

    4.Elements i eines documentals utilitzades

    s digitalitzar aquestes publicacions per assegurar-ne la preservaci del seu contingut,com tamb per permetren laccs ms cmode i rpid en els nous formats i plataformesde visualitzaci digitals actuals. Aix doncs resumint els objectius serien:

    Catalogar i indexar les 222 publicacions de LArtesenc i les que es publicaranposteriorment.

    Catalogar i indexar unes 200 publicacions ms daltres revistes que han existit alpoble.

    Digitalitzar aquestes publicacions per assegurar-ne el contingut.

    Publicar aquests documents i fer-los accessibles per tothom en un sol puntcentralitzat.

    Leina principal utilitzada seria la publicaci daquests continguts en la pgina web creadai publicada recentment de la revista LArtesenc. www.lartesenc.cat.

    Per una part tenim des de la revista 197 fins a la 222 on el disseny i maquetaci han estatfets totalment amb programari dedici digital, on sen tenen cpies digitals dels originalsi on no hi ha problema per a fer-ne una exportaci en PDF amb una bona relaci qualitat-pes per tal de poder-los publicar a la web. A ms a ms, i encara ms important sen pot feruna exportaci en XML i mitjanant algun script poder maquetar els continguts en HTML,

    CSS cmodament, sobretot de la portada i el sumari per aix tenir una fcil indexaci delscontinguts en la web, com per poder fer cerques pel cercador intern de la web o incorporaralgun tipus de filtre que facis recerques a partir daquest text si es creu convenient en elfutur. Aix doncs entre el nmero 197 al 222 no hi ha problema i de fet a lhora de publicarla web ja es van poder inserir aquests continguts tamb, amb la imatge de la portada, ams a ms dels ttols i subttols textuals de la portada i el contingut del sumari que inclou:secci, ttol article, autor i nmero de plana.

    Pels altres nmeros (o sigui del nmero 1 al 197) el pla s digitalitzar (escanejar) elsdocuments per a poder muntar les revistes en PDF i introduir a m les informacionsdels titulars i subtitulars de les portades i digual manera les informacions dels sumarisamb el mateix format que les que ja shan introdut a la web. O sigui: Secci (si existeix),

    ttol article, autor i nmero de plana, aix com la data de publicaci de la revista. Caldestacar que tota aquesta informaci de digitalitzaci manual, tamb shaur de realitzaramb les revistes anteriors a LArtesenc. Posteriorment a aquesta primera digitalitzacinecessria, es realitzar una feina de OCR (Reconeixement ptic de Carcters) per tal queles revistes digitalitzades tamb tinguin un format on els carcters siguin reconeguts perprogramari i per tant es puguin realitzar cerques pels documents.

  • 8/10/2019 Practica Documentacio Audiovisual

    5/13

    5

    El gestor de continguts web (CMS)

    Arquitectura de la informaci

    Pel que fa a la web sha optat per un dels gestors de continguts open source, que ens ofereixla suficient flexibilitat i potncia, i que al mateix temps ofereix garanties de mantenimentde core del CMS per part de la comunitat a llarg termini. Aquest s Joomla.

    Larquitectura de la informaci i esquema funcional de la web en aquest apartat seria moltsenzilla per efectiva.

    Nmerosanteriors

    Categoria

    (nmerosanteriors)

    Revista(fitxa)

    Linkdescrrega

    Cerdador

    Llistat

    nmeros

    Nmeros anteriors: Seria la pestanya que al fer clic anirem a la categoria de nmerosanteriors.

    Categoria Nmeros anteriors:Mostraria les portades dels nmeros anteriors a 3columnes, amb paginaci, data publicaci, autor i clics. A ms a ms el link de lenlla,Llegir-ne ms que ens portaria al nmero en qesti.

    Revista nmero:Mostra la portada ms gran, data de publicaci, autor, resum titulars icontinguts del sumari, ms el link de descrrega de la revista en PDF.

    *Aquest esquema funcional ser el mateix per la resta de revistes. Sha optat per penjar els

    PDFs al nvol per qesti doptimitzaci despai i per tema de pressupost. De totes maneres sentindran cpies en local als ordinadors de lassociaci.

    Dropbox

    (Nvol)

  • 8/10/2019 Practica Documentacio Audiovisual

    6/13

    6

    Perfils de publicadors i administradors del CMS

    Dropbox

    (Nvol)

    En principi la web tindr 2 perfils diferenciats en tasques i responsabilitats. Ladministradoro superadministrador, que ser lencarregat de manteniment web, modificaci templates,

    i backups de seguretat, i el perfil de publicador que ser lencarregat danar publicantpaulatinament i regularment els continguts a la web, previ entrenament de com sha defer per part del superadministrador.

    5. Metodologia

    De forma resumida i esquemtica la metodologia a aplicar seria:

    Revistes LArtesenc

    del 1 al 196 i les altres

    revistes histriques

    dArts.

    Escanejar planes

    revistes (imatges

    Tiff)

    Maquetar les revistes a

    partir de les imatges (amb

    Indesign)

    Publicaci web en

    format

    PDF

    Feina OCR + revisi

    de continguts +

    maqueatr revistes

    Guardar

    cpes seguretst el

    local

  • 8/10/2019 Practica Documentacio Audiovisual

    7/13

    7

    Pel que fa a les informacions i continguts de les revistes, no hi ha ms remei que introduir-los a m, si no es vol esperar a tindre tota la feina de OCR feta (que comportar foratemps si la feina noms la fan voluntaris), on llavors si es podria agafar aquest contingutduna forma ms automatitzada. Per tant la feina a fer de forma resumida i esquemticaseria:

    Transcriure els titulars

    i subtitulars de les

    portades.

    (en document de text

    Word o Openoffice)

    Transformar aquest text

    en HTML (en una llista de

    definici amb estil)

    Publicar

    al web

    Transcriure els ttols

    articles, autor i plana dels

    ndex o sumari.(en document Word o

    Openoffice) Transcriure

    els ttols articles, autor i

    plana dels ndex o sumari.

    (en document Word o

    Openoffice)

    Transformar aquest text

    en HTML (en una llista

    desordenada inbricadaamb estil)

    Publicar

    al web

    *Per crear el HTML es pot crear un script que mitjanant la introducci del text en camps de

    formulari en transformi aquest en tags HTML amb estil automticament.

    Estimaci temps i fases del treball

    A mode aproximat shan de digitalitzar unes 400 revistes. Si tamb de mode aproximatcalculem que cada revista t de mitjana unes 24 pgines (en algunes seran menys per enla majoria ms) tenim que:

    400 revistes x 24 pgines mitjana cada revista =9600 planes a escanejaraproximadament(segurament ms)

    - Si compten que en 1 hora podrem escanejar 40 planes (a ra de 1 min 30 per plana,tenint en compte que lassociaci no t escners professionals que vagin molt rpids i queshan descanejar a alta resoluci). En 1 dia poden escanejar 320 planes, en 1 setmana1600 planes i per tant poden estimar que en 6 setmanes, podem escanejar totes lesrevistes amb una dedicaci de 40 hores setmanals.

    - Pel que fa a la transcripci dels texts de les portades (titulars i subtitulars) i els textsdels ndexs i sumaris, un clcul aproximat geners de 15 min/revista. Per tant en 1 hora4 revistes, en 1 dia 32 revistes, en una setmana 160 revistes. Per tant duns 20 a 30 diesa completar les 400 revistes.

    - Pel que fa a la maquetaci de les revistes en PDF, a partir de les imatges escanejades,

    compten que en 15 min tindrem muntada una revista amb Indesign i per tant amb el

  • 8/10/2019 Practica Documentacio Audiovisual

    8/13

    8

    Metodologia del treball i optimitzaci del temps

    mateix clcul que en la transcripci dels texts necessitarem uns 30 diesper la maquetacide les 400 revistes.

    Si a ms a ms volem convertir en text les imatges escanejades (amb programari OCR)podrien aplicar els mateixos clculs aproximats que en el cas de lescaneig, per tenint encompte que haurem de repassar els texts dun a un, ja que en molts casos sn tipografiesmanuscrites de baixa qualitat i al programari li costar reconixer els carcters i hi hauran

    errors que shauran de corregir a m comparant amb la imatge original de lescaneig. Aixdoncs compten uns 4 min per plana, unes 15 planes per hora, unes 120 planes per dia,600 planes per setmana o sigui en total unes 16 setmanes, uns 4 mesos.

    En total podem comptar amb uns 7 mesos de feina.*Tots els clculs sn aproximats i comptant 8 h/dia 5 dies setmana de dedicaci.

    Per tal doptimitzar el temps dels treballs es proposa la segent metodologia i fases deltreball:

    1. Escanejar planesSeria el primer treball a realitzar i es faria seguit fins a finalitzar totalment.

    2. Muntar PDFs amb les imatgesFer la maquetaci dels PDFs amb les imatges escanejades (amb aquests PDFs no espodrien fer recerques per ja es podrien penjar a la web i serien iguals en aparena queels originals).

    3. Publicar els PDFs a la webAmb els PDFs ja muntats es podrien publicar a la web. Caldria tamb crear una imatgede la portada optimitzada de 375px amb compressi jpeg. (en aquest punt encara ho hihaur cap informaci textual a la web per fer recerques, per ja estarien tots els nmerospublicats amb la seva portada corresponent).

    4. Transcripci text portades i sumariCaldria fer la transcripci de tots els texts de portada i sumari i transformar-los aHTML.

    5. Publicar text al webAmb tot el text ja transcrit, ja noms caldria inclourel al nmero que correspongui,perqu cada fitxa de cada nmero tingui text i per tant es puguin fer recerquesefectivament.

    6. Transformar imatges en text (OCR)Finalment a partir de les imatges i PDFs, transformar aquests (intentant mantenirestructura i disseny dels originals) en PDFs amb text inserit i que es pugui realitzarrecerques per ell. (aquest seria un PDF complementari al que ja hi ha publicat a la web).

  • 8/10/2019 Practica Documentacio Audiovisual

    9/13

    9

    Ordre i noms darxius i directoris

    Recursos necessaris

    Es proposa la segent estructura de directoris i noms darxius (exemple):

    Revista

    Artesenc 01scans

    planes

    artesenc01-plana1.tiff

    artesenc02-plana2.tiff

    Etc..

    PDFartesenc01.indd

    artesenc01.pdf

    Textsartesenc01-portada.odt

    artesenc01-sumari.odt

    artesenc01-ocr.indd

    artesenc01-ocr.pdf

    OCRartesenc01-plana1.odt

    artesenc01-plana2.odt

    Etc..

    webartesenc01-portada.jpeg

    * A partir dels texts corregits i de les imatges s munta el PDF amb els texts editables, respectant

    lestructura i el disseny de loriginal tant com es pugui. (tenint en compte que en revistes antigues

    hi haur fons tipogrfiques manuscrites).(soptar per una font tipogrfica genrica, per

    respectant estructura de columnes, ordre, disseny, grfics, etc..de loriginal).

    *Tamb shaur de guardar una imatge optimitzada en jpeg a 72ppp amb una mida reduda (a

    la mida optimitzada per la web, uns 375px dample) amb el fi dutilitzar-les per a publicar a la

    web com imatges de les portades. (aquest treball es pot realitzar per lots amb el Photoshop pelque amb 2 dies pot estar fet)

    Pel que fa als recursos fsics necessaris, podem comptar amb els 3 ordinadors de lassociaci,2 discos durs externs de 1Tb cadasc, lescner i les impressores a ms a ms de les taulesde treball i de totes les revistes fsiques que estan all catalogades en les estanteries.

  • 8/10/2019 Practica Documentacio Audiovisual

    10/13

    10

    Espai disc dur documents

    Backups en el procs de treball

    Tenint en compte que totes les revistes sn en format A4 i que sescanejaran a tot color(tot i que una part de revistes sn en blan i negre) a 300ppp, tindrem que cada imatge

    escanejada pesar uns 24Mb. Per tant si multipliquem per 9600 documents a escanejartindrem 230400 Mb despai necessari pels escners. Uns 225GB.

    Pel que fa als PDFs en baixa resoluci per penjar a la web, uns 10Mb x 400 revistes =4000 Mb uns 3,9 GB

    Pel que fa als documents de text seria molt poc, aproximadament uns 9Kb per documentx 800 documents = 7200 Kb uns 7Mb

    I els documents de text per OCR 9Kb x 9600 = 86400 Kb = uns 84 Mb

    I els documents Indesign uns 30Mb/ revista x 400 = 12000 Mb = uns 11 Gbal igual que

    els documents Indesign amb els PDF amb OCR uns 11 Gbtamb.

    Per tant podem concloure que en tindrem prou amb uns 300 GBdespai en disc.

    A la fi dassegurar el treball en el procs daquest, es proposa a part de guardar les dadesen lordinador on es treballi, fer una cpia incremental en un disc dur extern cada dia alfinalitzar el treball.Pel que fa a la web els backups de seguretat ja se nencarrega el superadministrador i lesguarda al nvol. A part el mateix servei de hosting guarda cpies de seguretat cada dia.

  • 8/10/2019 Practica Documentacio Audiovisual

    11/13

    11

    6.Punts forts i punts dbils

    Anlisis extern

    Quines sn les oportunitats que ofereix lentorn i com es poden

    aprofitar?

    Actualment en el poble existeix molta documentaci escrita i fotogrfica que est escampadaper diferents locals i localitzacions i que no est digitalitzada, i per tant lnica manera deconsultar-la s fsicament (a part del perill de deteriorament o destrucci). Per tant es creu

    una bona oportunitat oferir digitalitzar aquests continguts i possiblement daltres en elfutur com: larxiu fotogrfic Amadeu Quintana, programes de la fira i de la festa major, etc..perqu tothom pugui consultar-los a travs de les noves tecnologies com a servei al b comi per tant sembla lgic pensar en possibles ajudes pbliques per a tirar el projecte a bon port.Per altra part la revista t un bon nombre danunciants i subscriptors que financienels costos daquesta, per amb la nova web de la revista guanyaria notorietat al poble isegurament ms anunciants i ms subscriptors. Tamb es poden crear noves frmules depublicitat mitjanant la web.

    Quin tipus damenaces exteriors hi ha i com es poden enviar o

    eliminar?

    Una de les amenaces pot ser laparici en el futur de noves tecnologies que facin obsolescentel format digital PDF (aix noms s una hiptesi). No obstant el fet de digitalitzar elscontinguts fa que lgicament laparici de les noves tecnologies vindran acompanyadestamb lgicament duna forma de migrar aquests continguts si sn digitals duna manerasenzilla, pel que no resulta un problema gaire important.

    Un altre problema que es detecta s la problemtica dels drets dautor. Est clar que totesles publicacions que parlen sn una propietat collectiva (de lassociaci, de lajuntamenti en ltima instncia del poble). A lassociaci, no preocupa gaire que la gent faci serviraquests materials, i de fet s la motivaci del projecte, per que passaria per exemple si untercer fes servir algun daquests materials per algun projecte comercial i aquest tingusxit i alg altre en reclams drets dautor?.

    Aquest s un tema complex, i el que es proposa s acollir-se a alguna llicncia CreativeCommons (per la seva senzillesa) on simpeds de forma clara utilitzar els materials pera projectes comercials i atribuir-sen lautoria i citar-ne la font (o sigui lassociaci) per aprotegir-nos una mica.

  • 8/10/2019 Practica Documentacio Audiovisual

    12/13

    12

    Anlisis intern

    Quines sn les fortaleses del projecte i com es poden potenciar?

    El projecte oferir un servei real dinformaci de lpoca contempornia de la vila dArts,mitjanant la histria escrita a travs de diferents publicacions. Ser un espai centralitzati accessible a tothom que ho vulgui consultar. A ms a ms permetr a lassociaci i a larevista actual ser un referent en la informaci local i dels pobles del voltant. Pesem que nohi ha cap daltre mitj de comunicaci local desprs de la desaparici de TV Arts i de lardio, ni a la vila ni als pobles del costat ms petits.

    En laspecte intern tamb ser un bon mitj per organitzar i catalogar les informacions.Pesem per exemple, que els redactors moltes vegades tenen problemes per trobar articlesque shan escrit en el passat o fotos concretes que es reaprofiten per a altres articles.

    La web en si, tamb pot ser un bon mitj per a potenciar les comunicacions internes com:reunions, coordinaci dels continguts, coordinaci dels correctors, etc..

    Definici objectius a partir de DAFO Interns

    Externs

    Oportunitats

    Possible suport de lajuntament,

    diputaci, en subvencions o pla

    docupaci..

    Ser referent al poble i tota la comarca

    en la difusi de revistes histriques.

    Ms notorietat de la revista que

    la faci ms atractiva de cara alsanunciants.

    Fortaleses

    Desig de lassociaci de millorar i

    modernitzar la seva imatge.

    Continguts interns ms ben

    catalogats.

    Digitalitzaci de continguts

    Debilitats

    Molta feina alhora de digitalitzar

    que no poden assumir tan sols els

    voluntaris.

    Voluntaris poc formats en les noves

    tecnologies.

    Bastant dependents dajuda pblica

    perqu el projecte no sallargui massa.

    Opcions de fortaleses i

    oportunitats

    Demanar ms subvenci a

    lajuntament

    Possibilitat dacollir-se a pla

    docupaci per la contractaci de

    treballador.

    Difondre la web perqu ms

    anunciants estiguin interessats a

    anunciar-se.

    Opcions de debilitats i

    oportunitats

    Formar alguns voluntaris per la

    inserci de continguts al web.

    Intentar convncer lajuntament

    de la necessitat de tenir tot aquest

    material digitalitzat (treballs de recerca

    alumnes institut, etc..)

    Intentar seduir nous anunciants per

    incrementar els ingressos.

    Amenaces

    Falta de suport de les institucions per

    manca de pressupost.

    Obsolescncia dalgunes tecnologies

    per laparici de noves.

    Apropiaci de continguts per part de

    tercers o modificaci daquests

    Prdues dinformaci per fallades

    informtiques o errada humana.

    Opcions fortaleses i amenaces

    Estar preparats per nous formats

    digitals que puguin sorgir.

    Declaraci de llicncia Creative

    Commonsa les publicacions de la web. Poltica de backups. de la web i dels

    arxius digitals en diferents plataformes

    i suports (Cloud, disc dur, DVD)

    Opcions debilitats amenaces

    Intentar ser realistes i si no hi ha

    un pla docupaci anar introduint els

    continguts antics paulatinament.

    Anar formant a la gent de lassociacii voluntaris en ls de les noves

    tecnologies i sobretot en ls del CMS

  • 8/10/2019 Practica Documentacio Audiovisual

    13/13

    7. Conclusions

    8. Bibliografia

    Les conclusions que poden arribar en lmbit documental, s que ser senzill de gestionarper part dels publicadors la inserci dels continguts, tenint en compte que la revista strimestral i per tant i per tan sols es necessita actualitzar els continguts cada 3 mesos pelque fa la revista actual (recordem que la revista en curs tan sols es mostrar la portada index de continguts, no la descarrega, que no estar disponible fins a la prxima edici).

    En lmbit dindexaci de continguts tampoc ser complicat, ja que els mateixosmaquetadors de la revista impresa exportaran tamb el PDF per ledici online perdescarregar i lndex de continguts que es generar automticament amb larxiu font demaquetaci.

    Per altra banda per introduir tot el contingut dedicions anteriors i de revistes antigues,es veu molt difcil tindrel a punt en poc temps, si no es contracta ning per fer-ho en untemps determinat.

    Mases, Blanch Noem. Duran i de Haro, Pau. [arxiu pdf] Documentaci audiovisual -Documentaci en la creaci, producci i difusi de continguts multimdia.

    Duran de Haro, Pau. Camps daplicaci: casos destudi [en lnea]. http://materials.cv.uoc.edu/continguts/PID_00202576/index.html?ajax=true.

    Colaboradores de Wikipedia. Anlisis DAFO [en lnea]. Wikipedia, La enciclopedia libre,2014 [fecha de consulta: 19 de diciembre del 2014]. Disponible en .

    Licencias Creative Commons [en lnea]. [fecha de consulta: 19 de diciembre del 2014]http://es.creativecommons.org/blog/licencias/