123

La visualització del Big Data

Embed Size (px)

DESCRIPTION

Trabajo final de grado en diseño gráfico en BAU. Pol Guàrdia, 2015. Breve entrevista a Jaime Serra en pag. 112

Citation preview

La visualitzaci del Big DataPol Gurdia PujolGrau en Disseny GrfcCurs: 2014/2015Tutor: David Torrents2015Dedicat a la Natlia, per tot.BAU, Centre Universitari de Disseny / TFG 2015/ Pol GurdiandexResum Introducci i presentaciHiptesis1. Big Data1.1. Qu s el Big Data1.2. Nmeros del Big Data1.3. Caracterstiques del Big Data1.4. Procedncia de les dades1.5. Tipus de dades1.5.1. Dades estructurades1.5.2. Dades no estructurades1.5.3. Dades semiestructurades1.6. Arquitectura dun sistema Big Data actual1.6.1. Recollida de dades1.6.2. Emmagatzematge1.6.3. Processament i anlisi de dades1.6.4. Visualitzaci2. Dades, informaci, coneixement.2.1. La Dada2.2. La Informaci 2.3. El Coneixement3. La visualitzaci de la informaci.3.1. Breu histria de la visualitzaci.3.2. Disseny de la visualitzaci.3.2.1. Format3.2.1.1. Esttic3.2.1.2. Animat3.2.1.3. Interactiu 13171921222426262727272828293031333435394647BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdia3.2.2. Enfocament3.2.3. Requeriments pel disseny de la visualitzaci3.2.3.1. Solidesa3.2.3.2. Utilitat i comprensi3.2.3.3. Bellesa i atracci3.2.3.4. Retenci3.2.4. Transformaci de dades a grfca3.2.4.1. Tipus de dades3.2.4.2. Relaciones grfques3.2.5. Models de representaci grfca3.2.5.1. Grfcs4. Visualitzaci del Big Data4.1. s comercial4.2. Periodisme de dades4.3. Recerca4.3.1. Models de sintaxis grfca4.3.1.1. Diagrames darbres4.3.1.2. Grfcs de mosaic4.3.1.3. Grfcs de xarxes4.3.1.4. Nvols de paraules4.4. Artstic5. Casos destudi 5.1. Google Analytics5.2. The New York Times5.3. WikiGalaxi5.4. Writing Without WordsConclusionsReferncies bibliogrfques o electrniquesAnnexosPerfl professional de linvestigador4950 54566163646672757980838589Al meu tutor David Torrents, per esperonar-me durant tot el camAls meus pares, per deixar-me estudiar el que em venia de gustA en Marc Novella, per la vigilncia i els bons consellsA en Sergi Garca, per les referncies i la pacinciaA la Natlia Armenter, per les correccions i el suportA lHelena Gurdia, per les traduccionsAls entrevistats, pel seu temps i dedicaci:Jaime Serra, Dani Llugany i Pablo Martnez13 BAU, Centre Universitari de Disseny / TFG 2015/ Pol GurdiaResumEl Big Data s el terme aplicat al conjunt de grans volums de dades digitals que necessi-ten obligatriament sistemes informtics per a la seva captura, emmagatzematge, anlisi i visualitzaci. Els lmits de la capacitat de captura i emmagatzematge de dades creix cons-tantment i el processament i lanlisi daquestes dades s vital per tal que tinguin alguna utilitat. Un cop analitzades s necessari la visualitzaci dels resultats perqu una persona humana les pugui entendre i interpretar per poder utilitzar-les per un f concret. Una dada s un element cru que s susceptible a ser processat i transformat en informaci precisa i esdevenir, en ser interpretada per un observador fnal, en coneixement.s necessari veure levoluci de la visualitzaci de la informaci a travs de la histria per conixer les eines existents i poder, aix, enfocar el mapeig destructures visuals des duna ptica ms rigorosa i precisa. Ser necessari recopilar les bases teriques que com-posen el disseny de la visualitzaci des de la defnici dels possibles formats, els diferents enfocaments per encarar el procs de sintaxi, els requisits destructura bsica i elemental duna comunicaci visual dinformaci i les diferents relacions entre dades i les corres-ponents representacions formals. Sanalitzaran quatre aplicacions possibles de Big Data on la visualitzaci intervingui duna manera directe i necessria. Com sobservar, cada un daquests casos requereix diferents models de visualitzaci de la informaci com tamb diferents nivells dintervencions per part del disseny grfc que ja no ser noms una pea necessria al fnal del procs danlisi, sin que participar en tots els processos delaboraci destratgies darquitectures Big Data. Paraulesclau:BigData,anlisidedades,dissenydelainformaci,visualitzacidela informaci, infografa, dades massives, dada, informaci, coneixement. 14 BAU, Centre Universitari de Disseny / TFG 2015 / Pol GurdiaResumenEl Big Data es el trmino aplicado al conjunto de grandes volmenes de datos digitales que necesitan obligatoriamente sistemas informticos para su captura, almacenamiento, anlisis y visualizacin. Los lmites de la capacidad de captura y almacenamiento de da-tos crece constantemente y el procesamiento y el anlisis de estos datos es vital para que tengan alguna utilidad. Una vez analizados es necesaria la visualizacin de los resultados para que una persona humana los pueda entender e interpretar para poder utilizarlas para un fn concreto. Un dato es un elemento crudo que es susceptible a ser procesado y transformado en infor-macin precisa y convertirse, al ser interpretada por un ltimo receptor, en conocimiento. Es necesario observar la evolucin de la visualizacin de la informacin a travs de la historia para conocer las herramientas existentes y poder as, enfocar el mapeo de estruc-turas visuales desde una ptica ms rigurosa y precisa. Para ello ser necesario recopilar las bases tericas que componen el diseo de la visualizacin desde la defnicin de los posibles formatos, los distintos enfoques para resolver el proceso de sintaxis, los requisi-tos de estructura bsica y elemental de una comunicacin visual de informacin hasta las diferentes relaciones entre datos y las correspondientes representaciones formales.Se analizarn cuatro aplicaciones posibles del Big Data donde la visualizacin intervenga deunmododirectoynecesario. Alobservarcadaunodeestoscasosserequierendis-tintosmodelosdevisualizacindelainformacincomotambindiferentesnivelesde intervenciones por parte del diseo grfco. ste ltimo, ya no ser solo una pieza clave al fnal del proceso de anlisis, sino que participar en todos los procesos de elaboracin de estrategias de arquitecturas del Big Data.Palabrasclave:BigData,anlisisdedatos,diseodeinformacin,visualizacindela informacin , infografa, datos masivos, dato, informacin, conocimiento. 15 BAU, Centre Universitari de Disseny / TFG 2015/ Pol GurdiaSummaryBig Data is the term applied to large volume digital data sets that require computerized systems for its capture, storage, analysis and visualization. The limitations for huge data capture and data storage are expanding day by day, and processing and analysis of this data is key in order to make them useful. Once we have analysed data its necessary to visualize the results so humans can read it and grasp its contents, in order to use them for a particular purpose. Data is a raw element which can be processed and transformed into accurate information. Once this information reaches an observer who can understand it, then it becomes wis-dom. It is fundamental to analyse the evolution of information visualization through history to know the existing tools and thus focus on the visual mapping of structures from a more rigorous and precise standpoint. It will be necessary to collect the theoretical bases that defne the visual display of information, ranging from the defnition of the possible forms, the different approaches to face the process of syntax, the requirements of basic structure and elemental visual communication of information, to the variety of data relationships and its natural visual representation. Four possible Big Data applications will be analysed where the display takes part in a di-rect and necessary way. As it will be observed, each of these cases require different types ofinformationdisplayaswellasdifferentlevelsofinterventiononthegraphicdesign side. Graphic design wont be just a key piece in the fnal process, but will also participate in the whole developing process of Big Data architecture strategies development. Keywords:BigData,dataanalysis,informationdesign,datavisualization,computer graphics, massive data, data, information, and knowledge.16 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdia17 BAU, Centre Universitari de Disseny / TFG 2015/ Pol GurdiaIntroducciEl Big Data s un concepte relativament nou que fa referncia a totes aquelles dades di-gitals que a causa del seu gran volum requereixen sistemes informtics per a la seva cap-tura, emmagatzematge, exploraci, anlisis i visualitzaci. Larticle Big Data i els nous mtodes de visualitzaci de la informaci escrit per Ferran Adell i Ariel Guersenzavaig i publicat en el nmero 29 de la revista Temes de disseny, introdueix breument el concep-te Big Data i la necessitat de generar equips multidisciplinaris compostos per analistes, programadors i dissenyadors per poder abordar el tractament de dades massives. Aquesta afrmaci juntament amb el creixent s de dispositius tecnolgics que permeten la gene-racidaquestesimmensesquantitatsdedades,provoqueninevitablementlanecessitat de la present investigaci.Cal analitzar quins efectes pot tenir el Big Data en la nostra societat i concretament en la fgura del dissenyador grfc que hauria de ser part important en lelaboraci de les es-tratgies daquests sistemes en lapartat que comporta la visualitzaci fnal dels resultats. Alhora, s necessari analitzar els diferents patrons de visualitzaci existents i determinar si segueixen sent vlids per a la representaci de grans volums de dades o s necessari ampliar, dissenyar o investigar noves sintaxis visuals.TotsemblaindicarqueelBigDatahavingutperquedar-seiquelasevapresnciaen molts sectors ja s una realitat. En aquest sentit no podem determinar amb certesa si el Big Data s un fenomen tecnolgic, digital o fns i tot social, noms podem adonar-nos que s ms que tot aix perqu la seva matria primera s la dada i en conseqncia la informacii,siaquestassusceptibleainterpretaciicomprensi,parlemllavorsdel coneixement.PertantcaltenirencomptequeelBigDatanostansolsunaevoluci tecnolgica ms, sin que afecta directament als pilars on es sustenta la nostra societat.El professor de lOxford Internet Institute, Victor Mayer afrmava en to irnic que N = all. Ho deia en el sentit que el Big Data eliminava la necessitat de mostrejar estadsticament, ja que controlava totes les variables, per si ho mirem sense lptica estadista, la idea del control del coneixement, a priori, requereix un moment de refexi. 18 BAU, Centre Universitari de Disseny / TFG 2015 / Pol GurdiaLa investigaci comenar analitzant laspecte ms teric dels sistemes de gesti del Big Data, buscant entendre la veritable dimensi daquest fenomen i els seus efectes a la nos-tra societat com tamb les parts que componen la seva estructura, el volum i la tipologia de dades que pot suportar, aix com els sistemes actuals de captura, emmagatzematge i anlisi de les dades. Tamb es procura fer un parntesi per aclarir els conceptes de dada, informaci i coneixement des duna vessant tecnolgica per tal de facilitar el procs de comprensi de la present investigaci.Apartirdaqulainvestigaci,comesveurmsendavant,versarenunarecercade carcter histric per buscar els antecedents i exemples que han fet s de la representaci visualdinformaciidadespertransferirconeixement. Aquestprocspermetrtamb analitzar les diferents motivacions, enfocaments i necessitats que han portat a la realitza-ci daquesta prctica. Es busca entendre aix la situaci actual de la infografa a travs de levoluci en la prctica de la visualitzaci del coneixement. Un cop sarribi a lpoca actual, sanalitzar exhaustivament els requisits indispensables que ha de tenir un correc-tedissenydelavisualitzacidelainformaci.Esposarlamiradaenlavisualitzaci estadstica, ja que, com es veur, les representacions ms pictriques i illustratives no serveixenperalarepresentacidedadesmassivesjaquenoespodenautomatitzar en processos informtics.Com a fase fnal del treball dinvestigaci es presentaran quatre exemples de camps on sapliquen tecnologies Big Data i que presenten diferents models per a la visualitzaci de grans volums de dades. I fnalment sanalitzaran quatre exemples representatius de cada un dels camps descrits a partir de lanlisi dels principals requisits formals del disseny de visualitzaci dinformaci que haurem descrit durant la investigaci. Com sha pogut observarenlapresentintroducci,lametodologiaempradaenaquestainvestigacis per al disseny, es nodreix principalment de fonts bibliogrfques per a teoritzar sobre la visualitzaci de dades massives i trobar respostes als objectius que ens plantegem. Tamb es busca el contrapunt de lexperincia mitjanant tres entrevistes a diferents actors rela-cionats dalguna manera amb la visualitzaci de dades a Barcelona.19 BAU, Centre Universitari de Disseny / TFG 2015/ Pol GurdiaHiptesisLa rpida i imparable evoluci de les tecnologies de la informaci i les comunicacions en lltima dcada han provocat, entre altres, laparici del fenomen conegut amb el nom de Big Data, que engloba tota aquella tecnologia encarregada de gestionar volums de dades duna mida superior a les capacitats dels ordenadors convencionals.Enaquestnouparadigmaongransvolumsdedadessncapturats,emmagatzematsi analitzats a travs de complexes sistemes de processament informtics, ens fem diverses preguntes que afecten possiblement al camp del disseny grfc:a. Com es visualitzen els resultats dels processos que impliquen grans volums de dades. Estudiant els models de representaci existents i investigant quines sintaxis visuals seran lesmsadequadesperalavisualitzacidelsresultatsdelsdiferentsprocessamentsde dades massives.b. Quina ser la funci del dissenyador grfc en els processos delaboraci destratgies Big Data i amb quins altres professionals de diferents mbits haur de collaborar.20 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdia21 BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdia1. Big Data1.1. Qu s Big DataEl terme Big Data es va fer servir per primer cop en un article publicat el juliol de 1997 pels investigadors del Ames Research Center de la NASA Michael Cox i David Ellswor-th, i lempraren per explicar que el ritme de creixement del volum de les dades comena-va a ser un problema pels sistemes informtics de lpoca.Per no fou fns al 2011 quan una de les consultories estratgiques ms prestigioses del mn: McKinsey & Company, present linforme Big data: The next frontier for innova-tion, competition, and productivity i intent defnir novament el terme. James Manyika, co-autor de linforme, defnia el Big Data com el conjunt de dades les quals la seva mida va ms enll de la capacitat de captura, lemmagatzematge, la gesti i lanlisis. (Manyi-ka, et al., 2011)Ms recentment el 2012, Gartner, empresa americana de consultoria i investigaci de les tecnologies de la informaci, completava la defnici: Sn actius dinformaci caracterit-zats pel seu alt volum, velocitat i varietat, que demanen solucions innovadores i efcients de processat per la millora del coneixement i la presa de decisions en les organitzacions (Lapkin, 2012).Tamb el 2012 la consultoria internacional de fons dinversi Fidelity Worldwide Ives-tment, public larticle In Perspective on defneix Big Data com: el terme que designa el conjunt de dades de gran volum i generalment desestructurades que resulten difcils de manipular usant les aplicacions de bases de dades convencionals. (Fidelity, 2012)Ticbeat.comsunapublicacidigitalindependentquedefniaenelseuinformede loctubre de 2012 Big Data: Es refereix a lenorme quantitat de dades que des de fa anys es genera constantment a partir de qualsevol activitat que impliqui ls de la informtica dalguna manera.22 BAU, Centre Universitari de Disseny / TFG 2015 / Pol GurdiaWikipedia defneix Big Data com un terme aplicat a conjunts de dades que superen la capacitat del programari habitual per ser capturats, gestionats i processats en un temps raonable.Rayn(2014)introdueixlaideadequeelBigDataslatecnologiaquet com a obsessi eliminar el mostreig per sempre. Entenem mostreig, en la seva excepci estadstica, com a tcnica per a la selecci duna mostra a partir duna poblaci. s a dir que el Big Data s la voluntat de controlar totes les variables sense la necessitat de discriminar cap dada. Com es pot observar, el concepte Big Data encara no est del tot defnit, tampoc ho estan les seves verdaderes possibilitats i els seus lmits. Sembla per que totes les veus expertes en la matria, coincideixen en dos punts bsics de la defnici: el gran volum de dades i la tecnologia necessria per poder-les captar, emmagatzemar i analitzar.De fet, la denominaci de Big Data sembla ser ms un truc comercial per fer ms atractiva lestadstica nua i crua de sempre que no pas una nova invenci revolucionria. Potser s que el punt ms innovador aportat per aquest nou concepte s la seva referncia al volum de les dades. El creixement que sest produint en la generaci del volum daquestes da-des s que s un aspecte signifcatiu que mereixeria la menci dautntica revoluci. En el segent apartat analitzem quina s la situaci daquest volum.1.2. Els nmeros del Big DataEnlltimadcadahemvistcomlatecnologiahapatitunfortdesenvolupamentiuna evoluci extraordinria, massifcant i estandarditzant nous productes del sector de la tec-nologia de la informaci i la comunicaci TIC. Aquesta evoluci de la tecnologia, jun-tament amb labaratiment progressiu de lemmagatzematge, dels dispositius, servidors i les tecnologies necessries per unir-los entre si, ha provocat lexplosi del fenomen Big Data. Per els principals culpables del naixement daquesta disciplina i causants directes de lincrement de volum de dades sn tres: els dispositius mbils amb connexi a inter-net, el comer electrnic i les xarxes socials. Aquests tres elements permeten generar, a un sol usuari, una gran quantitat de dades. Sabem que actualment, en el mn, existeixen uns 5.200 milions de dispositius mbils en actiu, per tant el volum de dades s exponen-cial i sincrementa cada any. El 2013 el total de connexions amb dispositius mbils fou de 23 BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdia7.000 milions de connexions un increment del 8% respecte a lany anterior, per sestima que per lany 2018 les connexions arribin a 10.200 milions. Aquest fet suposa que en els segents quatre anys el trfc de dades creixer un 63% en els smartphones, un 87% en tabletsiun30%enporttils. Amscalafegirunincrementdun113%endispositius M2M (Machine to Machine) que permeten lintercanvi de dades entre dispositius com ara terminals de punts de venda TPV, GPS o alarmes (Abad, 2014).Les xarxes socials, per la seva banda, tamb faciliten aquest augment del volum de dades. Per exemple, Twitter t aproximadament 200 milions dusuaris que produeixen 340 mi-lions de piulades al dia, uns 4.000 per segon, que generen 12 gigabytes, per lecosistema Twitter (fotos, vdeos i altres continguts) genera fns a 8 terabytes per segon.Facebook, la xarxa social ms important del mn, ja ha superat els 901 milions dusuaris ac-tius. Aquests usuaris consumeixen 700 bilions de minuts al mes a la pgina, creen ms de 90 tipus diferents de continguts i pengen 750 milions de fotografes cada 2 dies (Abad, 2014).En el comer electrnic Amazon lidera el mercat de la venda en lnia de tot tipus de pro-ductes. T un catleg disponible online de ms de 22 milions de productes i un rcord de vendes en un dia de 36,8 milions darticles a tot el mn, el que suposa la venda de 426 productes per segons. Walmart, lempresa de venda al detall ms gran del mn, gestiona ms dun mili de transaccions en lnia per hora (Martin, 2013).Sianalitzemlesdadesqueestransmetenaescalaglobalobservemqueennoms60 segons es publiquen 6 articles a Wikipedia, senvien 204 milions de correus electrnics, sobren 100 comptes nous a Linkedin, 320 a Twitter, es logegen 277.000 usuaris a Face-book i es miren 6 milions de perfls, sescriuen 100.000 tweets, es descarreguen un total de 47.000 aplicacions a dispositius mbils, es pugen ms de 30 hores de vdeo a YouTube i es visualitzen 1,3 milions de vdeos, sescolten 61.141 hores de msica, es veuen 20 mi-lions de fotos, es produeixen $83.000 en ventes online, i hi ha 20 vctimes de suplantaci didentitat (Intel, n.d.).Lany2011elCEOdeGoogle,ErciSchmidttvaafrmarquelahumanitathaviacreat des dels seus inicis fns al 2003 una quantitat equivalent a 5 exabytes, uns 5.000.000.000 de gigabytes, i va afegir que actualment aquesta xifra es generava cada 2 dies. Per tant 24 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdiapodemafrmarqueduranteldiadavuiesgeneraran2,5trilionsdebytesdedades.El 2010 McKinsey Global Institute (MGI) va estimar, que durant lany 2020 es generaran 35 zetabytes de dades, el que signifca un increment del 1.845% respecte al 2010 (Turner, Schroeck i Shockley, 2013). Bit (b) = 1 o 0Byte (B) = 8 bitsKilobyte (KB) = 103= 1.000 bytesMegabyte (MB) = 106 = 1.000.000 bytesGigabyte (GB) = 109 = 1,000,000,000 bytesTerabyte (TB) = 1012 = 1,000,000,000,000 bytesPetabyte (PB) = 1015 = 1,000,000,000,000,000 bytesExabyte (EB) = 1018 = 1,000,000,000,000,000,000 bytesZetabyte (ZB) = 1021 = 1,000,000,000,000,000,000,000 bytesYottabyte (YB) = 1024 = 1,000,000,000,000,000,000,000,000 bytesNickHeudeckerdirectorderecercadeGartnerafrmaquelany2013vaserlanyde lexperimentaci i els primers projectes de Big Data i el 2014 ha seguit el mateix cam amb un increment del 5% dels projectes implantats en organitzacions en els Estats Units. Sembla a priori un increment poc destacable, per pel 2015 les estimacions preveuen que el sector del Big Data generar un total de 4,4 milions de llocs de treball a tot el mn i sinvertir un total de 132.000 milions de dlars en tecnologia i serveis relacionats (Abad, 2014). Els sectors que rebran majoritriament aquestes inversions en Big Data seran el comer, la indstria, la salut, la informaci i la comunicaci, la banca i fnances, les as-seguradores i ladministraci pblica. Sestima que limpacte de la inversi en Big Data sobre el Producte Interior Brut (PIB) de la Uni Europea ser dun 1,9% el 2020.1.3. Caracterstiques del Big dataQuan es mirava dexplicar el concepte Big Data en lapartat anterior, podrem destacar un dels punts en qu tots els experts en la matria estaven dacord i era el que feia referncia al gran volum de dades que comportava la disciplina Big Data. Per no s lnic punt ca-racterstic, Doug Laney, analista de Gartner, introdua, en el seu article de 2001 3D Data 25 BAU, Centre Universitari de Disseny / TFG 2015/ Pol GurdiaManagement: Controlling Data Volume, Velocity, and Variety, el concepte de les 3V per entendre millor les caracterstiques del Big Data: Volum: Un sistema Big Data ha de ser capa demmagatzemar grans quantitats de dades de lordre de petabytes o superiors. Varietat: Parlem de origens mltiples que proporsionen dades en un gran ventall de for-mats diferent. Aquesta informaci no sempre est estructurada, un sistema Big Data ha de ser capa demmagatzemar qualsevol tipus de dada sense la necessitat de pre-processar-la o ni tan sols dindexar-la. Velocitat: La tecnologia Big Data ha de ser capa de rebre, emmagatzemar i processar grans volums de dades. A ms a ms, ha de permetre mostrar els resultats en temps real o en un temps molt ms curt que els sistemes tradicionals.DarreramentdiferentsautorscomSerrat(2013)iMoreno(2014)acostumenaafegir2 V ms que amplien i ajuden a defnir les caracterstiques del Big Data: Variabilitat: Cal tenir en compte que la dada acostuma a ser capturada automticament fruit duna acci variable que provoca lalteraci constant dels resultats. Aix doncs, les tecnologies Big Data han de ser fexibles a lhora de rebre i emmagatzemar dades varia-bles en mltiples formats i que evolucionen constantment. Valor: Per tal que el Big Data sigui important en una organitzaci s indispensable que la informaci obtinguda desprs de lanlisis de les dades captades tingui un benefci di-recte com per exemple la optimitzaci logstica o la reducci de costos. Aix doncs, un sistema Big Data ha dextreure valor qualitatiu, en forma de nova infor-maci de grans volums de dades estructurades o no, de la manera ms rpida i efcient, adaptar-se a tots els formats actuals i futurs.26 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdia1.4. Procedncia de les dadesLa digitalitzaci en qu es troba immersa la societat actual afecta a tots els nivells i ca-pesdaquesta,desdelmbitdomsticfnsalmnempresarialiindustrial.Creixls dinfnitatdedispositiusdomsticstecnolgics,lesxarxessocialsjaformenpartdela vida quotidiana de la gran majoria de ciutadans, les ciutats comencen a incorporar sensors (smartcities) i, a causa de tot aix, la informaci generada pels mateixos usuaris i tamb per les empreses es multiplica duna manera exponencial fns ara mai vista.Aix doncs, les dades procedeixen duna gran varietat de fonts, una de les principals s sensedupteinternet.Lenormenmerodepginesweb,lablogosfera,lesxarxesiels mitjans socials, wikipedia, les agncies de notcies digitals, els comentaris i opinions dels usuaris, les seves cerques als buscadors, els vdeos i imatges penjats cada minut, les tran-saccions de comer purament electrnic, mails, etc. I a ms a ms dinternet apareixen nous generadors massius de dades com els mbils, amb comunicacions 3G, 4G i GPS, els registres de trucades (CDR), fns al desplegament massiu de sensors o mesuradors que capturenqualsevolesdevenimentparticular(velocitat,temperatura,pressi,variables meteorolgiques,qumiques,etc.).Lainformaciconsideradabiomdicacomlesem-premtes dactilars, escaneig de retina, reconeixement facial, gentica, etc. Aquesta llista s noms una petita mostra de la capacitat de generaci de dades que permet la tecnologia actual (Moreno, 2014). Actualment noms el 3% de les dades potencialment tils estan sent analitzades per sis-temes Big data per, es preveu que a lany 2016 saugmenti laproftament de tot aquest univers digital fns el 23% (643 exabytes) (Manyika, et al., 2011).1.5. Tipus de dades Totes aquestes fonts de dades, descrites en lanterior punt, comporten una gran varietat de formats de dades. Aquest fet ha generat levoluci dels sistemes dexplotaci de dades cap al Big Data, que s capa de capturar, emmagatzemar i analitzar totes aquestes dades de fonts i formats tan diversos. Es poden classifcar, segons Serrat (2013) i Lpez (2013), en tres grans grups: dades estructurades, dades no estructurades i dades semiestructurades.27 BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdia1.5.1. Dades EstructuradesSn aquelles dades que tenen defnida la seva longitud i el seu format, s informaci ja processada, fltrada i en format estructurat. Les dades estructurades sn els fonaments de les bases de dades relacionals. En aquests tipus de models, tota la informaci es guarda en taules amb diferents camps que es troben relacionats entre ells. Acostumen a ser da-des numriques, dates, cadenes de carcters que es consulten mitjanant sistemes SQL. Aquestes dades sobtenen a partir de dues fonts molt diferents: les dades generades per persones i per les mquines. Les dades generades directament per persones poden ser re-gistres de comptabilitat, llistats telefnics, llistes de clients, formularis de contacte online, navegaci per una web, etc. I les dades generades per mquines poden ser qualsevol tipus de sensor com ara un termmetre digital o un GPS, equips mdics, comptadors elctrics, lectors de codi de barres, radars de trnsit, aplicacions, xarxes, servidor, operacions ban-cries, compra i venda daccions, etc.1.5.2. Dades no estructuradess tota aquella informaci processada i amb un format defnit per que no es troba es-tructurada o que t una estructura variable. Lpez (2013) destaca que el 80% de les dades quegeneraunaempresaenlmbitinternsnnoestructurades.Sobtenenapartirde duesfontsdeprocednciasimilaralesdadesestructurades:lesgeneradesdirectament per lacci de les persones i les generades per mquines. Les primeres sn les dades ge-nerades per les persones, com ara textos de word, mails, whatsapps, 140 carcters duna piulada, un comentari en una web, informaci escrita a Linkedin, etc. I tamb el que no s text, per que prov duna acci humana com ara: vdeos, infografes, fotografes, gifs, etc. I les segones, les dades generades per accions automtiques de mquines com ara les imatges per satllit, captures de fotografes o vdeo des de cmeres de vigilncia, grfcs meteorolgics, etc.1.5.3. Dades semiestructuradess informaci no processada que es pot presentar en qualsevol format i estructura. s a 28 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdiadir, aquestes dades segueixen una estructura implcita per no tan regular com per poder-se gestionar i automatitzar de la mateixa manera que la informaci estructurada.Les dades semiestructurades tenen les seves prpies meta dades incorporades que gene-ren aquesta estructura implcita per tant es pot afrmar que s una estructura dinformaci viva i que es fa difcil analitzar-la. Un dels exemples ms clars de dades semiestructu-rades s una pgina web. 1.6. Arquitectura dun sistema Big Data actualPrenentcomarefernciaprincipallextensaclassifcacideSerrat(2013)enquana larquitectura dun sistema Big Data es redissenya la seva visualitzaci i sexpliquen els quatre passos que el componen.1.6.1. Recollida de dadesExisteixen dos maneres mitjanant les quals un sistema Big Data es connecta de manera peridica a les seves fonts de dades. Per lots (Batch) que funciona com una cpia de se-gretat, recull noms la informaci nova comparant-la amb la informaci ja recollida en anteriors conexions, i per transmissi en temps reals (Streaming) que consisteix en estar conectarpermanentment,esfaservirmoltensistemesdeseguretatidevigilanciaque necessiten monitoritzar en temps real totes les dades possibles. Grfc 1. Funcionament duna estructura de Big Data. Font: Elaboraci prpia.29 BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdia1.6.2. EmmagatzematgeA grans trets lemmagatzematge del Big Data es pot dividir en dos elements principals: el sistema de ftxers i la base de dades. El ms com, fns al moment, era ls de les bases dedades,peramblanecessitatdecapturarlamximavarietatdedadessnecessari combinar aquestes dues tecnologies per operar correctament.Els sistemes de ftxers sn el pilar bsic de larquitectura dun sistema Big Data per dues raons: sn imprescindibles per poder treballar amb ftxers no estructurats i sn sistemes escalables. Per tant permeten acceptar multitud de formats darxius i es pot augmentar i reduir la seva capacitat demmagatzematge sense afectar el rendiment de tot el sistema. Aquest sistema consisteix en una xarxa dordinadors interconnectats que funcionen com un de sol. Daltra banda, les bases de dades emmagatzemen dades en taules que es poden relacionar entre elles, aquest sistema va originar una estandarditzaci del llenguatge per a sistemes de gesti de bases de dades relacionals conegut com a SQL (Structuret Query Language). Aquestsllenguatgespermetenrealitzar,dunamaneramoltsenzillairpida,consultes sobre informaci dinters. Per aconseguir que el sistema sigui rpid cal crear prviament ndexs de les dades introdudes en el mateix, fet que comporta un gran cost de creaci i manteniment. Tampoc permet fer canvis en les taules un cop ja han estat defnides i el rendiment de tot el sistema es veu afectat quan es supera el volum demmagatzematge de lordre de terabytes.Per tots aquests problemes que comporten aquests sistemes de bases de dades, les grans empreseshancomenatatreballaramblesbasesdedadesNoSQLoNot-onlySQL. Aquestssistemesdedadesaportenmsfexibilitat,jaquenonecessitenestructures fxes com les taules, sin que sn totalment escalables i no s necessria la creaci, ges-tiimantenimentdelsndexs,jaquelainformacisemmagatzemahoritzontalment. Els sistemes SQL sn ms fcils dusar a una velocitat superior, per en contrapartida no sn escalables i demanen un hardware especialitzat i ms car. Els sistemes NoSQL, en canvi, permeten volums ms grans de dades, ms varietat de les mateixes i que el hardware sigui ms fexible. Per altra banda, s un sistema molt ms lent i ms complex de confgurar i programar.30 BAU, Centre Universitari de Disseny / TFG 2015 / Pol GurdiaUnbonsistemaBigDatanodescartacapdelsdossistemesdescrits,sms,utilitza ambds paradigmes. Es crea un sistema de ftxers o una base de dades NoSQL per em-magatzemargransvolumsdedadesestructuradesono,esprocessenisanalitzenif-nalmentsemmagatzemenentaulesdelsistemaSQLaconseguintmsvelocitatenles consultes dels resultats.1.6.3. Processament i anlisi de dadesLagestidedadespotarribaraserunprocsmoltcomplex,especialmentquangrans volums de dades provenen de mltiples fonts. Analitzar aquestes dades implica vincular, connectar i correlacionar-les entre elles mitjanant algoritmes i frmules matemtiques queimpliquentcniquesdepredicci,associaci,segmentaci(clustering),arbresta-xonmics, sries temporals i xarxes algortmiques (Lpez, 2013) i aix poder-ne extreure informaci.Pertaldobtenirsolucionsiresultatsptimsdaquestsprocessosdanlisi degransvolumsdedadesshanpopularitzatiestandarditzatdiversosmodelsdepro-gramaci, dos dells destaquen per damunt la resta: MapReduce i les Massive Parallel Procesing (MPP).El MapReduce fou creat per Google, t lobjectiu de millorar el processament de grans volums de dades de lordre de gigabytes i terabytes realitzant processos de computaci ambtractamentdequalsevoltipologiadedades(estructurades,semiestructuradesino estructurades). s un sistema que no necessita grans estructures de hardware, t molt bon rendiment i permet ser escalable. Com a principal inconvenient proposa un temps de pro-cessament lent, ja que ha dexecutar mltiples processos a lhora. Consta de dues fases principals executades enunsistema format permltiplesnodesoordinadors: el Mapi el Reduce. La primera divideix arxius entrants en diferents blocs i cada un daquest bloc es processa independentment amb una funci algortmica que dota dun ordre lgic a les dades entrant. La segona executa diferents funcions (agregaci, divisi, suma, percentual, mxim, etc.) a partir dels valors generats per els algoritmes del procs previ del Map. El concepte del MPP s similar al sistema MapReduce perqu intenta distribuir en parallel els processos danlisis en diferents nodes. Per noms funciona amb dades estructurades i el fa menys til en sistemes complexos de Big Data. Utilitza llenguatges de consultes 31 BAU, Centre Universitari de Disseny / TFG 2015/ Pol GurdiaSQL perqu actua sobre bases de dades relacionals. El principal atribut s que ofereix una gran velocitat de consulta sobre grans volums de dades. Per contra, sn sistemes ms cars degut a que cal desenvolupar software i hardware conjuntament.Larquitectura de processament necessria per un sistema Big Data, majoritriament amb mltiples tipus de dades capturades, s aquella que combina els dos sistemes per poten-ciar els seus punts forts. Un exemple darquitectura mixta ideal per a dades no estructu-rades, s aquella que combina, en primer lloc, un sistema de ftxer o sistema NoSQL per alemmagatzematgedelesdadesilespreprocessaapartirdunmodelMapReducei, en segon lloc, incorpora els resultats a un sistema de bases de dades SQL per, fnalment, ambunmodeldeprocessamentMPP,aconseguirresultatsdelesconsultesaunagran velocitat.1.6.4. VisualitzaciUn cop analitzades totes les dades es necessita un sistema de visualitzaci que ofereixi elsresultatsdunamanerafcil,comprensibleiprcticaperalasevacomprensi. Ara b, sobserva que aquest apartat s el que ha tingut una atenci i, en conseqncia, una evoluci menys important comparada amb tots els altres aspectes del Big Data que han patit una transformaci molt important en els darrers anys.32 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdia33 BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdia2. Dada, informaci, coneixement.Linformaci no s coneixement i el coneixement no s saviesa. James Gleick2.1. La DadaDelllatdatum(elqueesdna)allque,comatal,sirreductiblealsubjectei aqualsevoldeducciapriorstica.(GranEnciclopdiaCatalana).Wikipediadefneix dadacomUnarepresentacisimblicadunaentitat.Ladadanotvalorsemntic (sentit)ensimateix,perconvenientmenttractada(processada)espotemprarenla realitzaci de clculs o en la presa de decisions. i afegeix que s lexpressi mnima de contingut sobre un tema. Shedroff (1999) tamb afrmavaque una dada s un producte fruit del descobriment, la investigaci, la recopilaci o la creaci. s lelement material ms cru i bsic que es fa servir per construir les nostres comunicacions.Ferrell, Hirt i Ferrell (2004) afrmen tamb que Les dades sn descripcions numriques o verbals sobre estadstiques o altres coses que no han sigut analitzades o resumides.Daquesta manera podem afrmar que les dades, per elles mateixes, no representen infor-maci, no sn un missatge complet, sin que sn elements discontinus que representen un o diferents fets.Grfc 2. Representaci del procs dobtenci del coneixement. Font: Elaboraci prpia.34 BAU, Centre Universitari de Disseny / TFG 2015 / Pol GurdiaEn un sistema Big Data la dada representa la unitat mnima que prov directament del mostreigdediferentsfontsdecaptura.Snexpressionsgeneralsquedescriuenentitats bsiques sobre les quals operen diferents algoritmes i parmetres de processat. Que aques-tes dades es transformin en informaci vera, legtima i til dependr, precisament, de la detecci encertada de les correlacions entre elles i la correcta elecci dels parmetres i algoritmes necessaris en el seu processament.2.2. La Informaci La informaci, segons laccepci del mot en el context de les telecomunicacions i de la teoria de la informaci, est constituda per un grup de dades supervisades i ordenades, queserveixenperconstruirunmissatgesobrealgunfet.Wikipediapermetampliarla dimensi del signifcat i defneix la informaci com el fet de processar, manipular i or-ganitzar dades duna forma que produeixin coneixement i evadeixin el desordre. s tan sols una extensi del que Claude E. Shannon, considerat el pare de la teoria de la infor-maci, va descriure en la publicaci Teoria Matemtica de la Informaci la informaci s el que redueix la incertesa. (Shannon, 1948).En altres paraules, i ms recentment, Chiveanato (2006) afrmava que la informaci s aquellconjuntdedadesquepossexenunsignifcat,detalmaneraqueaugmentenel coneixement de qui saproxima a contemplar-los. Per altra banda, Ferrell et al. (2010) afrmaven en clau ms empresarial que la informa-ci comporta una interpretaci de dades i coneixements que tenen sentit i que serveixen per prendre decisions. Aquest s lenfoc empresarial, tot i tenir algunes contradiccions, que explica una de les principals aplicacions i funcions dels sistemes Big Data, com tam-b el fenomen de la seva rpida evoluci i creixent inversi econmica.La informaci s, segurament, lactiu ms important per a qualsevol tipus dorganitzaci. Igual que, histricament, els estats i organitzacions de tot el mn shan barallat per con-trolar territoris, per disposar de matries primeres i de m dobra econmica, segons Lyo-tard (1987) no s agosarat dir que ara es barallin pel control de la informaci. s impor-tant perqu ladequat aproftament racional de la informaci s la base del coneixement.35 BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdia2.3. El ConeixementAquest aspecte s una mica ms complex de defnir pel seu component abstracte i per les mltiples perspectives des don es pot abordar. Sense voler entrar en la refexi histrica que la flosfca, la epistemolgica i la cientfca han aportat a la matria, prenem com a punt de referncia la defnici del principi cognitiu de lsser hum, que s la facultat de processar i valorar la informaci a partir de la percepci, lexperincia i la subjectivitat. En la mateixa lnia Ferrell et al. (2010) comentaven El coneixement s la comprensi de dades mitjanant el seu estudi o per lexperincia.Per entendre millor el concepte de coneixement cal diferenciar-lo de la simple informa-ci. Ambds conceptes es nodreixen dafrmacions certes per si b la informaci pot existir independentment de qui la fa sevir i es pot emmagatzemar en diferents tipus de suports, el coneixement noms existeix si hi ha una ment amb la intelligncia sufcient peraposse-loifer-loservir.Undelsaspectesmsdiferenciadorsdelconeixement envers la informaci sn les correlacions que la ment intelligent genera entre diferents informacions per generar-lo (Shedroff, 1999).El coneixement t diverses accepcions i un signifcat ms ampli, tamb existeixen molts tipusdeconeixementsadaptatsdirectamentapropsitsfnalscomaraelsaberartstic, coneixementdelallengua,lexperincia,etc.Perlafrmaciquelainterpretaciila comprensi terica dinformacions s la base del procs del coneixement, ens proporcio-na laproximaci ms efcient per entendre la seva importncia en un procs del Big Data. Si es vol entendre els sistemes Big Data cal interpretar les paraules de Lyotard (1987) que predeia, ja lany 1979, la importncia que tindria levoluci de la tecnologia en la genera-ci i distribuci del coneixement: s raonable pensar que la multiplicaci de les mqui-nes dinformaci (entenem per mquines dinformaci aparells tecnolgics que possibi-liten ladquisici, classifcaci, disposici i explotaci de continguts informatius) afecta iafectarlacirculacidelsconeixementstantcomhohafeteldesenvolupamentdels mitjans de circulaci de persones primer (transport) i de sons i imatges desprs (media). Tot seguit afrmava que la naturalesa del coneixement es veuria afectada dalguna manera per aquesta transformaci tecnolgica i creia fermament que si el coneixement no podia ser tradut en el llenguatge de les mquines (digital) aquest es deixaria de banda. Sembla 36 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdiadoncs que la idea de digitalitzar-ho tot, com la nova corrent tecnolgica de la internet de les coses, respon a aquesta previsi de Lyotard i, en laltre extrem de lequaci, sembla que aquesta informaci i el consegent coneixement, resultant de lanlisi daquesta digi-talitzaci, provoca la ja estesa i coneguda mercantilitzaci del saber. Aix doncs i en conclusi, no s agosarat dir que ladequat mostreig i processament de les dades produeix informaci que, amb una correcta gesti i visualitzaci, s suscep-tible a ser interpretada per un receptor fnal que aconseguir, aix, incrementar el seu nivell de coneixement. Aquests coneixements tenen una valor cada vegada ms impor-tant, ja que, en un mn globalitzat molt competitiu, permeten augmentar les possibili-tats dencert en la presa de decisions, la resoluci adequada de problemes i lanticipaci i previsi del futur.El fet que la informaci i el coneixement estiguin patint una revaloritzaci tan gran del seuvalor,juntamentamblareduccidelcostenelsprocessosdecapturar,mostrejar, processar i en defnitiva transformar grans volums de dades en informaci han provocat queelBigDatashagiconvertitenunaeinaestratgicadevitalimportnciaperales principals organitzacions, empreses i governs darreu del tot el mn.Lacapacitatdetransformarladadaeninformacisestconvertint,doncs,enunnou sectoreconmicvaloratenmsde132.000milionsdedlars(Abad,2014),unaxifra moltimportantquetansolssunaestimaciaproximadaenunentorndecanvismolt rpids. Un exemple de la tendncia s la compra per part de Hewlett-Packard el 2011 per 11.000 milions de dlars de lempresa informtica Autonomy especialitzada enlanlisi de grans conjunts de dades, poc desprs HP va presentar una nova plataforma anomenada HP Next Generation Information Platform (Fidelity, 2014). El professor Vicktor Mayer (2013) afrmava que la dada s el nou or per afegia que noms podia ser desenterrada mi-tjanant processos que en facin aforar la informaci que amagaven i aports coneixement.En defnitiva, una dada s un element cru (100.000), la informaci s quelcom ms pre-cs (llibres venuts lany 2014 = 100.000), i fnalment, el coneixement sobt mitjanant lanlisi daquesta informaci (el 2014 s lany amb ms vendes des del 2010). 37 BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdia38 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdia39 BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdia3. La visualitzaci de la informaci.Lesparaulesdivideixen,lesimatgesgenerenconnexionsOttoNeurath(creadordel sistema estndard internacional de llenguatge visual ISOTYPE el 1940)Entenem la visualitzaci de la informaci com el procs manual o automtic mitjanant el qual aconseguim representar informaci, objectivament i amb la mnima prdua de dades, mitjanant diferents tcniques i recursos visuals (Crdoba., Alatriste, 2012). El professor Hearst (2003) de la Universitat de Califrnia amplia, per la seva banda, la defnici de visualitzaci de la informaci: consisteix en mostrar la informaci en una representaci espacial o grfca, per facilitar-ne la comparaci, el reconeixement de patrons, la detecci decanvisiaproftaraltresaptitudscognitivesprpiesdelsistemavisual.Enlacerca duna defnici ms propera al sector del Big Data trobem que Moere i Purchase (2011) saventuren a defnir la visualitzaci dinformaci com un conjunt de mtodes ideats per donar suport als ssers humans per comprendre ianalitzar grans i complexos conjunts de dades.A partir del 1990 es popularitza la paraula infografa per referir-se a les imatges generades per ordinador, per actualment i com en els seus orgens la infografa es refereix a la re-presentaci grfca de dades, informacions o coneixements per tal que siguin reconeguts i entesos duna forma clara i rpida. Per tant, quan en les segents ocasions sanomeni infografa far referncia a la visualitzaci grfca de dades i informaci, no necessria-ment generades a partir de processos digitals. 3.1. Breu histria de la visualitzaci.Tot i que existeix un corrent intellectual que afrma que les pintures rupestres tenien un sentit purament esttic i decoratiu. Altres defensen que, algunes daquestes pintures, snlesprimeresvisualitzacionsqueconeixemquecontenieninformaciidaquesta manera pretenien transmetre coneixement de fets i esdeveniments destacables. Deixant de banda aquesta discrepncia, aquestes pintures, sn la primera evidncia del fet que lhome possea una ment abstracta capa de representar elements fguratius per explicar fets (De Jorge, 2014).40 BAU, Centre Universitari de Disseny / TFG 2015 / Pol GurdiaLa generaci de sistemes visuals evoluciona impulsada per la necessitat de transmetre, didcticament, el coneixement de les principals cincies de lpoca com ara lastronomia, la cartografa, la medicina, la botnica, larquitectura i lenginyeria. Al llarg de la histria apareixen mltiples proves de la necessitat dillustrar tcnica i cientfcament el coneixe-ment. Sutilitza la obra de Christianson (2012) en la majoria de referncies histriques i sexposen les infografes comentades en els annexos daquesta investigaci.Undelsmsanticstestimonisdaquestatcnicavisualeltrobemalasegonapartdel llibre Hangdi Neijing escrit entre el 425 i el 221 aC, popularment conegut com a Cnon Intern de lEmperador o Cnon Interior de Huangdi, on sexplica la tcnica millenria de lacupuntura amb gran detall a travs dillustracions del cos hum amb indicacions espa-cials dels punts escaients on fer les puncions, les normes i els procediments per dominar aquesta tcnica millenria. (Annex A, Foto 01)ClaudiPtolomeufouunmatemtic,astrnomigegrafgrecoegipciquepelsvoltants de 145 dC va presentar de forma visual el model dunivers geocntric, que explicava de forma visual que la terra estava immbil i ocupava el centre de lunivers, i que el sol, la lluna, la resta de planetes i estrelles rotaven al seu voltant. (Annex A, Foto 02)Tamb el mateix Ptolomeu va recopilar, analitzar i presentar el coneixement geogrfc que hi havia fns aleshores. A lany 150 d.C. va presentar tot aquell coneixement en for-ma de mapamundi dissenyat i dibuixat pel gegraf Agatdemon tamb grec i resident a Alexandria. (Annex A, Foto 03)Al voltant del 300 dC el flsof neoplatnic Porfri illustr en forma darbre els concep-tes que anaven des de luniversal fns a lmbit particular. Una obra clau per a les futures normes de classifcaci taxonmiques i tamb per a la futura obra de 1296Arbre de la cincia de Ramon Llull (Annex A, Foto 04) que tamb empr la illustraci per explicar grfcament a un pblic no universitari, en 16 arbres, els principis bsics de cada cincia (Christianson, 2012) (Lima, 2012).Ja lany 1019, Abu Rayhan al-Biruni, un erudit matemtic, fsic, astrnom, flsof, his-toriador, farmacutic i viatger que fou un dels intellectuals ms destacats del mn isl-mic, feu servir la illustraci acompanyada danotacions per explicar diferents teories i 41 BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdiadescobriments. Una de les ms clebres fou una illustraci que apareix en el seu Llibre dInstruccionssobreelsPrincipisdelartdelAstrologiaonexposadunaformamolt clara i entenedora les diferents fases de la lluna. (Annex A, Foto 05)AmblaparicidelaimpremtadeJahanesGutenbergaproximadamentel1454esva donarlimpulsdefnitiuperalareproducciindustrialdellibresienconseqnciala normalitzaci de les representacions visuals en el seu interior.Les nombroses illustracions de les invencions de Leonardo da Vinci entre els anys 1493 i 1505 van ser un clar referent per a les visualitzacions tcniques sobre mecnica i enginye-ria. Da Vinci tamb fou conegut, entre altres coses, per les seves illustracions de biologia i concretament per ser la primera persona que illustr correctament el fetus hum en les diferents posicions fetals i va permetre aportar ms comprensi envers el sistema repro-ductiu hum. (Annex A, Foto 06)Per laportaci ms important per a la divulgaci visual mdica vingu amb la publica-ci de De Humani Corporis Fabrica de Andreas Vesalius el 1543, notable metge que feu un estudi exhaustiu i de gran qualitat a partir de disseccions de cadvers humans, amb elpreviconsentimentdelesglsia,provinentsdepresoscondemnatsamort.Escreu que les illustracions eren obra de Jan van Calcar deixeble de Tici, mxim exponent de lescola Veneciana. Les obres grfques eren artsticament notables i tenien una qualitat excellent, foren reprodudes mitjanant xilografa sobre fusta de boix i impresos a Basi-lea per un dels millor impressor de lpoca: Joannis Oporini. (Annex A, Foto 07)Al mateix any es publica el De revolutionibus ornitun coelestium (Sobre les revolucions de les esferes celestes) de lastrnom Nicolau Coprnic on formula, per primera vegada, elmodelheliocntricambelsolalcentredelunivers. Aquestmodelsoposavafron-talmentambelpensamentgeneraljust1688anysdesprsdelapublicacidelmodel geocntric de Claudi Ptolomeu, anteriorment comentat. En la publicaci illustrava la re-volucionria i nova vista de lunivers en un simple diagrama, on 9 cercles representaven les rbites al voltant dun punt central: el sol. (Annex A, Foto 08)Una visualitzaci grfca destacable per a la seva vistositat i importncia fou la roda de colors generada per Moses Harris entre 1766, a partir dels estudis amb prismes per se-42 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdiaparar els colors de la llum blanca dIsaac Newton. Harris publica una taula circular on explica que a partir dels tres colors primitius: blau, groc i vermell, es poden generar 18 colors diferents i a ms a ms descobreix que la suma dels tres colors primaris generen el negre. (Annex A, Foto 09)Joseph Priestley fou un teleg, flsof, fsic i qumic que per tal de facilitar laprenentatge dels seus alumnes, invent les primeres i sorprenents taules de lnies de temps, que per-metien visualitzar grans quantitats de dades duna manera molt didctica. El 1769 presen-t la seva obra magna titulada A New Chart of History on es representava tota la histria de la humanitat en una nica taula grfca, quelcom revolucionari en aquella poca. (An-nex A, Foto 10)Lany 1786 William Playfair economista, enginyer i illustrador escocs es va inspirar en les lnies de temps de Priestley, a qui admirava, per inventar el diagrama de barres i el grfc de lnies o grfc sectorial per a la publicaci Comercial and Political Atlas. Tamb el 1801 public Statistical Brevary on tornava a innovar presentant dades en un diagrama circular, el conegut popularment com a grfc de pasts.Playfair s de vital importncia en la representaci de dades, ja que fou la primera per-sona en plasmar informaci estadstica mitjanant grfcs. La seva invenci suposava la soluci al problema de la representaci numrica abstracta i la comparaci quantitativa directa daquestes. (Annex A, Foto 11)Seguint les innovacions de Playfair el 1858, Florence Nightingale va presentar un informe al parlament britnic en qu denunciava les males condicions higiniques i la insufcient atenci mdica, que oferien els hospitals de campanya de lexrcit en la guerra de Crimea (1853-1856) on ella havia fet dinfermera voluntria. Linforme era el resultat dun intens treball de recopilaci estadstica que concloa que el 88,8% de les morts de soldats era per culpa dinfeccions i malalties contretes en els hospitals. Nightingale utilitz grfcs circulars per explicar les causes de la mortalitat a lexrcit en la guerra de lEst, aquestes expressions grfques provocaren un gran impacte i aconseguiren una reforma sanitria sense precedents. (Annex A, Foto 12)En la lnia de Nightingale destaca el doctor John Snow que el 1854 genera un mapa de Londresperidentifcarelspousinfectatsdecoleramitjanantlacollocacidepunts 43 BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdiadamuntelmapa,indicantlespersonesmortesperaquestaepidmia.Elmapavaser dissenyat per Charles Cheffns i publicat fnalment el 1855 en lampliaci del seu estudi anomenat On the Mode of Communication of Cholera. (Tufe, 2001) (Annex A, Foto 13)Destaca tamb el treball realitzat per Charles J. Minard, enginyer civil francs, que in-nov en els temes de la traducci grfca aplicada a lenginyeria civil i lestadstica. Els seus esquemes grfcs tractaven molts temes diferents sempre des del rigor i el vessant ms estadstic. El 1869 present la seva obra ms coneguda: Carte fgurative des perdes successives en hommes de lArmee francaise dans la campagne de Russie en 1812-1813, on es mostra duna manera impressionantment clara i senzilla el moviment, les prdues humanesilestemperaturessuportadesdurantlacampanyadeNapolecontraRssia el 1812. Aquesta obra ha estat considerada per diversos experts en la matria, com ara Edward Tufte o Howard Wainer, com una pea cabdal i de gran valor en la histria dels grfcs informatius. (Annex A, Foto 14)Els ltims autors: Priestley, Playfair, Nightingale, Snow i Minard es poden considerar els pioners de la representaci grfca moderna. Des de la seva basant ms estadista desen-volupenievolucionengenialsiefcaosmtodesderepresentacidedadesabstractes. (Lankow, Ritchie i Crooks, 2012)A continuaci destaquem a tres autors ms per les seves aportacions en les respectives rees i tamb per la seva posterior infuncia en la investigaci sobre les bases del disseny de la informaci.El primer autor destacable s el professor i qumic rus Dimitri Mendeleev que va pre-sentar el 1869 la primera versi de lactual taula peridica que organitza els elements a partir de les seves propietats atmiques. Aquesta taula de mltiples colors fou ideada amb la intenci de millorar latenci dels seus alumnes a les classes de qumica, des-prs es converteix en una pea indispensable pel desenvolupament de les bases de la qumica moderna. Pocs anys desprs, concretament el 1875, Francis Galton cientfc angls multidiscipli-nari, va idear i publicar al diari The Times un sistema per a la representaci grfca de laprevisimeteorolgica.Esvabasarenelsprimersmapesmeteorolgicsconeguts 44 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdiaideats per Edmond Halley el 1686 que estudiaven els efectes dels vents alisis i els mon-sons a tot el planeta. El1908esvanunifcarles5companyiesdeferrocarrilsqueoperavenenelsubslde Londresennicmapaquemostravalesdiferentslniesendiferentscolorsdamuntel mapa geogrfcdeLondres.El1920MacDonaldGilelimina elfonsgeogrfc, fetque representa una evoluci molt important que permetr, onze anys ms tard, a Harry Beck, dissenyar un mapa clar i de fcil comprensi que elimina els traats fdels de les vies per mostrar noms els recorreguts de les lnies en horitzontal, vertical i amb una inclinaci de 45, les estacions i els intercanviadors entre lnies, tan sols deixa com a punt de referncia el riu Tmesi (Christianson, 2012) (Garland, 1994).ElsegleXXrepresentaundelsperodesmsconvulsosdelahistriadelahumanitat per la primera i la segona guerres mundials, les descolonitzacions, la guerra freda i tots els confictes derivats. Tot i aix, s lpoca on el ritme de canvis cientfcs, tecnolgics i socials saccelera duna manera vertiginosa: teoria de la relativitat, descobriment de la penicillina i lADN, lhome conquereix la lluna, apareix la televisi, el telfon, la infor-mtica,internet,etc. Alcompletar-selarevoluciindustrialapareixlainformticaque accelera el desenvolupament de lanomenada revoluci del coneixement i de les comuni-cacions i converteix el planeta en una economia globalitzada.Neixeldissenygrfccomadisciplinaiesmultipliquenelsmitjansdecomunicaci, aquests dos factors ms els avanos tecnolgics provoquen que sigui necessari desenvo-lupar noves formes dexpressi.Undelsautorspotsermenysconegutsperseguramentundelsmsimportantsenel disseny grfc i ms concretament el primer en practicar el disseny de la informaci s Ladislav Sutnar, xec de naixement i americ dadopci per culpa de la invasi de Xeco-slovaquia per part dels nazis. Va treballar per a diferents i importants empreses america-nes dissenyant, entre altres coses, els catlegs de serveis. Va ser un revolucionari per ser el primer en enfocar lestructuraci del contingut, en aquests catlegs, a partir delements com els parntesis, claudtors, miniatures dimatges, icones per a jerarquitzar dades i in-formaci en estructures visuals molt senzilles. El 1961 va publicar el llibre Visual Design in Action que era un resum dels seus treballs i es considera un testimoni excepcional per veure la seva contribuci a la visualitzaci de la informaci. (Grady, i Grady, 2008)45 BAU, Centre Universitari de Disseny / TFG 2015/ Pol GurdiaApartirdelasegonameitatdelsegleXXlacinciadeixadeserlnicgeneradorde visualitzacionsquetenenlobjectiudajudarenelprocsiellacomprensidedades, i irromp amb molta fora la visualitzaci de dades mitjanant illustracions i grfcs en el mn editorial. Les revistes i els diaris comencen a dissenyar visualitzacions de dades amb lobjectiu datraure al pblic sense deixar dinformar amb el rigor necessari sobre un fet concret. Per mantenir aquest rigor es comenaren a crear departaments de disseny i illustraci que sespecialitzaren en la visualitzaci de la informaci, alguns dels primers professionalsenaquestanovadisciplinaforenNigelHolmespel Times,PeterSullivan en el The Sunday Times, Alejandro Malofej al diari La Opinin de Buenos Aires i que el seu cognom dna nom a un dels premis ms importants de la infografa periodstica dels mn, conjuntament amb una estreta collaboraci amb estadistes i periodistes. (Lankow et Al, 2012, p.122) (Cairo, 2012)Aproximadament lany 2007 es popularitza en massa ls dinternet, saccelera la din-micasocial,lesrelacionspersonals,lainstantanetatdelescomunicacionsilaccsa la informaci. En una sobresaturaci dinformaci apareix la necessitat de jerarquitzar, esquematitzariordenartotesaquestesdades,aixdoncs,esrevaloritzenipopularitzen lesvisualitzacionsgrfquesdelainformaci.Lesinfografes,elsesquemesdidctics, mapes, responen sobretot a la facilitat de comprensi per part del receptor, la velocitat del per el seu consum i tamb, per la seva atracci esttica. A causa daquest esclat en la de-manda dinfografes es veu afectat immediatament el nivell de qualitat en el seu disseny i provoca que la comunitat acadmica i cientfca la critiqui i la menystingui a causa de la manca de rigor i la falta, sovint, de coneixements i preparaci necessria per part dels seus autors, pel que fa al domini del llenguatge esquemtic i els codis de comunicaci en el disseny de la informaci. Aix doncs, la qualitat del les representacions dinformaci queden cada vegada ms supeditades a les capacitats creatives dels autors i a la percia autodidacta que aquests vulguin sotmetres (Costa, 1991) (Lankow et Al, 2012).46 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdia3.2. Disseny de la visualitzaci.El disseny de la informaci transforma la informaci complexa en fcil, comprensible i til. AIGA Aigo.comUn cop realitzades les parts de captura, emmagatzematge i processament de les dades arri-ba el moment de transformar-les en informaci, s lacci que es coneix amb el nom de mapeig destructures visuals (Ware, 2013). s el moment on el dissenyador ha daplicar el coneixement i raonament teric per prendre decisions que afectaran directament a la forma visual fnal. Per tal que aquestes decisions es prenguin en les millors condicions cal passar per a cinc processos que, si b semblen obvis, s necessari que estiguin presents en el disseny de la visualitzaci: lanlisi hum de les dades obtingudes desprs del seu correcte processament tecnolgic, la conceptualitzaci, la cerca de la idea dexpressi, la verifcaci i avaluaci de possibles solucions, i fnalment, la presa de decisions (Moere et all, 2011). Byron i Watternberg (2008) demostraven que la correcta articulaci daquestes bones prctiques en disseny aconsegueixen resultats innovadors en laplicaci de les tc-niques de visualitzaci. El coneixement teric per a la correcta visualitzaci de dades comena pel domini dels principis de la percepci visual desenvolupats per lescola de psicologia alemanya Ges-talt, que expliquen com percebem patrons dorganitzaci de les formes dels elements que observem i, per tant, afecten directament a la transmissi de la comunicaci visual (Few, 2012). Els principis de la Gestalt sn: Principi de la proximitat: Els objectes que estan junts entre ells es perceben com a grup. Principi de similitud: Els objectes que tenen atributs similars tamb es perceben com un grup. Principi de encerclament: Els objectes que apareixen amb un lmit al seu entorn es per-ceben com a grup. Principi de tancament: La nostra ment afegeix els elements que falten per completar una fgura. Principi de continutat: La nostra ment percep com a grup objectes que estan alineats conjuntament i permet continuar el patr tot i que aquest desaparegui. Principi de connectivitat: Els objectes que estan connectats mitjanant una lnia es per-ceben com a grup.47 BAU, Centre Universitari de Disseny / TFG 2015/ Pol GurdiaDaquests principis de la Gestalt sen deriven directament els fonaments generals del dis-seny i la gramtica visual, els quals sn atributs bsics com la forma, tant geomtrica com orgnica, el color i la seva saturaci, el contrast, lluminositat, degradaci, transparncia; les diferents composicions de formes en funci de lespai i les corresponents relacions entre elles per repetici, radiaci, gradaci, semblana, concentraci, contrast; la gene-racidestructuresiretculesbidimensionalsitridimensionals;ilestudideconceptes relacionalscomlasimilitud,radiaci,anomalia,contrast,concentraci,textura,espai, etc. (Wong , 2012).Daltra banda cal tenir en consideraci daltres aspectes, no solament plstics, que es con-sideren indispensables per a la correcta comunicaci dinformaci. Sanalitzaran aspectes com el format, lenfoc, els requeriments destructura (solidesa, utilitat i bellesa), requeri-ments de percepci (atracci, comprensi, retenci), les relacions entre dades i grfca i els diferents models de representaci. 3.2.1. FormatEls principals formats que permeten visualitzar informaci en els medis de qu es disposa actualmentsntres:lesrepresentacionsesttiques,lesinterfciesinteractivesielcon-tingut en moviment. Lelecci dun format o altre dependr de lefectivitat de contenir i transmetre la informaci i de lobjectiu fnal que persegueixi la visualitzaci.3.2.1.1. EstticEdward Tofte (1990) deia al principi del seu llibre Envisioning Information El mn s complex,dinmic,multidimensional;elpapersestticipla.Totiquealanydela publicaci del llibre el mitj digital no estava tan evolucionat ni instaurat en la societat com ho est actualment, la seva afrmaci segueix representant perfectament el principi de complexitat que pot arribar a representar la visualitzaci esttica tant sobre paper com en els nous formats digitals. El format esttic s el ms antic i ests, consisteix en imatges esttiques que contenen in-formaci i que permeten la seva comprensi. Aquesta informaci es pot presentar en for-48 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdiama descriptiva, narrativa o interpretativa (Valero, 2014), ampliarem aquests enfocaments msendavant. Aquestformatexpressainformaciesttica,sadir,quenopermetser modifcada un cop generada la visualitzaci. Permet adaptar-se a mltiples formats tant analgics com digitals, les seves aplicacions van des de la visualitzaci de grfcs senzills passant per la infografa empresarial fns a les elaborades i, sovint, illustrades infografes periodstiques. s el ms habitual de tots per ser el ms fcil de crear i per tant el ms econmic (aquest fet pot variar en funci de la complexitat de les dades i lelecci dels recursos per a la visualitzaci que podrien ser molt elaborats i augmentar considerable-ment el seu cost). s molt apreciat per la seva immediatesa i la facilitat de ser compartit i viralitzat en xarxes socials i medis digitals. 3.2.1.2. AnimatSn els grfcs en moviment que expressen informaci duna manera dinmica mitjanant elements propis de lanimaci grfca. El sistema visual hum s molt susceptible a pres-taratencialmoviment,jaqueelmedinaturalonesdesenvolupaqualsevolactivitat humana implica lanlisis visual constant com a part natural del principi de supervivncia (Ware, 2013). Aix doncs, el grfc en moviment posseeix un atractiu natural per a involu-crar al receptor de la comunicaci duna manera diferent de les visualitzacions esttiques. A ms a ms, la visualitzaci animada, pot incorporar un segon mitj de transmissi com s el so, tant en format musical i defectes sonors com de veu en offque, correctament utilitzats, permeten acompanyar i recolzar el moviment grfc aconseguint una atenci i resultats destacables en lobjectiu de la comunicaci (Lankow et al, 2012). La interacci de lusuari es limita a poder pressionar inici/pausa i desplaar-se per la lnia de temps. Per tant s un format que acostuma a tenir una funci narrativa a partir duna histria lineal. Cal considerar, per, levoluci i la popularitzaci de leina de Youtube que permet in-corporar interacci als vdeos, s molt bsica i no permet interacci total home-mquina, per permet a lusuari prendre decisions en certs moments del vdeo que permeten can-viar el desenvolupament lineal duna histria. Tamb cal tenir en compte el potencial de la tecnologia del codi HTML5, CSS3 i JavaScript que sest implementant en les noves webs i que permeten visualitzar grfcs en moviment en navegadors web de prcticament tots els dispositius (ordinadors, smarthphones, tablets, rellotges, etc.).3.2.1.3. InteractiuEns referim a visualitzacions de format interactiu a aquelles representacions, generalment 49 BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdiaen medis digitals, que permeten al receptor controlar el missatge comunicatiu duna ma-nera no-lineal dins els parmetres establerts per lemissor.Es considera que la interrelaci entre el medi interactiu i lusuari augmenta la capacitat datenci i retenci de lobservador (Mazza, 2009). En aquests tipus de visualitzacions destaca, a ms de lesttica de la informaci, la importncia la usabilitat de la interfcie i lexperincia de lusuari que afectar directament la relaci emotiva en la comunicaci de la informaci (Purchase et al, 2008).La visualitzaci dinformaci interactiva es pot classifcar segons el tipus de dades i tam-b per la intenci narrativa-interactiva. Les dades poden ser dactualitzaci manual o au-tomtica, les primeres necessiten que cada vegada que shagi de modifcar alguna dada o informaci calgui la intervenci humana per substituir o afegir la dada de manera manual. Lactualitzaci automtica permet, mitjanant programaci, que la visualitzaci obtingui les dades duna o diferents fonts, principalment bases de dades ja processades (Lankow et al, 2012). Pel que fa a la intenci narrativa trobem tres formes generals dafrontar la in-teracci amb la informaci. En primer lloc trobem lestructura tradicional de presentaci interactiva, que consisteix en un pas lineal de diapositives que contenen la informaci. En segon lloc trobem lestructura de copa de Martini que introdueix al lector en una narraci lineal per que, un cop fnalitzada, permet explorar lliurement totes les dades. I per ltim, lestructura daprofundiment que est composada per diferents capes que permeten orga-nitzar la informaci de manera que lusuari pugui navegar lliurement per totes les dades a la seva voluntat (Segel i Heer, 2010).3.2.2. Enfocament Existeix un debat entorn de la qesti de lenfocament formal en les visualitzacions de la informaci, a grans trets podrem dir que hi ha dos grans pensaments que intenten justi-fcar lelecci dels diferents recursos visuals per transmetre la informaci. El primer co-rrent s lanomenat enfocament exploratori, que representa a la visi ms formal i tcnica enaplicacionsprpiesdelainvestigaciacadmica,lacincia,elmnempresarialia lanlisi de dades dentorn estadstic i panells de control. Un dels seus mxims exponents s el professor de la Universitat de Yale i pioner en lestudi sobre visualitzaci de dades Edward Tufte, que sost que tots els elements grfcs de disseny que no comuniquen in-50 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdiaformaci especfca sn innecessaris i cal eliminar-los per a una correcta transmissi de la informaci (Tufte, 2001).Daltra banda trobem lenfoc explicatiu o narratiu, la informaci a travs duna histria, que s precisament loposat a lexploratori, contempla ls delements decoratius de ma-nera predominant per ajudar a atraure el receptor i facilitar la retenci de la informaci. Les aplicacions que contemplen aquest enfoc sn principalment les infografes en publi-cacions tant analgiques comdigitals com ara diaris i revistes, blogs,encontinguts de mrqueting i branding. Un dels mxims representants daquest enfoc s el dissenyador grfc, teric i escriptor expert en disseny de la informaci Nigel Holmes, que defensa, seguramentinfuenciatpelseupasperlasecciinfogrfcadel Times,lautilitzacide lametforavisualperemfatitzarireforareltemadelavisualitzaci.(Holmes,1991; Lankow et al, 2012; Frankel i DePace 2012).Ambds enfocaments sn correctes, ja que responen a objectius diferents. El primer mos-tra la informaci duna manera ms neutra per tal que lobservador pugui valorar-la com a representaci objectiva i el segon busca cridar latenci de lespectador i alhora donar un judici de valor previ per ajudar al receptor a emfatitzar amb la informaci (Lankow et al, 2012) (Serra, 2015, entrevista personal del 10 de Maig, Annex D)Aquestsobjectiusdependranenprimerainstnciadequislemissor,delafunciper la qual es dissenya i fnalment el pblic a qui es dirigeix la visualitzaci. Segons Nathan Yau (2011) podrem classifcar en quatre diferents objectius la visualitzaci de dades: In-formar, Emocionar, Entretenir o Persuadir.3.2.3. Requeriments pel disseny de la visualitzaciLarquitecte, enginyer i tractadista grecorom Marcus Vitruvius fou lautor, el 20 aC, De Architectura el tractat sobre arquitectura ms antic que ha arribat fns als nostres temps on assegurava que existien tres estndards que qualsevol estructura havia de tenir: solidesa, utilitat i bellesa. Aquests mateixos estndards es poden aplicar al disseny de la informaci (Moere i Pruchase, 2011). Per una banda la visualitzaci ha de ser slida, adequada per a la informaci que representa, tamb cal que sigui til en quan a ser interpretada correc-51 BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdiatament per lusuari. I per ltim cal que disposi de bellesa esttica per atraure al receptor fnal i proporcionar una experincia agradable. Aquests tres estndards sentenen des de lptica de lestructura que lemissor ha de tenir en compte en el moment de dissenyar una correcta visualitzaci de la informaci.Si ho fem des de lptica dels principis de percepci del receptor es complementa el con-cepte bellesa amb el datracci, el concepte dutilitat semparella amb el de la comprensi i apareix un quart concepte molt important en la visualitzaci de la informaci com s la retenci (Lankow et al, 2012). Aix doncs de la forma original del triangle (triangle de color blau) passem a una forma rombodal. 3.2.3.1 Solidesa Lafabilitatdelainformaci,elseutractamentilintersquepuguitenirperunp-blicdeterminatmarcarelgraudesolidesadelavisualitzaci.Enelmateixcontext, lexcellncia en la visualitzaci es considera slida en funci de la qualitat de la proce-dncia de les dades, la rigorositat en el seu processament i la claredat, precisi i efccia en la transformaci de les conclusions en elements de representaci visuals (Tufte, 2001). En el Big Data aquesta solidesa es valora principalment en la correcta elecci i funcionament dels diferents algoritmes i la efcincia del codi de programaci (Moere i Pruchase, 2011).Grfc 2. Representaci del procs dobtenci del coneixement. Font: Elaboraci prpia.52 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdia3.2.3.2 Utilitat i comprensiLa utilitat fa referncia a lefectivitat i efcincia en lassoliment de lobjectiu de la vi-sualitzaci.Lefectivitatpretnmanteniralmximlaintegritatdelesdadesenlaseva transformaci a informaci visual. I lefcincia busca la utilitzaci mnima de recursos visualsilsmnimdespaiperaconseguirlacorrectacomunicaci(Tufte,2001).En un format de visualitzaci interactiu lefcincia es contempla, tamb, en la recerca de la funcionalitat i usabilitat de la interfcie (Moere i Pruchase, 2011). Sense entrar a fons en el tema i a tall destablir un marc adequat cal tenir en compte a Colin Ware (2013) per entendre la percepci humana. Afrma que els humans hem evo-lucionatitenimoptimitzatelsistemavisual.Idestacatrescaracterstiquesgenerals:la capacitat de captar visualment a gran velocitat elements sense la necessitat de processa-ment conscient, lhabilitat dorganitzar mentalment el que sobserva en esquemes prede-terminats, i fnalment la forta interrelaci amb els altres sentits. Costa (1991) coincideix en lafrmaci que el sistema visual s el sistema cognitiu dels humans ms desenvolupat, i afegeix que funciona com una mquina de reconixer que ens permet una enorme ca-pacitat de processament per buscar models de connectivitat i recodifcaci de dades noves i/oantiguesmoltsovintsedimentades(dadesemmagatzemadessenseunaconscincia plena) que permet la comprensi immediata de conceptes i didees.La utilitat tamb es refereix a ladequaci del missatge al pblic objectiu susceptible a percebre la visualitzaci. Costa (1991) destaca tres criteris a tenir en compte: la capaci-tat datenci, la duraci de la transferncia del missatge i el nivell cultural. La primera respon a la situaci fsica previsible on es realitzar la comunicaci, la segona el temps mitjquehadedurarlacomunicaciperpoderserentesacorrectamentifnalmentel grau de fguraci i iconitzaci del missatge grfc. Aix doncs, des del punt de vista de lobservador, el concepte dutilitat en la visualitzaci de la informaci es tradueix en la capacitat dinteracci amb la visualitzaci i la comprensi de la informaci. 3.2.3.3 Bellesa i atracciJamesGleick(2012)afrmavaqueQuanlainformacisbarata,latenciestorna cara. Steve Jobs, des de la seva visi personal, afegia que El bon disseny no solament aconsegueix un atractiu addicional dun element sin que en realitat tamb pot iniciar una reacci emocional al receptor fnal. En aquesta mateixa lnia diversos investigadors han 53 BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdiaargumentat que lesttica pot infuir positivament en lexecuci duna tasca i a la satisfac-ci general dels usuaris en ls dobjectes diaris (Norman, 2002).Enunmncadavegadamssaturatdedadesiinformacisnecessariiprcticament obligatoripresentarlainformaciambuncertatractiuestticperatraureelslectorso usuaris fnals i mantenir la seva atenci per tal que profunditzin en el contingut (Lankow et al, 2012) i fer, alhora, ms efca la mateixa comunicaci de la informaci (Salimun et al, 2010), sempre tenint en compte lobjectiu pel qual est dissenyada la visualitzaci i el pblic a qui es dirigeix.s difcil discutir, criticar o comparar objectivament la qualitat, en conceptes com atrac-ci,bellesa,efccia,adequaci,etc.delaformavisual(MoereiPurchase,2011),tan-mateix, el concepte esttic, tot i dependre de mltiples variables, en lmbit de la visua-litzaci de la informaci necessita indispensablement lequilibri entre forma i funci. La forma correspon a ls adequat dels elements que representen visualment la informaci, la funci respon a la qualitat daquesta representaci per facilitar la rpida i correcta in-terpretaci de la informaci per part del receptor (Tufte, 2001).Diferents estudis demostren empricament que les visualitzacions amb un contingut es-ttic agradable aconsegueixen millor atenci per part dels seus observadors. Alhora altres estudis asseguren que la presncia delements visuals aparentment innecessaris que for-men metfores visuals no afecten negativament a la correcta interpretaci de la informa-ci (Moere i Purchase, 2011). Per s important tenir en compte que aquests elements han destar tractats el ms objectivament possible, ja que poden distorsionar la representaci de la informaci precisa (Lankow et al, 2012) (Tufte, 2001).3.2.3.4 RetenciExisteixen tres tipus principals de memries relacionades amb lexposici a imatges: la memria a curt termini, la de llarg termini i memria visual. La memria a curt termini s la considerada icnica, que s instantnia i noms semmagatzema defnitivament si es connecta amb alguna idea o concepte emmagatzemat al nostre cervell. La memria a llarg termini s la que semmagatzema durant llargs perodes de temps i es divideix en tresreesms:lamemriaepisdicaquesnaquellesvivnciesviscudesenuntemps i espai concret, la memria procedimental que fa referncia a les tcniques apreses per 54 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdiamimetisme o repetici (llegir o cordar-se les sabates) i la memria semntica que socupa delsconceptesabstractesquenotenenuncontextespecfcoexperinciaassociada.I fnalment la memria de treball visual sactiva quant ens fxem en alguna cosa que estem observant, i en menys de 100 mili segons el nostre cervell compara la informaci icnica de la memria de curt termini amb la memria semntica de llarg termini emmagatzema-da i entendre, aix, el que sest observant (Ware, 2013) (Grady, i Grady, 2008).Joseph Priestley va dissenyar el 1789 A new Chart of History, una nica taula molt visual on es presentava la histria de la humanitat en un format en lnia de temps (Christianson, 2012) amb lobjectiu de facilitar laprenentatge als seus alumnes. Priestley s un dels pioners en fer servir la visualitzaci de dades per, no noms facilitar la comprensi sin tamb, per tal que els seus alumnes, utilitzant la memria de treball visual, poguessin memoritzar una gran quantitat de dades ms rpidament i efcientment. Alapartat3.2.2quanparlvemdelenfocament,explicvemlesdifernciesentreles visions de Tufte i Holmes pel que fa a la inclusi delements decoratius aparentment in-necessaris per a facilitar la comprensi de la informaci en visualitzacions, i en lapartat 3.2.3.3comentvemquediversosestudisasseguravenquelapresnciadaquestsno afecten negativament a la comprensi, Lankow et al (2012) asseguren que la disposici delementscomaralametforavisual,elsmbolilaiconografaielementsdecoratius esttics augmenten, a part de latracci, tamb la retenci de la informaci. 3.2.4. Transformaci de dades a grfca3.2.4.1. Tipus de dadesSegonsdelaFuente(2011)lesdadesqualitativessnaquellsvalorsquerepresenten diferentsqualitats,caracterstiquesomodalitatsinoespodenexpressarnimesurar numricament. Poden ser dicotmics (noms poden tenir dos valors possibles, com si/no,home/dona,etc.)opolitnics(podentenirtresomsvalors).Existeixentresva-riants de dades qualitatives: Ordinals: els valors sordenen mitjanant una escala establerta no necessriament uni-forme (labecedari, els mesos de lany, intervals com: lleu, moderat, fort).55 BAU, Centre Universitari de Disseny / TFG 2015/ Pol GurdiaNominals:elsvalorsnopodensotmetresacriterisdordre(colors,estatcivilduna persona: solter, separat, divorciat. viudo, casat) Per interval: provenen de valors quantitatius que shan agrupat en intervals. Sn com les dades ordinals per poden calcular distncies numriques entre dos nivells de lescala establerta (el sou anual, els dies del ms, ledat, el nivell de colesterol).Les dades quantitatives sn aquelles que sexpressen mitjanant valors numrics i mate-mtics. Discretes: sn aquelles dades que noms accepten valors que pertanyin a un conjunt nu-merable fnit. I pot presentar separacions, salts o interrupcions entre els valors que formen part del conjunt (nombre de flls, nota de lexamen, nombre de persones dun grup, etc.).Continues:sndadesquepodentenirqualsevolvalor(nombreinfnitdevalors)dins un cert interval (el pes o laltura dun grup de persones, la temperatura, la densitat dun lquid, etc.). 3.2.4.2. Relacions grfques Els grfcs permeten donar forma a les relacions que existeixen entre diferents dipus de dades. Acostumen a ser tcniques amb funcions reduccionistes que busquen poder fltrar totes les dades per poder donar el mnim indispensable nmeros delements per a una co-rrecta visualitzaci. Per tal daconseguir una correcta comunicaci de la informaci mi-tjanant grfcs, Stephen Few (2012) amplia a vuit les cinc categoritzacions de relacions grfques que proposava inicialment Gene Zelazny el 2001: Comparaci nominal: Quan els valors representen una escala categrica i es comparen entre ells duna manera simple. Respon a frases com: ms gran que, ms petit que, recor-den aquesta relaci de la informaci. Srie Temporal: Quan un valor quantitatiu varia en el temps. Les dades susceptibles a ser seriades temporalment responen a conceptes de canvi, augment, decreixement, fuc-tuaci, creixement, declinaci, disminuci o tendncia. 56 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdia Classifcaci: Quan els valors quantitatius es relacionen entre si de forma seqencial i sordenen per mida de major a menor o viceversa. Les dades susceptibles a classifcaci responen a conceptes com mes gran que, ms petit que, igual que, millor que o pitjor que.Partdeltot:Quanelsvalorsindividualsdunconjuntescomparenentresiiambel mateixvalortotaldelconjunt.Sacostumaaferservirpercentatges.Lesparaulesque suggereixen relacions de part del tot sn: part o taxa del total, percentatge del total, valor del X per cent, quota. Desviaci: Quan un o diferents grups de valors quantitatius difereixen del o dels valors de referencia. El grfc haur dexpressar la diferencia entre els dos grups de valors. Es de-dueix relaci de desviaci amb paraules com: Ms o menys, variaci, diferncia i relatiu a. Distribuci: Quan es distribueixen valors quantitatius a travs duna franja que va de menys a ms. Les paraules que suggereixen aquestes relacions sn: Freqncia, distribu-ci, franja, concentraci, corba i corba de campana. Correlaci: Quan dos grups de valors quantitatius varien entre ells en relaci a la direc-ci (positiva o negativa) i al grau (alt o baix). Les paraules que suggereixen relaci de correlaci sn: incrementa amb, decreix amb, canvia amb, causat per, afectat per, prxim. Geoespacial: Quan la relaci s espacial, quan els valors estan localitzat en un punt dun mapa. Paraules relacionades a aquest concepte: geografa, localitzaci, on, regi, territori, pas, estat, ciutat. 3.2.5. Models de visualitzaciUncopesconeixenlesdadesqueesvolvisualitzarilespossiblesrelacionsgrfques entre elles cal tenir coneixement dels diferents models de representaci visuals per esco-llir el ms adient i complir lobjectiu dexpressar amb la mxima claredat la complexitat (Yau,2011)(Lankowetal,2012).Totseguitsexposenelsprincipalsgrfcs,mapesi diagramesutilitzatsperexpressartantdadesqualitativescomquantitatives.Existeixen ms solucions, per acostumen a ser variacions o combinacions de les principals.57 BAU, Centre Universitari de Disseny / TFG 2015/ Pol GurdiaAlastrairCambell(2000)agrupaelsmodelsdevisualitzacidelainformaciencinc gransgrups:diagramesillustratius,diagramesestadstics,diagramesrelacionals,dia-grames dorganitzaci i grfcs de temps. Per la present investigaci farem una taxaci ms enfocada a les diferents formes i sintaxis visuals necessries per a la visualitzaci de grans quantitats dinformaci (Lima, 2014). El volum de dades que shan de representar necessiten nous models de visualitzaci amb noves sintaxis visuals que necessiten codis de programaci que permetin lautomatitzaci dels processos. Degut aix, no es contem-plaran aquelles tcniques plstiques que no puguin ser concebudes mitjanant un procs tecnolgic. Cybu Richi en una entrevista de (Klanten, 2008) afrmava en relaci a aquest tema que la dada defneix el model de visualitzaci.Tot i que, potser caldria fer una classifcaci a partir de criteris ms tcnics com els tipus de dades que es mostren o les eines que sutilitzen per a la exploraci i visualitzaci de lesdades,esconsideraapropiadalaclassifcaci realitzada peradiversosautors(Few, Lima, Yau) que valoren aspectes esttics generals com la forma, la estructura i el tipus de relacions entre les dades. En primer lloc descrivim els grfcs de caire ms estadstic, a continuaci desglossem els diagrames destructura darbre amb la seva evoluci ms tcnica dels grfcs de mosaic, els grfcs de xarxes i per acabar els grfcs composats per nvols dades.3.2.5.1. Grfcs Sn les representacions ms utilitzades per a representar dades quantitatives i qualitati-ves i permeten una comunicaci molt efca dinformaci. La seva extensa presncia fa que sigui molt fcil la seva comprensi i acceptaci per part de la gran majoria de pblic (Lankow et al, 2012; Lima, 2013, 2014 i Few, 2009). De Punts: Permeten presentar dades discretes i contnues mitjanant com-paracions nominals, sries temporals, classifcacions i relacions de parts del tot. Els valors qualitatius i/o quantitatius es colloquen en dos eixos (X i Y). De lnies: s el grfc de punts unit mitjanant una lnia. Permeten visua-litzar relacions de sries de temps amb dades contnues. Leix X acostuma a representar el valor de temps. Molt prctics per interpretar evolucions en el temps i observar tendncies. 58 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdia De barres: Podem subdividir els grfcs de barres en tres categories, tot i ser similars es diferencien en alguns petits aspectes que fan que lelecci dun o altre sigui important.- Verticals: Per a dades discretes i continues per expressar comparacions nominals,sriestemporals,classifcacionsirelacionsambpartsdeltot. Leix X per als valors qualitatius i leix Y per als quantitatius i sempre amb la lnia base a zero. -Horitzontals:Peradadesdiscretesicontinuesquemostrencompara-cionsnominals,classifcacionsirelacionsambpartsdeltot.Lessries temporals no sn recomanables. Leix Y contempla els valors qualitatius i leix X els valors quantitatius.- Apilades:Peradadesdiscretesocontnues,sobretot,perexhibirrela-cions de parts del tot. Leix X sacostuma a utilitzar per presentar dades qualitatives i ly les dades quantitatives. Circulars: Permeten utilitzar dades discretes o contnues per a compara-cions de parts del tot. La suma de totes les parts ha de ser igual al cent per cent.Permetenunarpidacomprensientrerelacionsdedades.Tamb poden derivar fcilment a grfcs en forma de dnut, eliminant el centre de la circumferncia. Bombolles:Permetenutilitzardadesdiscretesocontinuesperexposar generalment classifcacions i relacions nominals. El total de lrea de la circumferncia representa el valor quantitatiu. s una opci no gaire pre-cisa i necessita grans diferncies entre els diferents valors per tal que re-sulti til. Sutilitzen sovint combinats amb mapes geogrfcs que perme-ten relacionar el valor de la bombolla en un lloc concret molt rpidament. Diagrama: de dispersi A partir de la collocaci de les dades en forma depuntssobreunataulabidireccionalotridimensionalpermetmostrar grfcamentlarelaciquehihaentreduesvariablesquantitatives.Les dades qualitatives es mostren en leix X i les quantitatives en leix Y i, en 59 BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdiael cas dhaver-hi espai tridimensional, leix z permet una tercera variable compartida per les dues primeres. s molt til per comprovar resultats i la identifcar les causes de fets variables.Diagramesderadar:Permetlavisualitzacidevalorsquantitatiusdis-posat en diferents eixos (mnim tres) que radien dun mateix punt central. Sacostumen a unir, mitjanant lnies rectes, els diferents valors collocats enelseixospergrupsiaixsaconsegueixcomparargrupsdedadesen relaci a diferents variables. Diagrames dembut: O diagrama de funnel, s similar al grfc de barres apilades, mostra valors proporcionals que disminueixen progressivament. La mida de lrea est determinada pel conjunt de percentatges del total dels valors. Lnia de temps i calendari: Podrien entrar en la categoria de grfcs de barres, ja que sn els principals elements que hi actuen per s important destacar-los perqu proporcionen una rpida i efectiva visualitzaci de da-des en relaci a una variable temporal. Diagrama de Sankey: s una visualitzaci utilitzada per representar les transferncies de dades entre processos a partir de fetxes que mostren la direcci i el comportament del fux de transferncia. Prenen el nom dun capitirlandsqueutilitzel1898aquestdiagramapermostrarelfux denergia duna mquina de vapor. Per el diagrama de Sankey ms popu-lar s el creat, vint-i-nou anys abans, per Charles Minard, comentat en el punt 3.1, per explicar la invasi napolenica de Rssia.60 BAU, Centre Universitari de Disseny / TFG 2015 / Pol Gurdia61 BAU, Centre Universitari de Disseny / TFG 2015/ Pol Gurdia4. Visualitzaci del Big Data.Existeixen mltiples aplicacions del Big Data que tenen models de visualitzaci com a ltim pas de tot el procs. Per tal de poder introduir-nos en aquest ampli sector en cons-tantexpansihemcategoritzatlesvisualitzacionsenfuncidelcampfnaldetreballa que pertanyen i al seu us fnal: s comercial, periodstic, recerca i art. Tot i que, no s una classifcaci del tot encertada ja que si, per exemple, tenim una investigaci en el camp del periodisme de dades aquesta aplicaci formaria part de dos categories alhora. Caldria doncs refexionar en establir una categoritzaci en base al tipus de dades i les eines utilit-zades en els processos de treball amb les dades. (Martnez, 2015, entrevista personal del 7 de Maig, Annex D). Per la categoritzaci proposada ens permet mostrar les quatre ma-neres ms habituals alhora dencarar projectes de visualitzaci de grans volums de d