Formati aperti vs formati proprietari

Embed Size (px)

Citation preview

Formati Open Source

Cosa sono e perch usarliZip/7z Gif/Png H.264/WebM

In questa presentazione parler di alcuni fra i pi utilizzati formati open source e del perch piace a molti, soprattutto amministrazioni, utilizzarli.

Il formato dei dati digitali si definisce "aperto" quando ne viene resa pubblica, mediante esaustiva documentazione, la sintassi, la semantica, il contesto operativo e le modalit di utilizzo. Tali informazioni, unitamente ad una guida alluso del formato, orientata alla lettura da parte dellutilizzatore, devono essere presenti in uno o pi documenti rilasciati dallente proponente lo standard.

Chi propone un formato aperto?

Lente proponente pu essere un ente di standardizzazione, una pubblica amministrazione o una comunit di utenti. Il CNIPA istruisce ed aggiorna, con periodicit almeno annuale, un repertorio dei formati aperti utilizzabili nelle pubbliche amministrazioni e delle modalit di trasferimento degli stessi.

Cos' dunque un formato aperto?Un formato aperto un formato che specifica una tecnica di pubblico dominio utilizzata per l'archiviazione dei dati digitali.Il fine??Garantire l'accesso ai dati e di incoraggiare la concorrenza nel miglioramento.

Connessione fra formato operto e software opensource/proprietario.

Se uso un programma open avr la possibilit di salvare il mio prodotto anche in formati aperti.Anche i programmi proprietari aprono formati aperti... in questo modo l'utilizzatore potr usare qualsiasi programma per aprire il file interessato!!

Qualche persona potrebbe per pensare...

Certamente il software libero apprezzato dalle universit e dai posti in cui si fa ricerca ma nel mondo reale fatto di piccole imprese tutto ha un marchio, tutto ha un padrone... il software libero davvero la strada da perseguire?

Vantaggi:Svantaggi:

Accesso al sorgente

Liberi dall'obbligo di legarsi a programmi proprietari

Programmi gratuiti all'utilizzatore

Possibilit di distribuzione

Indipendenza dai fornitori

Le funzionalit dei programmi open a volte sono limitate rispetto a programmi proprietari

Non essendo uguali ai loro competitor proprietari serve della formazione per imparare ad usarli (costo di conversione).

E SOPRATTUTTO...

Ma le amministrazioni cosa pensano dei formati aperti? Li utilizzano??

Link:
Politica formati del ministero

Svantaggi dei formati proprietari:

I programmi sotto licenza proprietaria salvano i propri file in formati proprietari.

Solo il produttore pu intervenire sul prodotto

I formati obsoleti possono diventare illeggibili dal nuovo software

Serve (spesso) software proprietario per aprire formati proprietari

Alcuni esempi:

...mi hanno mandato un file .doc, ma io non ho Word. Come faccio per leggere questo documento?

...10 anni fa ho scritto la tesi con Microsoft Works 7, e ora non riesco pi a leggere questi file .wps...

Ho un file .cad ma non uso autocad come lo visualizzo????

...tempo fa ho riscontrato un errore in Excel, ho visto che un errore noto, ma non ancora arrivato il Service Pack per correggerlo...

Formati utilizzabili dalle amministrazioni

HTML/XHTML per la pubblicazione di informazioni pubbliche su Internet;

PDF con marcatura ( secondo standard ISO/IEC 32000-1:2008);

XML per la realizzazione di database di pubblico accesso ai dati;

ODF e OOXML per documenti di testo;

PNG per le immagini;

OGG per i file audio;

Theora per file video;

Epub per libri.

Nascita di alcuni formati aperti da formati proprietari.

Zip vs 7zip

Il formato zip

E un formato di archiviazione dati ormai molto diffuso. Ne esistono molte implementazioni anche sotto licenza GPL. Ma per prima cosa vediamo come nasce, poi passeremo a vedere come viene realizzato.

Nascita di Zip

Phil Katz (informatico statunitense) inventore del software PKZIP nell'anno 1989.Laurea nel Wisconsin

PKARC

PKZIP

PKZIP

Nasce come ribellione alle critiche a lui mosse dopo la diffusione dell'algoritmo PKARC. Le specifiche furono mantenute aperte ma venne rilasciato in commercio sotto una licenza shareware.Licenza shareware: puoi usare il prodotto in prova per 30/60 gg, poi se desideri continuare ad usarlo lo registri alla casa produttrice pagando le royalty dovute.Il suo formato divenne ben presto lo standard perch ne potevano essere sviluppate altre versioni gratuite e portate su altre piattaforme hardware.Divenne il pi famoso autore di software freeware di tutti i tempi.Tuttavia:Non credeva nella diffusione del suo prodotto sotto ambiente Windows e per questo fu implementato Winzip. Perse una grossissima fetta di mercato.

L'algoritmo che st alla base del formato zip LZW. In realt non si utilizza questo algoritmo ma dei suoi cugini l'algoritmo DEFLATE. LZW per st alla base di questo prodotto.Caratteristiche:Facile da implementare

Compressione di ogni file separatmente. In questo modo se un file corrotto posso comunque estrarre gli altri a discapito della compressione totale

Compressione lossless

Applicabile a tutti i dati (audio, video, testo)

Percentuale di compressione non molto elevata per la generalit dell'algoritmo

Dato che le specifiche sono pubbliche andiamo a vedere l'algoritmo di compressione:

LZW

Input e output sono stringhe finite appartenenti ad un insieme dell'alfabeto

Per avere buone compressioni utile che i dati in input contengano numerose ripetizioni

All'aumentare dell'input il rapporto di compressione tende asintoticamente al max

Non esiste alcun overhead in quanto la tabella dei simboli non viene passata in fase di decodifica

Nella fase di decoding il dizionario identico a quello dell'encoding

LZW

Prendiamo la stringa:ababbabcabbabbaxw = NULL;while (not EOF){ read a character k if wk exists in the dictionary w = wk; else{ add wk to the dictionary; output the code for w; w = k; }} output the code for w;

w koutputcodicesimbolo

NULLa a b a 256ab

bab257ba

ababb256258abb

babab257259bab

bcb260bc

cac261ca

ababbabba258262abba

ababaabbaabbbax262263abbax

xEOFx

7Z

Supporta diversi tipi di compressione

Sopporta la cifratura e la preelaborazione

Disponibile sotto licenza GPL

La specifica distribuita con il codice del software 7Zip

un formato aperto che utilizza diversi tipi possibili di compressioneLZMA LZMA2 BZIP2 DEFLATE

Supporta file di grandi dimensioni

Alta capacit di compressione

Viene utilizzato dal programma 7Zip

7Zip

un programma di compressione open source progettato originariamente da Microsoft, lavora con il formato 7Z pu leggere e scrivere molti altri tipi di file archivio.

Sviluppato da Igor Pavlov utilizza molti algoritmi di compressione a catena, questo gli permette di raggiungere un ottimo livello di compressione.Distribuito per Microsoft e per unix

Rilasciato sotto licenza LGPL

GIF vs PNG

GIF

Il formato gif stato creato nel 1989 dall'azienda CompuServe per fornire un formato adatto alle immagini a colori.Rimpiazza il formato RLE (in bianco e nero)

Prima versione 87.a nata nel 1989 poi verranno aggiunto il canale alfa per la trasparenza e le immagini multiple

Brevettato da ComputerServe e Unisys prima del 1994 non vollero alcun tipo di pagamento.

Dal 1994 se volevi salvare in formato gif dovevi pagarli il formato era ormai diffusissimo!!

Animazioni spesso divertenti

In realt non stiamo parlando di video ma piuttosto di poche immagini in sequenza.

Perch divenne cos famoso??Utilizza l'algoritmo di compressione LZW

Permette l'interlacciamento

Caratteristiche minori256 colori della palette di colori VGA

GIF

Anche a causa del pagamento delle royalty si svilupp dal 1994 un formato aperto che and sotto il nome di PNG

Nel 2003 Gif liberation dayScade il brevetto (in Europa e Giappone scade nel 2004)

PNG

Portable network graphics

un formato di memorizzazione di immagini.Creato nel 1995 da un gruppo di autori indipendenti, approvato dal W3C il 1 ottobre 1996.Simile al gif superficialmente ma implementato in modo molto diverso.

PNG

Caratteristiche tecniche:Pu salvare immagini a 24 bit mentre gif salvava immagini a 8 bit (256 colori)

Ha un canale dedicato alla trasparenza

Gestione colori classica bitmap

Interlaccimento

Trasmissione lungo n canali

Indipendenza dall'hardware

Compressione lossless con algoritmo deflate

Immagini truecolor fino a 48 bit per pixel

Immagini in scala di grigio fino a 16 bit per pixel

Rilasciato sotto licenza BSD/GPL

89 identifica la trasmissione (riduce i rische che il file sia frainteso con altri formati)

50 4E 47 in ASCII PNG

00 0A tipo di conversione da effettuare

1A forma di visualizzazione del tipo di file

0A Indica dove terminare la conversione

Poi troveremo diversi chunk (contengono informazioni utilissime per la retrocompatibilit e il controllo errori)

Colori

Png usa come gif una palette di colori

Per ogni canale dell'immagini fornisce un numero di pixel, tutti i canali avranno lo stesso numero di pixel

Colori in RGB o in scala di grigi, l'RGB rappresenta le informazioni sui colori mentre la scala di grigi rappresenta la luminanza

L'immagine pu essere sia true color sia usare una palette di 256 colori come gif

Colori

Interlacciamento (immagine caricata in 7 passi)

ANIMAZIONI CONSENTITE MA CON CHUNK APPOSITO CHE RENDONO IL FILE NON RETROCOMPATIBILE

I colori sono calibrati in base al device su cui lo si visualizza se presente il chunk che contiene questo tipo di informazione

Compressione

Due tecniche utilizzate a cascata:Il filtering

Algoritmo DEFLATE

Filtering: una tecnica astuta che permette di comprimere senza perdita l'informazione sui pixel basandosi sui pixel precedenti.

h.264 vs WebM

H.264

Lo standard h.264 viene creato dall'azienda Moving Picture Experts Group. Nel maggio 2003 stata completata la stesura finale della prima versione dello standard, mentre nelle edizioni successive sono state aggiunte varie estensioni alle sue funzionalit. UNA TECNOLOGIA COPERTA DA BREVETTI!!!Nei paesi in cui i brevetti sono accettati i venditori e i commercianti devono pagare delle royalty per usare la tecnologia che h.264 usa.

H.264

un formato di codifica video loss cio con perdita di dati molto utile per la distribuzione e lo stoccaggio di file video di tutte le dimensioni e qualit.Molto utilizzato per streaming video da YouTube o ItuneCaratteristiche:Bassissimo bitrate di trasmissione

Trasparente alla decodifica

Gestione dei flussi video come oggetti

Gestione dei DRM (digital right menagement)

WebM

Il formato video che st diventando lo standard.Pensato da Google per essere privo di royalty ed essere inserito in html 5.WebM e i relativi software sono rilasciati sotto licenza BSD.WebM ha una struttura dei file basata sul formato Matroska (mkv).Nativamente WebM supportato da Mozilla Firefox, Opera, Google Chrome dal 2010.Dal 2011 con plug-in su Safari e Explorer 9 e successivi.

WebM

Caratteristiche:Supporta il formato VP8, implementa le ottimizzazioni

Basato su mkv

Decodifica ottimale (a costo 0) per risoluzione 1080p

Gestito nativamente da molti browser

Inseribile nei tag html5 video

This is fallback content to display if the browser does not support the video element.

WebM

Vari produttori hanno deciso di creare hardware con che supportino nativamente questo tipo di formato.

Grazie