Upload
trantuong
View
217
Download
0
Embed Size (px)
Citation preview
Esercitazioni Informatiche e Telematiche Scuola di Farmacia e Nutraceutica Università “Magna Graecia” di Catanzaro
I Anno, I Semestre, A.A. 2015/2016 Ing. Alessia Sarica
Informazioni Docente Ing. Alessia Sarica � Email: [email protected] � Tel.: +39 0961 3695907 � Ricevimento: Mercoledì dalle ore 13:00
alle ore 14:00 à da definire
Eserc.Inf.Tel. - A.Sarica
2
Programma – I Parte � Introduzione all’Informatica
� L’evoluzione storica dell’architettura dei computer: l’hardware.
� Il concetto di algoritmo e i sistemi operativi: il software.
� Digitalizzazione delle informazioni e gestione dei file, memorizzazione dei file su supporti fissi, removibili o di rete.
Eserc.Inf.Tel. - A.Sarica
3
Programma – II Parte � Internet e il WWW
� Concetti di base sulle reti: protocolli, tipo di collegamenti, servizi, condivisione delle risorse.
� Programmi per la navigazione in Internet. � Utilizzo avanzato dei più noti motori di
ricerca. � Utilizzo dei database scientifici: PubMed,
Protein Data Bank, SwissProt.
Eserc.Inf.Tel. - A.Sarica
4
Programma – III Parte � Programmi per la videoscrittura e il foglio
elettronico di calcolo. � Rappresentazione grafica dei dati.
� Introduzione ai database
� Tabelle ed entità
� Progettazione di un database
Eserc.Inf.Tel. - A.Sarica
5
Esercitazioni Suddivisione in gruppi da 12 � Lunedì mattina � 9:30-13:30
� 4 sotto-gruppi da 50 minuti:
1. 9:30-10:20 2. 10:30-11:20 3. 11:30-12:20 4. 12:30-13:20
Eserc.Inf.Tel. - A.Sarica
6
� Mercoledì pomeriggio � 14:00-18:00
� 5 sotto-gruppi da 50 minuti:
1. 14:00-14:50 2. 14:50-15:40 3. 15:40-16:50 4. 16:50-17:40 5. 17:40-18:50
L’INFORMATICA � INFORMATICA -> Scienza della rappresentazione e
dell’elaborazione dell’informazione � L’informatica studia le caratteristiche
dell’informazione e i modi di usarla, immagazzinarla, trasportarla e manipolarla in modo automatico.
� L’informatica ha due anime: � tecnologica: i calcolatori elettronici e i sistemi che li
utilizzano; � metodologica: i metodi per la soluzione di problemi e
la gestione delle informazioni.
Eserc.Inf.Tel. - A.Sarica
8
HARDWARE E SOFTWARE La prima decomposizione di un calcolatore è relativa alle seguenti macro-componenti
� Hardware la struttura fisica del calcolatore, costituita da componenti elettronici ed elettromeccanici.
� Software l’insieme dei programmi che consentono all’hardware di svolgere dei compiti utili.
Eserc.Inf.Tel. - A.Sarica
9
Macchina di Von Neumann � Nello stesso anno il matematico americano John Von
Neumann teorizza il funzionamento dei computer moderni.
Eserc.Inf.Tel. - A.Sarica
11
Componenti di un elaboratore � IL CASE � LA SCHEDA MADRE � IL PROCESSORE � LA MEMORIA PRINCIPALE � LA MEMORIA SECONDARIA � LA SCHEDA VIDEO � I DISPOSITIVI DI INPUT/OUTPUT
Eserc.Inf.Tel. - A.Sarica
12
SOFTWARE Programmi che vengono eseguiti dal sistema:
� Software di Base (tra cui il sistema operativo) � Software applicativo
Eserc.Inf.Tel. - A.Sarica
14
Il Software di Base � Il Sistema Operativo (S.O.) � I Driver, software relativi a specifiche
periferiche � Le Utility, software di utilità, risolvono
compiti come: � Formattare dischi; � Deframmentare dischi � Ottimizzare le funzioni del sistema;
Eserc.Inf.Tel. - A.Sarica
15
Sistemi Operativi Windows/Linux/Mac � Gestisce i dispositivi collegati al computer, ne
rileva e segnala eventuali malfunzionamenti; � Gestisce gli scambi di dati tra l’unità centrale
e i dispositivi esterni; � Mette a disposizione dei programmi
applicativi le risorse elaborative e di memoria; � Garantisce la sicurezza e l’integrità dei dati.
Eserc.Inf.Tel. - A.Sarica
16
SOFTWARE E MACCHINE VIRTUALI � L’hardware è l’unica macchina reale, mentre i vari
strati software corrispondono a macchine virtuali � Le operazioni (chiamate istruzioni) che
l’hardware sa eseguire direttamente costituiscono il linguaggio macchina del calcolatore.
� Le istruzioni del linguaggio macchina sono molto semplici, ma il calcolatore può eseguirle in modo molto efficiente.
� Il software ha lo scopo di mostrare ai suoi utenti il calcolatore come una macchina virtuale (non esistente fisicamente), più semplice da usare rispetto all’hardware sottostante.
Eserc.Inf.Tel. - A.Sarica
17
Il Software Applicativo � Con questo termine si indicano i numerosissimi
programmi che permettono all’utente di impiegare le potenzialità del PC.
� Vi sono vari tipi di programmi che permettono di: � Scrivere documenti testuali (word processor); � Gestire contabilità e bilanci (fogli elettronici); � Gestire grandi quantità di dati (data base); � Fare disegni tecnici (programmi CAD); � Fare editoria elettronica (videoimpagginazione,
fotoritocco); � Giocare; � Ecc… .
Eserc.Inf.Tel. - A.Sarica
18
ORGANIZZAZIONE GERARCHICA DEI FILE � L’ampio insieme dei file che si possono
memorizzare in un hard disk viene gestito suddividendolo in sottoinsiemi, identificati da nomi logici, che racchiudono file con caratteristiche uguali.
� I sottoinsiemi sono chiamati directory e la loro creazione è possibile grazie al S.O. che gestisce la loro creazione. � Ogni directory può essere a sua volta suddivisa in
sottodirectory, ciò torna utile al momento in cui una directory contiene troppi file e una loro ulteriore suddivisione facilita il reperimento dei file.
Eserc.Inf.Tel. - A.Sarica
19
ORGANIZZAZIONE AD ALBERO � Questa organizzazione è denominata ad
albero e l’unità di memorizzazione viene chiamata radice, le directory prendono il nome di figli, e le sottodirectory figli dei figli, ed ogni figlio ha un padre che corrisponde a alla directory di livello superiore.
� I sotto-alberi sono le directory con i loro figli.
Eserc.Inf.Tel. - A.Sarica
20
File System
� Il file system definisce l’organizzazione dei file e delle cartelle (directory). I file possono essere dati o programmi; le directory sono le cartelle che li contengono. Le cartelle a loro volta possono contenere altre cartelle.
Eserc.Inf.Tel. - A.Sarica
21
Le unità � Tutte le memorie di massa vengono viste
dal S.O. come Unità. � I floppy assumono le lettere “A:” o “B:” � Tutti gli altri assumono le lettere
successive: “C:”, ”D:”, “E”, “F”, “G”, “H”, ecc…
Eserc.Inf.Tel. - A.Sarica
22
I percorsi � Il percorso del file “ciao.doc” che si trova
dentro la cartella “saluti” che si trova nell’hard disk, sarà:
c:\saluti\ciao.doc
unità:\cartella\file
Eserc.Inf.Tel. - A.Sarica
23
RAPPRESENTAZIONE DELLE INFORMAZIONI � Si utilizzano standard internazionali per
risolvere problemi di compatibilità tra calcolatori di tipo e marca diversi
� Vedremo brevemente: � Codifica di numeri � Operazioni tra numeri attraverso circuiti
logici � Codifica di caratteri � Codifica di dati multimediali
Eserc.Inf.Tel. - A.Sarica
25
CODIFICA DEI NUMERI � Gli elaboratori utilizzano
la codifica binaria(cioè con 0 e 1) dell’informazione
� Perché solo due simboli? � differenti tensioni elettrici,
polarità magnetiche, ... � riduce errori (ad es.
causati da rumore nei segnali)
Eserc.Inf.Tel. - A.Sarica
26
CODIFICA DEI NUMERI � Unità elementare di informazione:
bit interpretato come 0 o come 1
Eserc.Inf.Tel. - A.Sarica
27
� Questi due Stati sono assimilabili al concetto di circuito aperto e circuito chiuso dell’elettronica.
Definizione delle nozioni di bit e byte � Mentre noi umani contiamo con 10 dita, il PC ne usa solo 2: un
gruppo di 8 Bit (corrispondente a 8 circuiti o transistori in sequenza) è detto Byte (o Parola) ed è rappresentato così:
� I pesi altro non sono che le potenze del ‘2’ a partire da destra dall’esponente ‘0’ fino all’esponente ‘7’. I Bit vanno moltiplicati per il loro peso e quindi sommati. Quindi il numero binario 01101001 corrisponde al decimale 105:
Eserc.Inf.Tel. - A.Sarica
28
1050)(20)(20)(21)(20)(21)(21)(20)(2 01234567 =×+×+×+×+×+×+×+×
128 64 32 16 8 4 2 1 Pesi
0 1 1 0 1 0 0 1 Bits
� Infatti se moltiplichiamo (128*0) + (64*1) + (32*1) + (16*0) + (8*1) + (4*0)+ (2*0) + (1*1) otteniamo il numero decimale 105, è 01101001 è la sua rappresentazione binaria.
ESERCIZIO � Esempio: 13 può essere espresso in
funzione delle potenze di 2 come: 13 = 1 x 8 + 1 x 4 + 0 x 2 + 1 x 1
� Cioè può essere rappresentato dalla
sequenza di bit 1 1 0 1
Eserc.Inf.Tel. - A.Sarica
29
I multipli del byte � Il kilobyte (KB) = 1.024 byte 210 byte
� Il megabyte (MB) = 1.024 kilobyte 220 byte
� Il gigabyte (GB) = 1.024 megabyte 230 byte
� Il terabyte (TB) = 1.024 gigabyte 240 byte
Eserc.Inf.Tel. - A.Sarica
30
CODIFICA DI IMMAGINI � Esistono numerose tecniche per la memorizzazione
digitale e l'elaborazione di un'immagine. � Immagini = sequenze di bit! � L’immagine viene digitalizzata cioè rappresentata
con sequenze di pixel. � Ogni pixel ha associato un numero che descrive
un particolare colore (o tonalità di grigio). � Inoltre si mantengono la dimensione, la risoluzione
(numero di punti per pollice), e il numero di colori utilizzati.
Eserc.Inf.Tel. - A.Sarica
31
CODIFICA DI IMMAGINI � Consideriamo un'immagine in bianco e nero,
senza ombreggiature o livelli di chiaroscuro:
� Suddividiamo l’immagine mediante una griglia formata da righe orizzontali e verticali a distanza costante:
Eserc.Inf.Tel. - A.Sarica
32
CODIFICA DI IMMAGINI � Ogni quadratino derivante da tale
suddivisione prende il nome di pixel (picture element) e può essere codificato in binario secondo la seguente convenzione:
� Il simbolo “0” viene utilizzato per la codifica di un pixel corrispondente ad un quadratino bianco (in cui il bianco è predominante)
� Il simbolo “1” viene utilizzato per la codifica di un pixel corrispondente ad un quadratino nero (in cui il nero è predominante)
Eserc.Inf.Tel. - A.Sarica
33
CODIFICA DI IMMAGINI Poiché una sequenza di bit è lineare, si deve definire una convenzione per ordinare la griglia dei pixel in una sequenza Hp: assumiamo che i pixel siano ordinati dal basso verso l'alto e da sinistra verso destra
Eserc.Inf.Tel. - A.Sarica
34
La rappresentazione della figura sarà data dalla stringa binaria:
0000000 0111100 0110000 0100000
CODIFICA DI IMMAGINI A COLORI � Analogamente possiamo codificare le
immagini a colori. In questo caso si tratta di individuare un certo numero di sfumature di colore differenti e di codificare ogni sfumatura mediante un'opportuna sequenza di bit.
� La rappresentazione di un'immagine mediante la codifica dei pixel, viene chiamata codifica bitmap.
Eserc.Inf.Tel. - A.Sarica
35
36
Eserc.Inf.Tel. - A.Sarica
ALGORITMO Abu Ja'far Muhammad ibn Mûsâ al-Khwârizmî in lingua persiana:
خوارزمی محمد• scrisse, circa nell’825, il trattato
“Kitab al jabr w’al-muqabala” (forse regole di trasposto e semplificazione) dove descrisse delle regole per la semplificazione delle equazioni.
• algebra deriva da al jabr (parte del titolo del trattato)
• algoritmo deriva da Khowarizmi (ultima parte del nome dell’autore, indicante la città di nascita)
Il termine originario era agorismo, trasformato in algoritmo per analogia con aritmetica.
Concetto di algoritmo � Sequenza di azioni (prescrizioni) per effettuare un
compito � La descrizione di una serie di operazioni la cui
esecuzione permette di risolvere un problema. � La definizione di un algoritmo è basata sulla disponibilità
di INPUT e implica la loro trasformazione per la produzione di un OUTPUT
� Esempi: q Ricetta per realizzazione di un piatto q Istruzioni di montaggio di un elettrodomestico q Prelievo bancomat
Eserc.Inf.Tel. - A.Sarica
37
Concetto di algoritmo: esempio
Eserc.Inf.Tel. - A.Sarica
38
INGREDIENTI
RICETTA UTENSILI
TORTA
Software Hardware
algoritmo
Implementazione di algoritmi � Gli algoritmi sono espressi mediante un linguaggio e
sono realizzati da un esecutore (uomo o macchina) � Nell’elaboratore gli algoritmi per la soluzioni di
particolari problemi sono espressi mediante un linguaggio di programmazione.
� Linguaggio di programmazione = linguaggio formale che l’elaboratore è in grado di comprendere
� Un programma è la descrizione di un algoritmo ed è costituito da una sequenza di istruzioni che il calcolatore è in grado di comprendere ed eseguire
Eserc.Inf.Tel. - A.Sarica
39
Eserc.Inf.Tel. - A.Sarica
40
Elaboratore INPUT OUTPUT
Insieme di dati desiderati
Trasformazione dei dati di ingresso seguendo le prescrizioni s p e c i f i c a t e d a u n opportuno a lgor i tmo descritto mediante un l i n g u a g g i o d i programmazione
Umano (che definisce l’algoritmo)
Elaboratore (che conosce solo alcune azioni elementari: es. confrontare due numeri, eseguire semplici operazioni aritmetiche)
programma
Insieme di dati ammissibili
ALGORITMI E PROGRAMMI � Algoritmo
� sequenza finita di passi che risolve in un tempo finito un problema.
� Codifica fase di scrittura di un algoritmo attraverso un insieme ordinato di frasi (“istruzioni”), scritte in un qualche linguaggio di programmazione, che specificano le azioni da compiere.
Eserc.Inf.Tel. - A.Sarica
41
� Programma: Testo scritto in accordo alla sintassi e alla semantica di un linguaggio di programmazione
Scopo delle Reti � Condividere risorse:
� File � Periferiche
� Comunicare � E-mail � Chat
� Utilizzare servizi: � Consultazione � E-commerce � Servizi Telematici
� es.: Applicazioni di Tele-medicina
Eserc.Inf.Tel. - A.Sarica
43
Reti di calcolatori � Architettura
centralizzata (master/slave): � Mainframe e
terminali � Architettura
distribuita: � Computer
indipendenti collegati insieme
Eserc.Inf.Tel. - A.Sarica
44
Architettura centralizzata � Questa tipologia di
architettura prevede l’utilizzo di un potente computer centrale che elabora tutte le informazioni, e di di tanti terminali utilizzati solo per operazioni di I/O.
Eserc.Inf.Tel. - A.Sarica
45
Architettura distribuita � In questo caso le singole macchine sono
autonome e collegate tra loro in una rete che permette loro di scambiarsi informazioni e risorse. Il server gestisce la comunicazione tra i diversi pc ma ognuno di essi può lavorare in locale in quanto possiede il proprio S.O.
Eserc.Inf.Tel. - A.Sarica
46
Architettura distribuita
I Server
� I Server sono computer su cui girano applicazioni che mettono a disposizione delle Risorse o dei Servizi.
I Client
� I Client chiedono ai server di accedere ad una Risorsa o ad un Servizio.
Eserc.Inf.Tel. - A.Sarica
47
Il Server esegue il lavoro e restituisce la risposta.
Classificazione delle Reti � Per Dimensione
� Reti personali (PAN)
� Reti locali (LAN) � Reti
metropolitane (MAN)
� Reti geografiche (WAN)
Eserc.Inf.Tel. - A.Sarica
48
Classificazione delle Reti � Per
Topologia di Rete � STELLA � ANELLO � LINEARE � GERARCHI
CA
Eserc.Inf.Tel. - A.Sarica
49
Protocolli � E’ necessario disciplinare le comunicazioni
sulla rete per evitare il caos. � In una comunicazione tra due calcolatori:
� il calcolatore “chiamante” conosce l’indirizzo del calcolatore destinatario
� il destinatario identifica l’indirizzo del “chiamante”
� i calcolatori parlano la stessa “lingua” � (generalmente) trasmette un solo calcolatore
per volta
Eserc.Inf.Tel. - A.Sarica
50
Il Transmission Control Protocol / Internet Protocol � Il TCP/IP è un’architettura di rete ideata con
l’obiettivo di collegare reti di natura diversa (internetworking) e di essere molto affidabile anche in caso di guasti a parti della rete. � IP (Internet Protocol) permette a un calcolatore
A di inviare un piccolo pacchetto di byte ad un calcolatore B
� TCP (Transmission Control Protocol) usa IP per permettere a un’applicazione su A di inviare una sequenza (anche molto lunga) di byte a un’applicazione su B.
Eserc.Inf.Tel. - A.Sarica
51
Storia del TCP/IP � 1957 nasce la Advanced Reserch Poject Agency
(ARPA) del Dipartimento della Difesa (DoD). � 1962 parte il progetto di una rete a commutazione
di pacchetto a prova di Nucleare. � 1968 nasce la rete ARPAnet tra le Università della
California (Los Angeles, Stanford, Santa Barbara e Utah) con protocollo NCP.
� 1972 La ARPAnet collega 32 nodi e Ray Tomlinson crea un programma per la posta elettronica.
� 1973 iniza lo sviluppo del TCP/IP.
Eserc.Inf.Tel. - A.Sarica
52
Storia del TCP/IP � 1982 si inizia a parlare di Internet � 1983 ARPAnet viene divisa separando la
parte pubblica (ARPAnet, poi internet) da quella Militare (MILnet Military Network. L’Università del Wisconsin introduce il DNS per la risoluzione dei nomi
� 1989 Nasce il servizio Web al CERN, Centro Europeo per la ricerca sulla fisica nucleare
Eserc.Inf.Tel. - A.Sarica
53
Gli indirizzi � Gli indirizzi IP sono numeri che identificano
in modo univoco ciascuna stazione sulla rete.
� Ogni computer connesso a Internet ha un indirizzo numerico univoco � n.n.n.n � dove 0 ≤ n ≤ 255
� Organizzati secondo una gerarchia
Eserc.Inf.Tel. - A.Sarica
54
Pacchetti IP � I documenti sono divisi in una sequenza di piccole
unità di dimensione prefissata � Ogni pacchetto contiene:
� una unità di documento � l’indirizzo IP del destinatario � un numero progressivo
Eserc.Inf.Tel. - A.Sarica
55
Invio dei pacchetti � I pacchetti sono
inviati tramite Internet � uno alla volta � ha diversi itinerari a
disposizione � Ogni pacchetto
può seguire un cammino diverso � gestisce interruzioni
di servizio e congestioni
Eserc.Inf.Tel. - A.Sarica
56
Domain Name System - DNS � Corrispondenze:
� nomi comprensibili agli esseri umani
� indirizzi IP � Su Internet
� ogni “host” ha un server DNS di riferimento
� tabella aggiornata nomi-indirizzi IP
Eserc.Inf.Tel. - A.Sarica
57
Internet � La parola Internet vuole dire letteralmente
"Interconnected Networks”.
� Internet (pr. Ìn-ter-net, composto del latino inter, "fra" e dell'inglese net, "rete") � la più grande rete telematica mondiale, e
collega alcune centinaia di milioni di elaboratori per suo mezzo interconnessi.
� In realtà è nata nelle intenzioni dei suoi inventori come "la" rete delle reti. Nell'arco di alcuni decenni è oggi divenuta la rete globale.
Eserc.Inf.Tel. - A.Sarica
59
Internet
� Non è dunque una rete omogenea, ma è un agglomerato di reti e singoli computer collegati liberamente tra loro utilizzando le risorse delle reti telefoniche pubbliche delle diverse nazioni, i ponti radio e le dorsali oceaniche (c.d. backbone).
Eserc.Inf.Tel. - A.Sarica
60
Il World Wide Web � Nel World Wide Web (WWW), le risorse
disponibili sono organizzate secondo un sistema di librerie, o pagine, a cui si può accedere utilizzando appositi programmi detti browser con cui è possibile navigare visualizzando file, testi, ipertesti, suoni, immagini, animazioni, filmati. � Il primo browser con caratteristiche simili a
quelle attuali, il Mosaic, venne realizzato nel 1993. Esso rivoluzionò profondamente il modo di effettuare le ricerche e di comunicare in rete.
Eserc.Inf.Tel. - A.Sarica
61
Gli aspetti chiave del www
62
� Linguaggio HTML per la formattazione dei documenti
� Meccanismo di indirizzamento universale: URL � Protocollo HTTP per la trasmissione di documenti
HTML � Il linguaggio “storico” del Web � Un linguaggio di annotazione (markup)
dei documenti che permette di collegare documenti in un ipertesto
� Due funzioni principali: � Specificare come il documento deve
essere visualizzato � Specificare links (usando URL)
Eserc.Inf.Tel. - A.Sarica
63
INDIRIZZI SU RETE: URL � URL (Uniform Resource Locator) è lo
standard per gli indirizzi delle risorse su Web
� Specifica: � Come accedere alla risorsa (protocollo) � Dove si trova la risorsa (indirizzo dell’host) � Nome della risorsa (path)
protocollo://host/path
Eserc.Inf.Tel. - A.Sarica
65
HTTP � Protocollo HTTP (HyperText Transfer Protocol) che
gestisce l’interazione tra un client e un server web � Client e server si scambiano dei messaggi
� Richieste da parte del client � Risposte da parte del server
� Più precisamente: � L’utente richiede una pagina residente su un server e il
suo browser richiede una connessione TCP con il server � Il server accetta la connessione iniziata dal browser � Il browser ed il server si scambiano messaggi � La connessione viene chiusa
Eserc.Inf.Tel. - A.Sarica
66
Come trovare e valutare l’informazione � Le pagine informative immesse su Web sono
decine di milioni, riguardano gli argomenti più vari, e provengono da fornitori di informazione di natura assai eterogenea. Si pongono dunque due problemi: � come riuscire a trovare l'informazione che
vogliamo in questa sterminata massa di documenti?
� come valutare la sua qualità, la sua veridicità ed affidabilità?
Eserc.Inf.Tel. - A.Sarica
68
Trovare l’informazione � Gli strumenti di ricerca delle informazioni
su Web si dividono in due categorie che è bene non confondere: i cataloghi sistematici e i motori di ricerca.
Eserc.Inf.Tel. - A.Sarica
69
I cataloghi sistematici � I cataloghi sistematici sono degli elenchi di siti e
pagine Web organizzati in base ad uno schema di classificazione per argomento. Questi elenchi assomigliano molto agli schemi di classificazione usati dalle biblioteche per organizzare i loro libri.
� La classificazione dunque parte da categorie molto generali, ad esempio, 'arti e letteratura', e scende fino a categorie molto particolari, ad esempio gli 'scritti di Dante Alighieri', passando per un certo numero di categorie intermedie.
Eserc.Inf.Tel. - A.Sarica
70
Dove trovarli
� Il più noto e completo tra questi cataloghi è Yahoo (il cui indirizzo è http://www.yahoo.com.
� Nato come esperimento universitario per iniziativa di due giovani studenti dell'università di Stanford (David Filo e Jerry Yang), è divenuto in pochi anni uno dei siti più visitati della rete (ed una miniera d'oro per i due, che nel frattempo si sono laureati).
Eserc.Inf.Tel. - A.Sarica
71
� I motori di ricerca italiani maggiormente utilizzati sono Libero e Virgilio.
� Tuttavia non sono veri motori di ricerca giacché si limitano ad usare Google: � Libero lo usa evidenziandone chiaramente il logo; � Virgilio ne usa i risultati senza evidenziarne la fonte
ed aggiungendo solo propri risultati sponsorizzati.
Eserc.Inf.Tel. - A.Sarica
72
I motori di ricerca � I motori di ricerca, invece, sono degli enormi
archivi che indicizzano interamente (trasformano cioè in un elenco di parole corredate delle indicazioni circa la loro collocazione originaria) il contenuto testuale di milioni e milioni di singole pagine Web e che possono essere interrogati.
� La ricerca in questo caso avviene indicando uno o più termini chiave che, a nostro giudizio, delimitano il concetto o il tema di nostro interesse.
Eserc.Inf.Tel. - A.Sarica
73
I principali motori di ricerca � Quello attualmente più utilizzato, su scala
mondiale (con un indice che supera gli 8 miliardi di pagine), è Google; molto usati anche Bing (motore di ricerca della Microsoft.
Eserc.Inf.Tel. - A.Sarica
74
I principali motori di ricerca: funzionamento � Il lavoro dei motori di ricerca si divide
principalmente in tre fasi:
� analisi del campo d'azione (tramite l'uso di crawler appositi);
� catalogazione del materiale ottenuto; � risposta alle richieste dell'utente;
Eserc.Inf.Tel. - A.Sarica
75
Motori di ricerca: ricerca avanzata � La possibilità di raffinazione
della ricerca varia da motore a motore, ma la maggior parte permette di utilizzare operatori booleani
� Ad esempio è possibile cercare "Ganimede AND satellite NOT coppiere" per cercare informazioni su Ganimede inteso come pianeta e non come figura mitologica.
Eserc.Inf.Tel. - A.Sarica
76
Motori di ricerca: ricerca avanzata � Su Google e sui motori più moderni è possibile
raffinare la ricerca: � lingua del documento, � delle parole o frasi presenti o assenti, � formato dei file (Microsoft Word, PDF, PostScript,
ecc.), � data di ultimo aggiornamento
� È anche possibile cercare contenuti presenti in un determinato sito, ad esempio “Ganimede site:nasa.gov”cercherà le informazioni su Ganimede presenti sul sito della NASA.
Eserc.Inf.Tel. - A.Sarica
77
Risultati della ricerca � Come risultato si ottiene un
elenco di pagine che contengono i termini indicati (il tutto, ovviamente, sotto forma di pagina Web con link attivi alle pagine elencate).
� Se vogliamo ad esempio cercare
le pagine che si occupano di Lewis Carroll (l'autore di Alice nel paese delle meraviglie), potremo fornire al motore di ricerca le due parole 'Lewis' e 'Carroll'.
Eserc.Inf.Tel. - A.Sarica
78
Operatori Booleani � In molti casi è possibile
combinare le parole fornite utilizzando i cosiddetti operatori logici.
AND
OR
NOT
Eserc.Inf.Tel. - A.Sarica
79
Come costruire una query AND
AND: una ricerca con chiave '(Lewis AND Carroll)' ci fornirebbe tutte le pagine in cui compaiono entrambi i nomi.
Eserc.Inf.Tel. - A.Sarica
80
Come costruire una query OR
OR: Ma, se sappiano che Lewis Carroll è uno pseudonimo del reverendo Dodgson potremmo fare una ricerca del tipo 'Lewis AND Carroll OR Dodgson', che ci restituirebbe le pagine in cui compaiono o i primi due termini insieme o il secondo o entrambi.
Eserc.Inf.Tel. - A.Sarica
81
Come costruire una query NOT
NOT: escludiamo le pagine che contengono una certa chiave. Esistono anche altri operatori (ad esempio quello di prossimità 'NEAR'), ma i principali sono questi. Tenete presente però che il modo di utilizzarli varia da un motore di ricerca ad un altro.
Eserc.Inf.Tel. - A.Sarica
82
Filtrare i risultati � Un altro aspetto di cui occorre tenere conto
nell'uso di questi strumenti è il fatto che la ricerca viene effettuata da un programma. Il programma utilizzato non farà altro che cercare la sequenza di lettere da noi fornite nel suo archivio, senza capire assolutamente il loro significato.
� Così se cerchiamo “Dante”, troveremo sia le
pagine dedicate al “sommo poeta”, sia le pagine dedicate al pittore e scrittore preraffaellita Dante Gabriele Rossetti, sia le pagine personali dei tanti Dante Rossi, o John Dante, appassionati di Internet.
Eserc.Inf.Tel. - A.Sarica
83
“Età” dei risultati � Ricordate che gli archivi dei motori di
ricerca vengono aggiornati periodicamente in modo automatico: può dunque capitare che non vengano presentate pagine di recente creazione, o che (assai più spesso) vengano elencate pagine che non sono più presenti sulla rete (la mortalità delle pagine Web è altissima).
Eserc.Inf.Tel. - A.Sarica
84
Easter egg di Google � sqrt(cos(x))*cos(300x)+sqrt(abs(x))-0.7)*(4-
x*x)^0.01, sqrt(6-x^2), -sqrt(6-x^2) from -4.5 to 4.5
88