Upload
gerardo-grillo
View
219
Download
0
Embed Size (px)
Citation preview
SQL SERVER
Modulo 4
Relatore: Stefano Furlan
Una premessa• Lezioni pratiche con in mente il progetto• Requisiti
• Information retrieval• Non avere paura di usare google
• Capacità progettuale• Dove voglio arrivare? (definizione della specifica)• Cosa mi serve per arrivarci? (analisi)• In che ordine lo faccio? (separazione dei task)• Come capisco che sono arrivato? (verifica del risultato)
• OVVERO: Buonsenso!
Cos’è un DBMS?• In realtà dovremmo chiederci…
?
• A COSA CI SERVE?• A quali domande del nostro committente dobbiamo dare risposta?
Architettura di un sistema di telecontrollo
Pannelli fotovoltaici
Sistema di controllo
DB
Collettoredati
Sistema di reportistica
Utente
Dati
Controllo
Applicazione di configurazione
A cosa serve un DBMS?• Storage Dati• Ma quali dati?
• Dati tecnici• Configurazioni• Logs
• Siamo fortunati: tipicamente una base dati per il telecontrollo è piuttosto semplice
Struttura del DBMS
MOTORE DATIQUERYSQL
Dati
LINGUAGGIO SQL• Structured query language• Comandi testuali strutturati per il database
• DML (data manipulation language)• DDL (data definition language)
• Vantaggio: compatibilità• TSQL: dialetto di MS Sql Server
SQL SERVER• È un sw server!
• Come lo contatto?• Meccanismo di istanze (Nomemacchina\nomeserver)
• Accesso usando tool SSMS• Interfaccia user friendly• Query testuali
Operazioni preliminari• Accesso con SSMS
• Creazione di un DB vuoto• Skip delle impostazioni
CREAZIONE DI UNA BASE DATI
MAPPARE LA STRUTTURA DELLA REALTA’
• PANNELLI (3 pannelli piccoli e uno grande)• GRUPPI (divisi in due zone)• ENERGIA PRODOTTA (che producono energia ad ogni
ora)
ENTITÀ FONDAMENTALI in una base dati• TABELLE
• Campi (colonne) tipizzati• Chiavi• Indici
• RELAZIONI• Chiavi esterne
• VISTE• PROCEDURE
OPERAZIONI FONDAMENTALI in una base dati
• Lettura o selezione (SELECT)• Scrittura o inserimento (INSERT)• Modifica (UPDATE)• Cancellazione (DELETE)
TABELLAIdPannello Nome Potenza DataInstallazione
1 Pannello 1 3kW 1/1/2013
2 Pannello 2 2kW 1/1/2013
3 Pannello 3 2kW 1/3/2013
4 Pannello 4 null 1/3/2013
Esempio di tabella
TABELLA• CAMPI tipizzati
• Numerici• Interi
• Tinyint (1 byte) 0-255• Smallint (2 bytes) -32000 +32000• Integer (4 bytes) +-miliardi (+-2^31)• Bigint (8 bytes) +- le particelle dell’universo (+-2^63)
• Frazionari• Float (attenzione: errori di arrotondamento)• Decimal(x,y) (preciso ma lento)• Money (4 cifre decimali)
• Testuali• Char(x)• Varchar(x) • nvarchar(x) (unicode)
• Date• Date• Datetime
• Altri (poco usati)
TABELLE: chiave primaria• Campo o campi che permettono di individuare
univocamente ciascuna riga• Spesso un codice ID intero ad auto incremento
idPannello Nome1 Panel12 Panel23 Panel3
CHIAVE PRIMARIA
TABELLA: altre features• Identity• Default value• Vincoli check• Indici Univoci• Valori Nulli e campi nullabili
• Convenzione: i nomi tabella iniziano con «tab»
Un po’ di pratica• Accediamo a SQL server per creare una tabella per i
pannelli(Usando SSMS)
Interfaccia di creazione tabella
Ultime info su SSMS• Gli oggetti non si aggiornano da soli in visualizzazione
• Refresh• Ctrl-shift R
• Context menu• Inserimento dei dati
in tabella manualmente
TABELLA: relazioni tra tabelle• Si chiama «relazionale» per qualche motivo
• Relazioni tra entità • Integrità referenziale enforced da DB (il db impedisce che nella
tabella dei consumi esista mai una riga «orfana»)
idPannello Nome1 Panel12 Panel23 Panel3 idPannello Data Energia
2 01/01/2013 1003 01/01/2013 2004 01/01/2013 2504 01/02/2013 105 01/01/2013 405 01/02/2013 5
Il diagramma database• Metodo facilitato di creazione• Permette di tenere sotto controllo in maniera grafica le
relazioni
• Usato per separare parti diverse di un progetto complesso
Esempio di semplice diagramma…
Torniamo alla nostra realtà…
• PANNELLI (3 pannelli piccoli e uno grande)• GRUPPI (divisi in due zone)• ENERGIA PRODOTTA (che producono energia ad ogni
ora)
Progettazione di una base dati: STEPS
• Individuazione delle entità • (tipicamente ogni entità avrà la sua tabella)
• Individuazione delle relazioni• Alcune tabelle saranno collegate ad altre in maniera naturale
• Produzione del diagramma
Esempio: dati di sistema fotovoltaico• Dati di funzionamento (energia prodotta ogni quarto d’ora)• Configurazioni (quanti e quali pannelli ho?)• Dati di log (listato diagnostico)
REGOLE DI PROGETTAZIONE• Buonsenso!• Ogni tabella mappa un’entità (o una relazione)• Deve esistere sempre una chiave primaria• Evitare dati non atomici (concatenazione di dati nello
stesso campo)• Mai lo stesso dato contemporaneamente in due posti
diversi!• Mai perdere informazioni• Evitare che vengano inserite porcherie
• Forme normali
TABELLE: alcuni consigli• Usare il tipo di dato più corretto per ogni campo ma
pensando con lungimiranza• Impedire l’inserimento di dati scorretti
• Se qualcosa può andare storto LO FARA’• ES: Codici fiscali
• Campi di testo libero a Varchar(max)• Vedi la legge di murphy sopra
ESERCITAZIONE• Che tipo di dato è bene usare per :
• Per la temperatura del corpo umano? Perché?• Per un numero civico? Perché?• Per la potenza istantanea di un impianto? Perché?
• Che vincoli mettereste sui dati di cui sopra?
• Progettare un SEMPLICE database per gestire un parco fotovoltaico (usando il diagramma)• Entità: pannello, energia prodotta ogni quarto d’ora da ciascun
pannello, raggruppamento di pannelli in aree.
Esercitazione: data entry• Una volta creata la base dati
• Creare 4 pannelli• Creare due zone (una con tre pannelli l’altra con uno)• Inserire dati di energia prodotta per tutti i giorni di Gennaio 2013
per tutti e 4 i pannelli• Possibile utilizzo di excel per il data entry
Progettazione di una base dati• PROGETTARE UNA BASE DATI È UN’ATTIVITÀ SOLO
APPARENTEMENTE BANALE• MOLTI PERICOLI NASCOSTI• FARE MODIFICHE IN CORSO D’OPERA PUÒ ESSERE
DISPENDIOSO• MEGLIO PROGETTARE BENE DALL’INIZIO
• Chiara definizione delle entità• Buone naming conventions (prefissi, camel-case)
APPROFONDIMENTI• Indici e Considerazioni di performances
UTILIZZODI UNA BASE DATI
Azioni sulla base dati
• Lettura o selezione (SELECT)• Scrittura o inserimento (INSERT)• Modifica (UPDATE)• Cancellazione (DELETE)
• QUERY• Frase in pseudo inglese
• ES: seleziona <qualcosa> da una <tabella> quando <si verifica una certa condizione>
SELECT• La funzione più usata in assoluto• Sintassi usata anche in altre funzionalità• Ritorna un recordset
SELECT: sintassi
SELECT <lista campi>
FROM <tabella>
WHERE <condizione>
ORDER BY <lista campi ordinamento>
Es:
SELECT [idPannello]
,[Pannello]
,[Note]
FROM tabPannelli
Le Keyword in MAIUSCOLO per convenzione
SELECT : lista campi
• SELECT Nome,Potenza as PotKWH FROM tabPannelli
IdPannello Nome Potenza DataInstallazione
1 Pannello 1 3kW 1/1/2013
2 Pannello 2 2kW 1/1/2013
3 Pannello 3 2kW 1/3/2013
4 Pannello 4 null 1/3/2013
Nome PotKWH
Pannello 1 3kW
Pannello 2 2kW
Pannello 3 2kW
Pannello 4 null
SELECT: lista campi• Asterisco= tutti i campi
• Es: select * from tabella
• Alias • Es: SELECT nome as NomePannello from tabPannelli
• Sono possibili alcune operazioni in fase di select (concatenazione di stringhe)• ES: SELECT ‘il pannello ‘ + idpannello +’ è rotto’ as Anomalia
FROM tabPannelli
• 3 part naming convention• Es: SELECT * FROM dbFotovoltaico.dbo.tabPannelli
• Parentesi quadre se campo contiene spazio• ES: SELECT nome as [il mio nome] FROM tabPannelli
SELECT : condizioni• WHERE <campo/valore><operatore><campo/valore>
• Es: WHERE idpannello=1
• WHERE IN (lista elementi)• Es: WHERE idpannello IN (1,2,3)
• WHERE IN (query)• Es: WHERE idpannello IN (select idpannello from tabPannelli
where nomepannello=‘pannello1’)
• WHERE LIKE• Es: WHERE nome LIKE ‘Pannello%’
• Uso di valori testuali• Padding• SQL iniection
SELECT: condizioni• Usabili tutti gli operatori di confronto (< , > , = , != , <>)
• Es: WHERE idPannello=1
• Altri operatori (LIKE, BETWEEN)• Tutti i costrutti booleani (AND, OR, NOT)• Usare sempre le parentesi
• Es: SELECT *
FROM tabPannelli
WHERE idpannello=1
AND (nomepannello=‘Pannello1’ OR nomepannello=‘Pannello2’ )
SELECT: ordinamento• La clausola ORDER BY specifica il criterio di ordinamento
• Es:
SELECT *
FROM tabPannelli
ORDER BY idPannello ASC,NomePannello DESC
JOIN
idPannello Nome1 Panel12 Panel23 Panel3
idPannello Data Energia2 01/01/2013 1003 01/01/2013 2004 01/01/2013 2504 01/02/2013 105 01/01/2013 405 01/02/2013 5
Come collegare i dati di tabelle distinte?
tabPannelli
tabEnergia
?
JOIN (collegamento di più tabelle)• INNER
• È l’opzione più comune• Vengono restituite solo le righe comuni a entrambe le tabelle• Se in una delle tabelle non ho un match la riga «scompare»• Possono essere restituite più righe delle due tabelle!
• (tipicamente è un errore)
idPannello Nome idPannello Data Energia1 Panel1 null null null2 Panel2 2 01/01/2013 1003 Panel3 3 01/01/2013 200
null null 4 01/01/2013 250null null 4 01/02/2013 10null null 5 01/01/2013 40null null 5 01/02/2013 5
JOIN• LEFT
righe a sx più righe a dx che matchano
• RIGTHè una left con le tabelle scambiate(da non usare per problemi di leggibilità)
idPannello Nome idPannello Data Energia1 Panel1 null null null2 Panel2 2 01/01/2013 1003 Panel3 3 01/01/2013 200
null null 4 01/01/2013 250null null 4 01/02/2013 10null null 5 01/01/2013 40null null 5 01/02/2013 5
idPannello Nome idPannello Data Energia
1 Panel1 null null null2 Panel2 2 ######## 1003 Panel3 3 ######## 200
null null 4 ######## 250null null 4 ######## 10null null 5 ######## 40null null 5 ######## 5
JOIN• FULL OUTER
• CROSS• Fa il cartesiano(tutte le combinazioni).
• Con le tabelle sopra sono 18 righe…
idPannello Nome idPannello Data Energia1 Panel1 null null null2 Panel2 2 01/01/2013 1003 Panel3 3 01/01/2013 200
null null 4 01/01/2013 250null null 4 01/02/2013 10null null 5 01/01/2013 40null null 5 01/02/2013 5
JOIN: sintassi• SELECT <lista campi>• FROM <tabella> as <Alias>
• INNER JOIN <tabella> as <Alias2>• ON Alias1.campo = Alias2.campo
• Es:• SELECT *• FROM tabEnergia
• INNER JOIN tabPannelli• ON tabEnergia.idPannello=tabPannelli.idPannello
ESERCITAZIONE:• Mostrare la tabella consumi ma, al posto dell’idPannello
mostrare il nome del pannello
JOIN in cascata• È possibile combinare più tabelle in una serie di join
successivi
• Es:
• SELECT *• FROM tabEnergia
• INNER JOIN tabPannelli• ON tabEnergia.idPannello=tabPannelli.idPannello
• INNER JOIN tabGruppi• ON tabGruppi.idGruppo=tabPannelli.idGruppo
Best practices su SELECT e JOIN• Attenzione ai cartesiani!• Attenzione alle INNER su campi non chiave: potrebbero
«sparire righe» o uscire «righe in più»• Ordinare le tabelle nella clausola di join a partire dalla più
informativa• Usare solo left join e mai right join per facilità di lettura• Formattazione delle query
AGGREGAZIONE E RAGGRUPPAMENTO
• Che succede se voglio sommare dei valori?• Es: sapere quanto ha prodotto ogni pannello in un certo periodo?
• Ma io ho questo:
Pannello Energia Prodotta In GennaioPannello1 1230Pannello2 132Pannello3 1244
idPannello Data Energia2 01/01/2013 1003 01/01/2013 2004 01/01/2013 2504 01/02/2013 105 01/01/2013 405 01/02/2013 5
AGGREGAZIONE E RAGGRUPPAMENTO
SELECT<lista campi>
<lista funzione di aggregazione(Campo)>
FROM <tabella>
WHERE <condizione>
HAVING <condizione su campi raggruppati>
Es:SELECT tabPannelli.Pannello
, SUM(tabEnergiav2.Energia) AS EnergiaTot
FROM tabEnergiav2
INNER JOIN tabPannelli
ON tabEnergiav2.idPannello = tabPannelli.idPannello
GROUP BY tabPannelli.idPannello
, tabPannelli.Pannello
ESERCITAZIONE• Mostrare in una lista tutti i pannelli e, per ognuno mostrare
l’energia prodotta (sia che il pannello abbia prodotto, sia no!)
ESERCITAZIONE• Mostrare la quantità di energia prodotta da ogni pannello
(specificando il nome pannelloe non l’ID!)• In totale• Raggruppata per giorno• Per la prima settimana di gennaio 2013• Raggruppata per mese e salvare la query• Raggruppata per settimana(!) (non si può fare con la base dati che
abbiamo: perché? Come si può fare?)
• Mostrare in una lista tutti i pannelli e, per ognuno mostrare l’energia prodotta (sia che il pannello abbia prodotto, sia no!)
INSERT• INSERT VALUES
INSERT INTO tabella
(lista campi)
VALUES
(lista valori)
• INSERT RESULTS
INSERT INTO tabella
(lista campi)
SELECT <lista campi>FROM tabella
WHERE <condizione>
UPDATE• Aggiornamento di tabelle• Sintassi
• UPDATE <tabella>• SET campo=<Valore>• FROM <tabella>
• Es:• UPDATE tabEnergia• SET energia=0• FROM tabEnergia• WHERE (Ora >23 OR Ora<5)
DELETE• Sintassi:
• DELETE FROM tabella WHERE idpannello=1
• In caso di joinDELETE FROM tabella
FROM tabellaINNER JOIN tabella2
ON tabella.id=tabella2.id
WHERE tabella2.Nome=‘Pannello2’
Attenzione in caso di relazioni con cascade!
ESERCITAZIONE• Creare una tabella con i giorni dell’anno e alimentarla• Eliminare tutti i dati di energia prodotta• Inserire nuovi dati di consumo per tutto il 2013 (con QTA
casuali da 50 a 100 di giorno, 0 di notte) per i pannelli 1,2,4
• A marzo 2013 simulare un malfunzionamento del pannello 2 (aggiornando i dati con NULL in tabella)
• Lanciare la query salvata nella precedente esercitazione per visualizzare i dati di ogni pannello per ogni mese
NOZIONI AVANZATE
UNA PREMESSA
•DATA ENCAPSULATION•INFORMATION HIDING•LOGICA N-TIERED
• Garanzie di successo del progetto• Divisione efficiente in tasks • Manutenibilità
VISTE• Sono in pratica delle query di tipo SELECT nel DB• Calcolate «on the fly»• Piccole differenze
• tutti i campi devono essere univoci• Ogni campo deve avere un nome
• Possono essere create con designer• Ma fa un po’ schifo
VISTE: sintassi• CREATE VIEW <nomevista>• AS
• <query>
ES:
CREATE VIEV vwPannelli
AS
SELECT * FROM tabpannelli
VISTE: alcune considerazioni• Vengono calcolate ogni volta
• Possibili lentezze
• Se varia un campo la modifica non è a cascata• Utili per comunicare con l’esterno
• Nascondono complessità implementative (information hiding)• Utenti• Sistemi di reportistica
• Possono essere richiamate nelle query in maniera semplice e comoda
STORED PROCEDURES• Esigenze di data encapsulation e information hiding• Molto potenti• A differenza delle viste
• Possono eseguire azioni• Possono non ritornare un recordset (dati tabellari)• Possono usare step intermedi di calcolo (es: temp tables)• Ammettono variabili in ingresso e uscita
• Svantaggi• Non posso fare join sul risultato di una store
STORED PROCEDURES: sintassi• CREATE PROCEDURE <nome>• (
• <Parametri>
)
• AS• BEGIN
• <istruzioni>
• END
• CREATE PROCEDURE spMostraEnergiaPerPannello• (
• @idPannello as int
• )• AS• BEGIN
• Select sum(energia)• From tabEnergiaProdotta• WHERE idpannello=@idPannello
• END
STORED PROCEDURE: chiamata• Sintassi:• EXEC spVisualizzaPannello 1• • OPPURE
• EXEC spVisualizzaPannello @idPannello=1
ESERCITAZIONE• Creare una procedura che cancelli la tabella dell’energia
prodotta (spResetData)• Creare una procedura che chiamata con parametro
IdPannello mostri l’energia prodotta da quel pannello
SINTASSI TSQL: una piccola toolbox• Variabili• Strutture di controllo
• IF
• Cicli• FOR• WHILE
• Cursori• Da vedere poi…
SINTASSI TSQL: VARIABILI• Iniziano con @• Vanno dichiarate
• DECLARE @intIdPannello as int=10
• Se non inizializzate sono NULL!• DECLARE @intIdPannello as int è NULLA
• Si impostano con istruzione SET• SET @intIdPannello =10
SINTASSI TSQL: Strutture condizionali
• IF (<condizione>)• BEGIN
• <azione>
• END
• ELSE• BEGIN
• <azione>
• END
• ES:
• IF (@idPannello=1)• BEGIN
• DELETE FROM tabPannello WHERE idPannello=@idPannello
• END
SINTASSI SQL• CONDIZIONE SU RISULTATO QUERY
• IF EXISTS(<query>)• BEGIN
• <azioni>
• END• ELSE• BEGIN
• <altre azioni>
• END
SINTASSI TSQL: altro• CASE WHEN <condizione> THEN <espressione>
WHEN <condizione> THEN <espressione>
ELSE
<espressione>
END
• CICLI• FOR• WHILE
ESERCITAZIONE• Allo scopo di generare dei dati da analizzare:• Creare una procedura sp_generaDatiDEmoPannello che,
dato un idpannello• Elimini dalla tabella energia prodotta tutti i dati di quel pannello• Generi per ogni giorno dell’anno 2013 una riga di misurazione con
una quantità randomica da 50 a 100 ( per tutte le ore dalle 8 alle 19) solo alle ore 12• Cercare su google la funzione RAND per la funzione random
• Se il pannello è il 3 corregga il dato così prodotto simulando un malfunzionamento per tutto marzo e aprile2013(tutte le qta andranno a NULL)
ESERCITAZIONE• Creare una procedura spGeneraDatiDemo che chiami la
procedura precedente per ogni pannello esistente in tabella• La soluzione adottata come reagisce al fatto che io aggiungo un
pannello? Si adatta? Cosa mi servirebbe?
• Eseguirla e Verificare usando la vista dell’energia prodotta i risultati ottenuti
CASE STUDY: import massivo dati
Progettazione di una Procedura di controllo per l’import dati.• Una stored proc (parametro=idtrasmissione)• Che la trasmissione sia arrivata(che sia arrivato almeno un dato)• Il pannello esiste?(lo facciamo dopo)• La qta non negativa• Qta inferiore a soglia 500• La data della misurazione deve essere univoca
• e non già presente nel database(per pannello)
• Chiamare la store:spVerificaTrasmissione (@idTrasmissione)• Alla fine aggiornare il campo stato con 1 se successo, 0 se fallimento
• DECLARE @cnt AS int• SELECT @cnt=count(*) FROM tabella
• (approfondire problema della quantizzazione temporale)
ALTRE FUNZIONALITA’• FUNZIONI
• Richiamabili da query• Solitamente non usate: problematiche di performances
• TABLE FUNCTIONS• «viste» parametriche• Anche qui problemi di performances