29
SMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

SMIDa.a. 2005/2006

8/3/2006

Tecniche di simulazione

Corso di Statistica per la Ricerca

Sperimentale

Page 2: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Metodo di Monte CarloRisoluzione di problemi numericideterminazione parametro F di una popolazione di cui una sequenza di numeri a caso è utilizzata per costruirne un campione significativo

• Perché utilizzare il metodo MC?

• Esistono sequenze di numeri casuali?

• Cosa si può ottenere mediante questa tecnica?

- Verifica aspettazioni teoriche- Controllo risultati sperimentali- …….

Page 3: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Problemi risolubiliTipo A: problemi statistico-probabilistici

• fluttuazioni casuali• esempio: probabilità del decadimento di Λ0 dopo due vite medie

Tipo B: problemi analitici, esatti, classici(conoscendo la legge di decadimento)

• risolvibili col calcolo • esempio: determinazione dell’area di un cerchio di raggio R

(A = π R2)

Page 4: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Soluzioni

probabilitàdecadimento

Λ0

calcolo area del cerchio

Tipo A

Tipo B

problemi statistico-probabilistici

simulazione diretta

numeri casuali

espansione in serie

calcolo analitico

Monte

Carl

oStatistica classicageometria

approssimata (convergenza

lenta

numerica convergenza

rapida

analitica calcolo esatto problemi analitici, esatti, classici

Page 5: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Decadimento Λ0

Soluzione analitica per vita media per λ > 2

fluttuazioni di una distribuzione binomialePiccoli intervalli dt

numero di particelle che decadono

occorre scegliere λNdt << 1probabilità numero a caso sia minore di λNdt

è proprio λNdtCon MC si ottiene la probabilità e la fluttuazione

Page 6: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Area cerchioSoluzione analitica

area di un cerchio unitario vale esattamente π

numero considerato esatto

Determinato con desiderato grado di accuratezza data le serie a segni alterni

Rapporto tra l’area del cerchioe quella del quadrato

vale proprio π/4M.C.: punti a caso nel quadrato

Page 7: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Simulazione diretta

fino a quando abbiamo esaurito tutte le N0 particelle Λ0 iniziali

Ripetiamo il procedimento per ciascun intervallo

Due chiari svantaggi

• N0 particelle Λ0 nel primo intervallo di tempo• Estrazione numero a caso N tra 0 ed 1• Se N > λN0dt: nessun decadimento è avvenuto• Se N < λN0dt, decadimento: N attuale = N0-1

• compromesso accuratezza e velocità calcolo• fluttuazioni statistiche intrinseche ~ 1/√N

Page 8: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

VantaggiFluttuazioni statistiche simili a quelle sperimentali

si vogliono studiare proprio queste fluttuazioni

Simulando direttamente il processo fisicostudiare assieme differenti aspetti del fenomenotrattazione di tipo analitico richiederebbecalcolo separato per ciascun risultato richiesto

Possibile introdurre dopo effetti più complicatipartire da una simulazione più rozzarendendola via via sempre più sofisticataper meglio rispecchiare la realtà da descrivere

Page 9: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Calcolo integraliDenominatore comune dei due problemi proposti

soluzione di un problema di integrazione

Metodo Monte Carlo: procedimento integrazionesi vuole determinare un numero Futilizzando numeri casuali r1, r2, r3, ..., rN

(per semplicità distribuiti tra 0 e 1)

determinazione di F dal valore dell’integrale

Page 10: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Numeri casualiSequenze assai lunghe di numeri a caso

veri numeri casuali (truly random number)

- numeri quasi-casuali (quasi-random number)

- numeri pseudo-casuali (pseudo-random number)

processo fisico (radiattività,……)numeri casuali generati artificialmente

numeri generati con τ lungo

numeri generati con τ cortoma con migliori proprietà asintotiche

Ricerca di algoritmi di analisi numerica

Page 11: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Numeri pseudo casualiCostruire un generatore di numeri aleatori

utilizzando elaboratori elettronicialgoritmi con formule matematiche

riproducibili e matematicamente non casualiripetute dopo un certo periodo (pseudo-casuali)

Von Neumann: metodo della metà quadratanumero di partenza di r cifreprimo numero casuale sono gli r/2 bit centralinumero elevato al quadrato: numero di r cifrer/2 bit centrali formano il secondo numero

Page 12: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Nuovi algoritmiCalcolatore con t bit (numeri da 0 a 2t-1)ri è ricavato tramite la formula ricorsiva

m = 2t

distribuzione di numeri pseudo-randomperiodo di generazione pari a 2t-2

b scelto dall’utilizzatore

Elaboratore a 32 bitperiodo di generazione pari a 230 ~ 109

Uniformità (equiprobabilità)?sequenze brevi ma uniformi.

Page 13: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Richiami matematiciDistribuzione di densità di probabilità

funzione di distribuzione integrata G(u)

Due variabili u e v statisticamente indipendenti

Aspettazione matematica

Page 14: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Legge dei grandi numeriLegge uniforme

Per N sufficientemente grande

quando sequenza numeri a caso diviene grandeMetodo Monte Carlo converge al valore corretto

stima Monte Carlo valore intergrale

Page 15: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Limite centrale

la somma di un numero N di variabili casuali indipendenti, non importa come distribuite

è sempre distribuita in modo normale

Il teorema del limite centrale afferma che

con valore medio μ, varianza σ2 finita (N >>1)

Convergenza alla distribuzione gaussiana rapida!

Ottenere un generatore gaussiano di numeri a casoprendendo la somma di numeri casuali qualsiasi

Page 16: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Lancio di un dado

dado “onesto” (p = 1/6)

R1 distribuzione di un numero a caso tra 0 e 1

2 ≤ p ≤ 12, pmax = 7

R2 distribuzione triangolaresomma delle facce di due dadi:

Page 17: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Per N che aumenta …R3: due flessi in ±1 e ±2

forma a campana

R12: buona approssimazione della gaussiana

Page 18: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

GaussianaPer ottenere una gaussiana normalizzata

con media μ = 0 e varianza σ2 = 1 occorre

che proprio nel caso di N = 12 da varianza 1

t = RN - 6

Page 19: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

ConclusioneDeterminazione del valore di una funzione F

dal calcolo di un integrale ISe varianza finita,

corretta ( anche se imprecisa) per ogni Ncongruente ossia converge, all’aumentare di N

normale, asintoticamente, distribuita,

la stima ottenuta con MC è:

Deviazione standard metodo MC

L’errore diminuisce ~ 1/√N

Page 20: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Efficienza

su una regione specificata bidimensionale

L’efficienza di una simulazionedipende dagli algoritmi utilizzati

Calcolo di un integrale bidimensionale su una regione triangolare

1 x0

y

1

y = x

Il calcolo analitico èquello di integrare una funzione g(x, y)

Page 21: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Metodo banale(a) scegliere un numero a caso 0 < xi < 1(b) scegliere un altro numero a caso 0 < yi < xi

(c) calcolare il valore g(xi,yi)(d) ricavare l’integrale sommando i vari g(xi,yi) ripetendo i passi (a), (b) e (c)

Valutazione scorrettapunti solo nella regione permessapiù addensati nella parte di sinistra (x bassi)piuttosto che nella parte destra (x alti)

Page 22: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Metodo del rigetto(a) scegliere un numero a caso 0 < xi < 1(b) scegliere un altro numero a caso 0 < yi < 1

(d) calcolare il valore g(xi,yi)(e) sommare i vari g(xi,yi) iterando

Punti equidistribuitiutilizza solo la metà dei punti generatiintegra sul quadrato ma non considera l’area del triangolo superiore

(c) se yi > xi rigettare il punto e ritornare ad (a)

Non cambia se da (c) si va in (b) invece che in (a)

Page 23: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Metodo del ripiegamento(a) scegliere un numero a caso 0 < ri < 1(b) scegliere un altro numero a caso 0 < rj < 1

(d) porre yi = min(ri,rj)(c) porre xi = max(ri,rj)

(e) calcolare il valore g(xi,yi)(f) sommare i vari g(xi,yi) iterando

Prende i punti sull’intero quadratoripiega il quadrato lungo la diagonaletutti i punti cadono nel triangolo inferiorepunti uniformemente distribuiti senza rigetto

Page 24: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Metodo pesato(a) scegliere un numero a caso 0 < xi < 1(b) scegliere un altro numero a caso 0 < yi < xi(c) calcolare il valore g(xi,yi) pesandolo con 2xi

(d) sommare i vari g(xi,yi) iterandoPunti scelti in modo scorrettopesati tramite una funzione opportuna

più o meno efficiente,comparato con quello del ripiegamento,

a seconda del valore della funzione g

nel caso in esame, proporzionale ad x

Page 25: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Metodi alternativi

combinazione lineare di differenti valori

Metodo di Monte Carloformula di quadratura

con pesi unitaripunti scelti uniformemente

ma casualmente!

Formula della quadraturaapprossima il valore dell’integrale

Page 26: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

TrapezioidaleDividere l’intervallo totale in N sottointervalliapprossimare l’integrale in ciascun sottointervallo

tramite l’area del trapezoide iscrittosopra o sotto la curva da integrare

media di N+1 valori di funzionemoltiplicati per la larghezza d’intervallo

due valori estremi che partecipano solo con un termine 1/2

Page 27: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Espansioni in serie

convergenza del metodo è molto rapida

N punti egualmente spaziatierrore sull’integrale risulta ~ 1/N2

Per grandi valori di Nfunzione può essere espressa con espansioni in serie di Taylor intorno a ciascuno degli N punti

termine costante e il primo termine (lineare) correttamente integrati dalla regola trapezoidale

errore = termini di ordine superiorevia via sempre meno importanti

Page 28: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

Polinomiali

integra i polinomi di grado 2m - 1

Formula di quadratura di Gaussutilizza m punti (ed m pesi associati)

Possibilità integrare polinomi di grado superioremaggiore rapidità di convergenza

Regola di Simpsontre punti per ogni intervallo

integra tutti i polinomi di terzo grado

…….

Page 29: Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a. 2005/2006 8/3/2006 Tecniche di simulazione Corso di Statistica per la Ricerca Sperimentale

numero di punti (regola di Gauss)

dim

ensi

onal

itàd’

inte

graz

ione

ConvergenzaMa allora perché utilizzare il metodo di Monte Carlo?

indipendente dalla dimensionalità dello

spazio di integrazione

dimensionalità D per cui converge più velocemente di un metodo di

quadratura

MC piùveloce

Gauss più veloce

Gauss non applicabile