R1 R2 R3 L1 L2 S0 X ms X ms D0 S1 S2 D1 D2boucherierj/onderwijs/... · R1 R2 R3 X ms X ms 240 ms 10 ms 10 ms L1 L2. Geluidbelasting Schiphol . 3 Dynamische Programmering • Aard

Stochastische Modellen in Operations Management (153088)

Richard Boucherie Stochastische Operations Research – TW, Ravelijn H 219

http://wwwhome.math.utwente.nl/~boucherierj/onderwijs/153088/153088.html

Ack

Internet

S0

S1

D1

S2

D2

D0

R1 R2 R3

X ms X ms

10 ms 10 ms240 ms

L1 L2

Geluidbelasting Schiphol

3

Dynamische Programmering

•  Aard van de problemen/ wanneer pas je dit toe: –  beslissingsproblemen over een eindige horizon waarbij

de beslismomenten geordend zijn (doorgaans in de tijd) •  Toepassingen

–  voorraadbeheer –  produktieplanning –  vervanging & onderhoud –  portfolio management

•  Probleemstructuur –  optimale strategie m.b.v. recursie

Today on SMOM:

•  Newsboy probleem: beslissen onder onzekerheid, een periode

•  Meerdere perioden: voorbeeld deterministische DP

•  Meerdere perioden: gemiddelde kosten

•  Stochastische dynamische programmering: onzekerheid

5 Voorbeeld: newsboy probleem

•  Krantenverkoper moet aan begin van de dag besluiten hoe veel kranten hij mee neemt.

•  De vraag naar kranten op een dag is onzeker. •  Doel:

Optimaliseer aantal mee te nemen kranten, zo dat winst maximaal is.

•  Model: D stochastische vraag naar kranten op willekeurige dag q het aantal mee te nemen kranten k de aanschafprijs van een krant v de verkoopprijs van een krant

•  Gevraagd: Bepaal q zdd verwachte winst W maximaal

6 Voorbeeld: newsboy probleem

•  D stochastische vraag naar kranten op willekeurige dag q het aantal mee te nemen kranten k de aanschafprijs van een krant v de verkoopprijs van een krant

•  Bepaal q zdd verwachte verlies W minimaal •  Kosten bij beslissing q

d≤q koop q kranten tegen k kosten kq verkoop d kranten tegen v opbrengst vd

kosten c(q,d)=kq-vd d≥q+1 koop q kranten tegen kosten k kosten kq

verkoop q kranten tegen v opbrengst vq kosten c(q,d)=kq-vq

P(D=d) kans vraag op willekeurige dag is d

7

Marginal analysis

•  Veelal is EW(q) een convexe functie

•  Bepaal q* als kleinste waarde zo dat

•  Begin bij q=0, en ga door tot ongelijkheid omklapt

•  Marginal analysis

8

•  Neem aan dat kostenstructuur is

c(d,q) = coq + (termen zonder q) (d ≤ q) c(d,q) = -cuq + (termen zonder q) (d ≥ q+1)

•  co overstocking kosten and cu understocking kosten. •  Bepaal nu EW(q+1)-EW(q) •  d ≤ q : extra order geeft extra overstocking kosten co

kans op overstocking P(D≤ q) d ≥ q+1 :extra order geeft minder understocking kosten cu

kans op understocking P(D ≥ q+1)

•  Kosten voor extra eenheid q : co P(D≤ q)- cu[1-P(D≤ q)]

Marginal analysis

9

Marginal analysis

•  Dus

•  en

als

dus als

Marginal analysis : optimale q* is kleinste q* waarvoor deze ongelijkheid geldig is

NB: P(D≤q) stijgend, dus voor c0+cu≥0 stijgt EW(q+1)- EW(q) dus EW(q) convex

10

Voorbeeld: newsboy probleem

•  d≤q kosten c(q,d)=kq-vd c0=k d≥q+1 kosten c(q,d)=kq-vq cu=v-k

•  Dus neem mee kleinste q zo dat

Today on SMOM:





12 Voorbeeld: W 18.2.3

•  Wijkt af van boek: reistijd ipv kilometers •  Doelstelling

–  Miminaliseer reistijd


•  Doelstelling –  Miminaliseer reistijd

14

Voorbeeld: W 18.2.3


Stap voor stap optimaal pad 1-2-5-8-10 uit deeloplossingen

16

Deterministische Dynamische Programmering

•  Toepassingen –  beslissingsproblemen over een eindige horizon waarbij de

beslismomenten geordend zijn (doorgaans in de tijd)

•  Bedrijfskundige toepassingen –  voorraadbeheer –  produktieplanning –  vervanging & onderhoud –  portfolio management

•  Probleemstructuur –  optimale strategie m.b.v. recursie fase n

toestand in ∈ Sn

beslissing dn ∈ Dn ( in )

directe resultaat rn ( in , dn )

overgang in+1 in , dn

17

Verklaring der variabelen •  Fasen n

–  aantal opeenvolgende momenten waarop beslissingen moeten worden genomen

•  Toestandsruimte Sn –  verzameling van mogelijke toestanden i die kunnen optreden in fase n

•  Beslissingsruimte Dn (i) –  verzameling van mogelijk acties d die beschikbaar zijn bij toestand i

in fase n

•  Directe resultaat rn (i,d) –  opbrengst gedurende fase n als gevolg van beslissing d in toestand i

•  Overgang j i,d –  toestand j als gevolg van beslissing d bij toestand i in fase n

nb in deze setting is d=j

18

Optimalisatie •  Doelstelling

– Maximaliseer / minimaliseer de verwachte resultaten over de gehele planningshorizon :

•  Optimale waardefunctie –  definieer fn(i) als het maximale resultaat vanaf fase

n vanuit toestand i ∈ Sn

•  Recurrente betrekkingen

•  Stopcriterium –  aan het eind van de planningshorizon ligt alles vast,

d.w.z. fN (i) moet gegeven zijn voor alle i ∈ SN

19

Algemene werkwijze

fN (i) en dN (i) voor alle i ∈ SN

fN-1 (i) en dN-1 (i) voor alle i ∈ SN-1

f0 (i) en d0 (i) voor alle i ∈ S0

f1 (i) en d1 (i) voor alle i ∈ S1

Today on SMOM:





21 Voorbeeld: stochastische afstand

•  Doelstelling –  Miminaliseer de verwachte reistijd

22

Verklaring der variabelen •  Fasen n

–  aantal opeenvolgende momenten waarop beslissingen moeten worden genomen

•  Toestandsruimte Sn –  verzameling van mogelijke toestanden i die kunnen optreden in

fase n

•  Beslissingsruimte Dn (i) –  verzameling van mogelijk acties d die beschikbaar zijn bij

toestand i in fase n

•  Directe resultaat rn (i,d) –  verwachte opbrengst gedurende fase n als gevolg van beslissing

d in toestand i

•  Overgang j i,d –  toestand j als gevolg van beslissing d bij toestand i in fase n

23

Voorbeeld:

•  Distributie systeem met K locaties •  pi (n) kans op vraag ter grootte n bij locatie i •  i stock-out kosten per eenheid product bij locatie i

•  Gevraagd: verdeling R eenheden over de locaties zo dat verwachte stock-out kosten minimaal zijn

•  Di vraag locatie i •  xi beslisvariabele: aantal eenheden voorraad op locatie i •  Zi # eenheden te kort : Zi =max{0, Di - xi }

€

π

24

25

26

27

28

Optimale toewijzing in eerste fase bekend: er zijn 5 eenheden beschikbaar voor K=3 locaties

Optimale beslissing x1(5)=1, met waarde doelfunctie 3.5 Dan 4 eenheden beschikbaar voor fase 2 (locaties 2 en 3) x2(4)=2 x3(2)=2 Dus optimale beslissing x*1=1, x*2=2, x*3=2

Today on SMOM:





30

Karakteristieken Dynamische Programmering

•  Probleem kan worden opgedeeld in fasen •  Elke fase is geassocieerd met een aantal toestanden •  Actie / beslissing in toestand legt volgende toestand vast •  Gegeven huidige toestand mag beslissing voor volgende

fasen niet afhangen van eerdere fasen (principe van optimaliteit, Bellman)

•  Er is een recursie die kosten / opbrengst van fasen t, t+1, …, T relateert aan kosten van fasen t+1, …, T

31

€

fn (i) = maxd ∈Dn ( i)

rn (i,d) + pn ( j | i,d) ⋅ fn+1( j)j∈Sn+1

∑

Karakteristieken Dynamische Programmering

•  Probleem kan worden opgedeeld in fasen •  Elke fase is geassocieerd met een aantal toestanden •  Actie / beslissing in toestand legt volgende toestand vast •  Gegeven huidige toestand mag beslissing voor volgende

fasen niet afhangen van eerdere fasen (principe van optimaliteit, Bellman)

•  Er is een recursie die kosten / opbrengst van fasen t, t+1, …, T relateert aan kosten van fasen t+1, …, T

Documents

R1 R2 R3 L1 L2 S0 X ms X ms D0 S1 S2 D1 D2boucherierj/onderwijs/... · R1 R2 R3 X ms X ms 240 ms 10 ms 10 ms L1 L2. Geluidbelasting Schiphol . 3 Dynamische Programmering • Aard