Upload
ngohanh
View
223
Download
0
Embed Size (px)
Citation preview
Stochastische Modellen in Operations Management (153088)
Richard Boucherie Stochastische Operations Research – TW, Ravelijn H 219
http://wwwhome.math.utwente.nl/~boucherierj/onderwijs/153088/153088.html
Ack
Internet
S0
S1
D1
S2
D2
D0
R1 R2 R3
X ms X ms
10 ms 10 ms240 ms
L1 L2
Geluidbelasting Schiphol
3
Dynamische Programmering
• Aard van de problemen/ wanneer pas je dit toe: – beslissingsproblemen over een eindige horizon waarbij
de beslismomenten geordend zijn (doorgaans in de tijd) • Toepassingen
– voorraadbeheer – produktieplanning – vervanging & onderhoud – portfolio management
• Probleemstructuur – optimale strategie m.b.v. recursie
Today on SMOM:
• Newsboy probleem: beslissen onder onzekerheid, een periode
• Meerdere perioden: voorbeeld deterministische DP
• Meerdere perioden: gemiddelde kosten
• Stochastische dynamische programmering: onzekerheid
5 Voorbeeld: newsboy probleem
• Krantenverkoper moet aan begin van de dag besluiten hoe veel kranten hij mee neemt.
• De vraag naar kranten op een dag is onzeker. • Doel:
Optimaliseer aantal mee te nemen kranten, zo dat winst maximaal is.
• Model: D stochastische vraag naar kranten op willekeurige dag q het aantal mee te nemen kranten k de aanschafprijs van een krant v de verkoopprijs van een krant
• Gevraagd: Bepaal q zdd verwachte winst W maximaal
6 Voorbeeld: newsboy probleem
• D stochastische vraag naar kranten op willekeurige dag q het aantal mee te nemen kranten k de aanschafprijs van een krant v de verkoopprijs van een krant
• Bepaal q zdd verwachte verlies W minimaal • Kosten bij beslissing q
d≤q koop q kranten tegen k kosten kq verkoop d kranten tegen v opbrengst vd
kosten c(q,d)=kq-vd d≥q+1 koop q kranten tegen kosten k kosten kq
verkoop q kranten tegen v opbrengst vq kosten c(q,d)=kq-vq
P(D=d) kans vraag op willekeurige dag is d
7
Marginal analysis
• Veelal is EW(q) een convexe functie
• Bepaal q* als kleinste waarde zo dat
• Begin bij q=0, en ga door tot ongelijkheid omklapt
• Marginal analysis
8
• Neem aan dat kostenstructuur is
c(d,q) = coq + (termen zonder q) (d ≤ q) c(d,q) = -cuq + (termen zonder q) (d ≥ q+1)
• co overstocking kosten and cu understocking kosten. • Bepaal nu EW(q+1)-EW(q) • d ≤ q : extra order geeft extra overstocking kosten co
kans op overstocking P(D≤ q) d ≥ q+1 :extra order geeft minder understocking kosten cu
kans op understocking P(D ≥ q+1)
• Kosten voor extra eenheid q : co P(D≤ q)- cu[1-P(D≤ q)]
Marginal analysis
9
Marginal analysis
• Dus
• en
als
dus als
Marginal analysis : optimale q* is kleinste q* waarvoor deze ongelijkheid geldig is
NB: P(D≤q) stijgend, dus voor c0+cu≥0 stijgt EW(q+1)- EW(q) dus EW(q) convex
10
Voorbeeld: newsboy probleem
• d≤q kosten c(q,d)=kq-vd c0=k d≥q+1 kosten c(q,d)=kq-vq cu=v-k
• Dus neem mee kleinste q zo dat
Today on SMOM:
• Newsboy probleem: beslissen onder onzekerheid, een periode
• Meerdere perioden: voorbeeld deterministische DP
• Meerdere perioden: gemiddelde kosten
• Stochastische dynamische programmering: onzekerheid
12 Voorbeeld: W 18.2.3
• Wijkt af van boek: reistijd ipv kilometers • Doelstelling
– Miminaliseer reistijd
13 Voorbeeld: W 18.2.3
• Doelstelling – Miminaliseer reistijd
14
Voorbeeld: W 18.2.3
15 Voorbeeld: W 18.2.3
Stap voor stap optimaal pad 1-2-5-8-10 uit deeloplossingen
16
Deterministische Dynamische Programmering
• Toepassingen – beslissingsproblemen over een eindige horizon waarbij de
beslismomenten geordend zijn (doorgaans in de tijd)
• Bedrijfskundige toepassingen – voorraadbeheer – produktieplanning – vervanging & onderhoud – portfolio management
• Probleemstructuur – optimale strategie m.b.v. recursie fase n
toestand in ∈ Sn
beslissing dn ∈ Dn ( in )
directe resultaat rn ( in , dn )
overgang in+1 in , dn
17
Verklaring der variabelen • Fasen n
– aantal opeenvolgende momenten waarop beslissingen moeten worden genomen
• Toestandsruimte Sn – verzameling van mogelijke toestanden i die kunnen optreden in fase n
• Beslissingsruimte Dn (i) – verzameling van mogelijk acties d die beschikbaar zijn bij toestand i
in fase n
• Directe resultaat rn (i,d) – opbrengst gedurende fase n als gevolg van beslissing d in toestand i
• Overgang j i,d – toestand j als gevolg van beslissing d bij toestand i in fase n
nb in deze setting is d=j
18
Optimalisatie • Doelstelling
– Maximaliseer / minimaliseer de verwachte resultaten over de gehele planningshorizon :
• Optimale waardefunctie – definieer fn(i) als het maximale resultaat vanaf fase
n vanuit toestand i ∈ Sn
• Recurrente betrekkingen
• Stopcriterium – aan het eind van de planningshorizon ligt alles vast,
d.w.z. fN (i) moet gegeven zijn voor alle i ∈ SN
19
Algemene werkwijze
fN (i) en dN (i) voor alle i ∈ SN
fN-1 (i) en dN-1 (i) voor alle i ∈ SN-1
f0 (i) en d0 (i) voor alle i ∈ S0
f1 (i) en d1 (i) voor alle i ∈ S1
Today on SMOM:
• Newsboy probleem: beslissen onder onzekerheid, een periode
• Meerdere perioden: voorbeeld deterministische DP
• Meerdere perioden: gemiddelde kosten
• Stochastische dynamische programmering: onzekerheid
21 Voorbeeld: stochastische afstand
• Doelstelling – Miminaliseer de verwachte reistijd
22
Verklaring der variabelen • Fasen n
– aantal opeenvolgende momenten waarop beslissingen moeten worden genomen
• Toestandsruimte Sn – verzameling van mogelijke toestanden i die kunnen optreden in
fase n
• Beslissingsruimte Dn (i) – verzameling van mogelijk acties d die beschikbaar zijn bij
toestand i in fase n
• Directe resultaat rn (i,d) – verwachte opbrengst gedurende fase n als gevolg van beslissing
d in toestand i
• Overgang j i,d – toestand j als gevolg van beslissing d bij toestand i in fase n
23
Voorbeeld:
• Distributie systeem met K locaties • pi (n) kans op vraag ter grootte n bij locatie i • i stock-out kosten per eenheid product bij locatie i
• Gevraagd: verdeling R eenheden over de locaties zo dat verwachte stock-out kosten minimaal zijn
• Di vraag locatie i • xi beslisvariabele: aantal eenheden voorraad op locatie i • Zi # eenheden te kort : Zi =max{0, Di - xi }
€
π
24
25
26
27
28
Optimale toewijzing in eerste fase bekend: er zijn 5 eenheden beschikbaar voor K=3 locaties
Optimale beslissing x1(5)=1, met waarde doelfunctie 3.5 Dan 4 eenheden beschikbaar voor fase 2 (locaties 2 en 3) x2(4)=2 x3(2)=2 Dus optimale beslissing x*1=1, x*2=2, x*3=2
Today on SMOM:
• Newsboy probleem: beslissen onder onzekerheid, een periode
• Meerdere perioden: voorbeeld deterministische DP
• Meerdere perioden: gemiddelde kosten
• Stochastische dynamische programmering: onzekerheid
30
Karakteristieken Dynamische Programmering
• Probleem kan worden opgedeeld in fasen • Elke fase is geassocieerd met een aantal toestanden • Actie / beslissing in toestand legt volgende toestand vast • Gegeven huidige toestand mag beslissing voor volgende
fasen niet afhangen van eerdere fasen (principe van optimaliteit, Bellman)
• Er is een recursie die kosten / opbrengst van fasen t, t+1, …, T relateert aan kosten van fasen t+1, …, T
31
€
fn (i) = maxd ∈Dn ( i)
rn (i,d) + pn ( j | i,d) ⋅ fn+1( j)j∈Sn+1
∑
Karakteristieken Dynamische Programmering
• Probleem kan worden opgedeeld in fasen • Elke fase is geassocieerd met een aantal toestanden • Actie / beslissing in toestand legt volgende toestand vast • Gegeven huidige toestand mag beslissing voor volgende
fasen niet afhangen van eerdere fasen (principe van optimaliteit, Bellman)
• Er is een recursie die kosten / opbrengst van fasen t, t+1, …, T relateert aan kosten van fasen t+1, …, T