|
In una catena di Markov con probabilità pij e guadagni rij il guadagno medio per transizione g soddisfa le equazioni:
in cui una delle incognite aj può essere fissata arbitrariamente. Se la politica di decisione è la dII le probabilità e i guadagni sono i seguenti:
per cui il sistema (1) diventa g + a1 = 0.6 (1 + a1) + 0.4 (2 + a2) g + a2 = 0.4 (1 + a1) + 0.6 (3 + a2) che può essere risolto fissando, ad esempio, a2=0 . La soluzione è allora a1 = -1 e gII = 1.8 Se la politica di decisione è invece la dIII abbiamo
e il sistema (1) è: g + a1 = 0.2 (5 + a1) + 0.8 (4 + a2) g + a2 = 0.1 (4 + a1) + 0.9 (3 + a2) che ammette la soluzione : a1 = 1.1/0.9; a2 = 0; gIII = 3.2 Per confronto diretto (gIII > gII) segue quindi che la politica di decisione dIII è preferibile alla dII. In questo caso specifico si poteva tuttavia pervenire a questo risultato notando che tutti gli elementi della matrice RIII sono non inferiori a quelli della matrice RII per cui a fortiori deve essere gIII ³ gII.
|
ESERCIZIO PRECEDENTE | ESERCIZIO SUCCESSIVO |