Post on 03-Aug-2015
INSTITUTO TECNOLÓGICO SUPERIOR
DE CALKINI EN EL ESTADO DE CAMPECHE
INGENIERÍA INDUSTRIAL
VII SEMESTRE GRUPO “B”
ALUMNO:WILLIAM HUMBERTO CAAMAL EK
MAESTRO:ING. RICARDO GOMEZ KU
MATERIA:INVESTIGACION DE OPERACIONES II
MATRICULA: “1734”
CALIFICACION DE LA EXPOSICION:
CALIFICACION DE LA INVESTIGACION DOCUMENTAL:
CALKINI, CAMPECHE A 9 DE SEPTIEMBRE DEL 2010
Página 1
INDICE
Introducción……………………………………………………………….. 3
Contenido de la PDP………………………………………………………… 4-9
Conclusión……………………………………………………………………….. 10
Fuentes bibliograficas……………………………………………………………11
Página 2
INTRODUCCION
La PROGRAMACION DINÁMICA es una herramienta que es muy útil para
poder resolver problemas de nodos, de inversión, de inventario estos ejercicios
son útiles para nosotros como futuros ingenieros industriales, para tomar la
mejor decisión que nos lleve a reducir gastos de transporte, de insumos y
mejorar los procesos productivos de nuestra empresa.
La programación dinámica se subdivide en la deterministica y la probabilística,
en este documental se hablara de la segunda que es La programación
dinámica probabilística difiere de la programación dinámica determinística en
que el estado de la etapa siguiente no queda completamente determinado por
el estado y la decisión de la política en el estado actual. En lugar de ello existe
una distribución de probabilidad para lo que será el estado siguiente. Sin
embargo, esta distribución de probabilidad todavía esta completamente
determinada por el estado y la decisión de la política del estado actual.
La programación dinámica sirve para resolver problemas en los que el costo
del periodo actual o el estado del siguiente periodo son aleatorios. A estos
problemas se les conoce como problemas de programación dinámica
probabilística (PDP). En una PDP, por lo general el objetivo de quien toma la
decisión es minimizar el costo esperado en que se incurre o maximizar la
recompensa esperada obtenida en un determinado horizonte de tiempo.
Página 3
PROGRAMACION DINÁMICA PROBABILISITCA (PDP)
En este capitulo se explica como usar la programación dinámica para resolver problemas en los que el costo del periodo actual o el estado del siguiente periodo son aleatorios. A estos problemas se les conoce como problemas de programación dinámica probabilística (PDP). En una PDP, por lo general el objetivo de quien toma la decisión es minimizar el costo esperado en que se incurre o maximizar la recompensa esperada obtenida en un determinado horizonte de tiempo.
La programación dinámica probabilística difiere de la deterministica en que los estados y los retornos o retribuciones en cada etapa son probabilísticos. La programación dinámica probabilística se origina en especial en el tratamiento de modelos estocásticos de inventario y en los procesos markovianos de decisión.
UN JUEGO ALEATORIO En una variación del juego de la ruleta rusa, se hace girar una rueda con marcas de n números consecutivos: 1 a n, en su periferia. La probabilidad de que la rueda se detenga en el número i después de un giro es pi. Un jugador paga $x por el privilegio de hacer girar la rueda un máximo de m giros. La recompensa para el jugador es doble de la cantidad obtenida en el último giro. Suponiendo que el juego se repite (hasta con m giros cada vez) una cantidad razonablemente grande de veces, propone una estrategia optima para el jugador.Se puede formular el problema como un modelo de programación dinámica con las siguientes definiciones:
1. la etapa i se representa con el giro i, i = 1, 2,…., m.2. las alternativas en cada etapa incluye hacer girar la rueda una vez más o
terminar el juego.3. El estado j del sistema en la etapa i se representa con uno delos números de
1 a n que se haya obtenido en el ultimo giro.
Sea fi(j) = ingreso máximo esperado cuando el juego esta en la etapa (el giro) i y el resultado del ultimo giro fue j.En este caso se tiene que
(Recompensa esperada en la etapa i si termina el juego
dado el resultado j del ultimo giro.) = si continua el juego
Entonces, la ecuación recursiva se puede describir como sigue:
Página 4
La lógica de la ecuación recursiva es que en el primer giro (i = 1), el estado del sistema es j = 0, por que acaba de comenzar el juego. En consecuencia, f1(0) = p1f2(1) + p2f2(2) + … + Pnf2(n). Después del ultimo giro (i = m), el juego debe terminar independientemente del resultado de j del m-esimo giro. Por tanto, fm+1(j) = 2j.Los cálculos recursivos comienzan con fm+1 y terminan con f1(0),produciendo m+1 etapas de cómputo. Como f1(0) es el ingreso esperados por los m giros, y dado que el juego cuesta $x, el ingreso neto es f1(0) – x.
EjemploSuponga que el perímetro de la rueda de la ruleta rusa esta marcado con los números 1 a 5. La probabilidad de detenerse en el numero i es p1 = 0.3, p2 = 0.25, p3 = 0.2, p4 = 0.15 Y p5 = 0.1.El jugador paga $5 para hacer un máximo de cuatro giros. Determine la estrategia óptima para cada uno de los cuatro giros, y el ingreso neto esperado correspondiente.Etapa 5 f5(j) = 2j
Etapa 4
F4 (j) = máx. {2j, p1f5 (1) + p2f5 (2) + p3f5 (3) + p4f5 (4) + p5f5 (5)} = máx. {2j, 0.3 X 2 + 0.25 X 4 + 0.2 X 6 +0.15 X 8 + 0.1 X 10} = máx. {2j, 5}
Ingreso esperado
Solución óptimaResultado j del giro 3 Terminar Girar F4 (j) Desición
1 2 5 5 Girar
Página 5
2 4 5 5 Girar3 6 5 6 Terminar4 8 5 8 Terminar5 10 5 10 Terminar
Etapa 3
F3 (j) = máx. {2j, p1f4 (1) + p2f4 (2) + p3f4 (3) + p4f4 (4) + p5f4 (5)} = máx. {2j, 0.3 X 5 + 0.25 X 5 + 0.2 X 6 +0.15 X 8 + 0.1 X 10} = máx. {2j, 6.15}
Ingreso esperado
Solución óptimaResultado j del giro 2 Terminar Girar F3(j) Desición
1 2 6.15 6.15 Girar2 4 6.15 6.15 Girar3 6 6.15 6.15 Girar4 8 6.15 8.00 Terminar5 10 6.15 10.00 Terminar
Etapa 2
F2 (j) = máx. {2j, p1f3 (1) + p2f3 (2) + p3f3 (3) + p4f3 (4) + p5f3 (5)} = máx. {2j, 0.3 X 6.15 + 0.25 X 6.15 + 0.2 X 6.15 +0.15 X 8 + 0.1 X 10} = máx. {2j, 6.8125}
Ingreso esperado
Solución óptimaResultado j del giro 1 Terminar Girar F3(j) Desición
1 2 6.8125 6.8125 Girar2 4 6.8125 6.8125 Girar3 6 6.8125 6.8125 Girar4 8 6.8125 8.0000 Terminar5 10 6.8125 10.0000 Terminar
Etapa 1
F1 (0) = p1f2 (1) + p2f2 (2) + p3f2 (3) + p4f2 (4) + p5f2 (5) = 0.3 X 6.8125 + 0.25 X 6.8125 + 0.2 X 6.8125 +0.15 X 8 + 0.1 X 10 = 7.31
Página 6
La única opción disponible al iniciar el juego es girar.De acuerdo con los cuadros anteriores, la solución óptima es:
Giro núm. Estrategia óptima1 Comienza el juego, girar2 Continuar si el giro 1 produce 1, 2 ó 3. Si no, terminar el juego3 Continuar si el giro 2 produce 1, 2 ó 3. Si no, terminar el juego4 Continuar si el giro 3 produce 1, 2 ó 3. Si no, terminar el juego Ingreso neto esperado = $7.31 - $5.00 = $2.31
sea
fondos esperados máximos para los años i, i+1, … y n, dada xi al
comenzar el año iPara la condición k del mercado,
Como la condición del mercado k se presenta con la probabilidad Pk, la ecuación recursiva de programación dinámica es la siguiente:
En donde porque después del año n no se hace inversión. Por lo
anterior
Sea
Entonces se obtiene
Ejemplo 15.2-1En este modelo de inversión, hay que suponer que se desea invertir 10 000 durante los 4 años veniders. Hay 50% de probabilidades de que el dinero aumente el doble, 20% de probabilidades de salir a mano y 30% de probabilidades de perder la cantidad invertida. Proponer una estrategia optima de inversión.Al usar la notación de modelo se tiene que
Página 7
C= 10000 n= 4 m=3P1=0.4 P2=0.2 P3=0.4R1=1 R2=0 R3=-1
ETAPA 4
Entonces
La solución optima se resume como sigue:
Estado
X4 1.2 X3
ETAPA 3
=1.44 x3Asi se llega a
Estado
X3 1.44 x3 x3
ETAPA 2
=1.728 X2Entonces se obtiene
Estado
X2 1.728 x2 x2
ETAPA 1
Página 8
=2.0736x1 Y así se obtiene
Entonces, la política optima de inversión se puede resumir: como sigue
para i = 1 a 4, la solución optima es invertir todos los fondos
disponibles al iniciar cada año. Los fondos acumulados al final de 4 años son 2.0736x1 = 2.0736 ($10,000) = $20,736.En realidad, se puede demostrar por inducción que el problema tiene la
siguiente solución general en la etapa
CONJUNTO DE PROBLEMAS 15.2ª
1. En el ejemplo 15.2-1, determine la estrategia optima de inversión,
suponiendo que las probabilidades y el ingreso varían durante los 4
años, de acuerdo con los datos siguientes:
Año r1 r2 r3 P1 P1 P3
1 2 1 0.5 0.1 0.4 0.52 1 0 -1 0.4 0.4 0.23 4 -1 -1 0.2 0.4 0.44 0.8 0.4 0.2 0.6 0.2 0.2
2. Está disponible un compartimiento de 10 m3 para guardar tres artículos. Los volúmenes necesarios para guardar una unidad de los artículos 1,2 y 3 son 2, 1 y 3 m3, respectivamente. La demanda probabilística de los artículos es la siguiente:
Probabilidad de la demandaNúm. De unidades
Art. 1 Art. 2 Art
1 0.5 0.3 0.32 0.5 0.4 0.23 0.0 0.2 0.5
Página 9
4 0.0 0.1 0.0
Los costos de escasez por unidad de los artículos 1, 2 y 3 son $8, $10 y $5, respectivamente.¿Cuántas unidades de cada artículo se deben de guardar en el compartimiento?
CONCLUSION
La programación dinámica es una técnica matemática que a menudo resulta
útil a tomar una sucesión de decisiones interrelacionadas. Proporciona un
procedimiento sistemático para determinar la combinación de decisiones que
maximice la efectividad global.
Contrastando con la programación lineal, no existe un planteamiento
matemático estándar "del" problema de programación dinámica. Más bien, la
programación dinámica es un tipo general de enfoque para resolver problemas
y las ecuaciones particulares usadas deben desarrollarse para que se ajusten a
cada situación individual. Por lo tanto, se requiere un cierto grado de ingenio y
de visión de la estructura general de los problemas de programación dinámica,
a fin de reconocer cuando un problema se puede resolver mediante los
procedimientos de esta programación y cómo se haría. Probablemente se
puedan desarrollar mejor estas aptitudes por medio de una exposición de una
amplia variedad de aplicaciones de la programación dinámica y de un estudio
de las características que son comunes a todas estas.
Por fortuna, la programación dinámica suministra una solución con mucho
menos esfuerzo que la enumeración exhaustiva. (Los ahorros de cálculo serían
enormes para versiones más grandes de un problema.) La programación
dinámica parte de una pequeña porción del problema y encuentra la solución
óptima para este problema más pequeño.
Entonces gradualmente agranda el problema, hallando la solución óptima en
curso a partir de la anterior, hasta que se resuelve por completo el problema
original. En seguida se dan los detalles involucrados en la implementación de
esta filosofía general.
Página 10
FUENTES BIBLIOGRAFICAS
Cap. 1.4 programación dinámica probabilística
Cap. 15 pág. 547 al 553Inv. de operaciones 7 ediciónHamdy a. taha
Capitulo 19 pág. 1016 al 1019 Investigación de operaciones
Página 11