Processos de Decisão de Markov: um tutorial

Authors

  • Jerônimo Pellegrini Instituto de Computação, Unicamp
  • Jacques Wainer Instituto de Computação, Unicamp

DOI:

https://doi.org/10.22456/2175-2745.5694

Abstract

Há situações em que decisões devem ser tomadas em seqüência, e o resultado de cada decisão não é claro para o tomador de decisões. Estas situações podem ser formuladas matematicamente como processos de decisão de Markov, e dadas as probabilidades dos valores resultantes das decisões, é possível determinar uma política que maximize o valor esperado da seqüência de decisões. Este tutorial descreve os processos de decisão de Markov (tanto o caso completamente observável como o parcialmente observável) e discute brevemente alguns métodos para a sua solução. Processos semi-Markovianos não são discutidos.

Downloads

Download data is not yet available.

Published

2007-12-20

How to Cite

Pellegrini, J., & Wainer, J. (2007). Processos de Decisão de Markov: um tutorial. Revista De Informática Teórica E Aplicada, 14(2), 133–179. https://doi.org/10.22456/2175-2745.5694

Issue

Section

Tutoriais