差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン前のリビジョン | 最新のリビジョン両方とも次のリビジョン | ||
r:mdptoolbox [2018/12/16 16:33] – [マルコフ決定過程の定義に必要なもの] watalu | r:mdptoolbox [2018/12/16 16:34] – [価値反復法] watalu | ||
---|---|---|---|
行 79: | 行 79: | ||
=== 価値反復法 === | === 価値反復法 === | ||
+ | |||
+ | マルコフ決定過程の最適方策を価値反復によって求めるには、次の一行を実行すればよい。 | ||
< | < |