中出 康一/著 -- コロナ社 -- 2019.4 --

所蔵

所蔵は 1 件です。

所蔵館 所蔵場所 資料区分 請求記号 資料コード 所蔵状態 資料の利用
配架日 協力貸出 利用状況 返却予定日 資料取扱 予約数 付録注記 備考
中央 2F 一般図書 /417.1/5117/2019 7111583695 配架図 Digital BookShelf
2019/05/07 可能 利用可   0

Eメールによる郵送複写申込みは、「東京都在住」の登録利用者の方が対象です。

    • 統合検索
      都内図書館の所蔵を
      横断検索します。
      類似資料 AI Shelf
      この資料に類似した資料を
      AIが紹介します。

資料詳細 閉じる

ISBN 4-339-02834-8
ISBN13桁 978-4-339-02834-8
タイトル マルコフ決定過程
タイトルカナ マルコフ ケッテイ カテイ
タイトル関連情報 理論とアルゴリズム
タイトル関連情報読み リロン ト アルゴリズム
著者名 中出 康一 /著
著者名典拠番号

110006548610000

出版地 東京
出版者 コロナ社
出版者カナ コロナシャ
出版年 2019.4
ページ数 8, 190p
大きさ 21cm
シリーズ名 シリーズ情報科学における確率モデル
シリーズ名のルビ等 シリーズ ジョウホウ カガク ニ オケル カクリツ モデル
シリーズ番号 4
シリーズ番号読み 4
価格 ¥2900
内容紹介 一冊でマルコフ決定過程の理論を学べるように、基礎となる動的計画法、確率変数、確率過程と、マルコフ決定過程の各種最適化規範について詳しく解説。近似アルゴリズムと強化学習に関連する事項の基本的な内容も記述する。
書誌・年譜・年表 文献:p186~188
一般件名 マルコフ過程-00567494-ndlsh
一般件名カナ マルコフカテイ-00567494
一般件名 マルコフ過程
一般件名カナ マルコフ カテイ
一般件名典拠番号

510243300000000

分類:都立NDC10版 417.1
資料情報1 『マルコフ決定過程 理論とアルゴリズム』(シリーズ情報科学における確率モデル 4) 中出 康一/著  コロナ社 2019.4(所蔵館:中央  請求記号:/417.1/5117/2019  資料コード:7111583695)
URL https://catalog.library.metro.tokyo.lg.jp/winj/opac/switch-detail.do?lang=ja&bibid=1153330723

目次 閉じる

第1章 マルコフ決定過程の概要
  1.1 ORと確率モデル
  1.2 動的計画法
  1.3 マルコフ決定過程
  1.4 定式化の例
  1.5 マルコフ決定過程の拡張と発展
第2章 マルコフ連鎖と再生過程
  2.1 離散型確率変数
  2.2 連続型確率変数
  2.3 離散時間マルコフ連鎖
  2.4 周期
  2.5 マルコフ連鎖の定常確率と極限確率
  2.6 有限マルコフ連鎖
  2.7 再生過程
  2.8 再生報酬過程
  2.9 マルコフ報酬過程
第3章 有限期間総期待利得マルコフ決定過程
  3.1 有限期間総期待利得問題
  3.2 最適性方程式
  3.3 値反復法
  3.4 数値例
第4章 総割引期待利得マルコフ決定過程
  4.1 無限期間総割引期待利得
  4.2 最適性方程式と理論的性質
  4.3 計算アルゴリズム
第5章 平均利得マルコフ決定過程
  5.1 平均利得
  5.2 平均利得に関する関係式
  5.3 相対値と平均利得
  5.4 総割引期待利得と平均利得の関係
  5.5 マルコフ決定過程の分類
  5.6 計算アルゴリズム(単一連鎖の場合)
  5.7 計算アルゴリズム(多重連鎖の場合)
第6章 セミマルコフ決定過程
  6.1 セミマルコフ決定過程とは
  6.2 総割引期待利得
  6.3 平均利得
  6.4 連続時間マルコフ決定過程(推移間隔が指数分布に従う場合)
第7章 部分観測可能マルコフ決定過程
  7.1 部分観測可能マルコフ決定過程とは
  7.2 信念
  7.3 定式化
  7.4 値関数の線形性
  7.5 ベクトル集合の生成
第8章 マルコフ決定過程の展開
  8.1 近似最適化アルゴリズム
  8.2 強化学習とマルコフ決定過程
  8.3 決定直後の状態を用いた近似アルゴリズム
  8.4 最適政策の性質