森村 哲郎/著 -- 講談社 -- 2019.5 --

所蔵

所蔵は 1 件です。

所蔵館 所蔵場所 資料区分 請求記号 資料コード 所蔵状態 資料の利用
配架日 協力貸出 利用状況 返却予定日 資料取扱 予約数 付録注記 備考
中央 2F 一般図書 /007.1/5747/2019 7111736560 配架図 Digital BookShelf
2019/06/21 可能 利用可   0

Eメールによる郵送複写申込みは、「東京都在住」の登録利用者の方が対象です。

    • 統合検索
      都内図書館の所蔵を
      横断検索します。
      類似資料 AI Shelf
      この資料に類似した資料を
      AIが紹介します。

資料詳細 閉じる

ISBN 4-06-515591-2
ISBN13桁 978-4-06-515591-2
タイトル 強化学習
タイトルカナ キョウカ ガクシュウ
著者名 森村 哲郎 /著
著者名典拠番号

110007532280000

出版地 東京
出版者 講談社
出版者カナ コウダンシャ
出版年 2019.5
ページ数 12, 305p
大きさ 21cm
シリーズ名 機械学習プロフェッショナルシリーズ
シリーズ名のルビ等 キカイ ガクシュウ プロフェッショナル シリーズ
シリーズの編者等 杉山 将/編
シリーズの編者等の典拠番号

110005343620000

価格 ¥3000
内容紹介 強化学習で必要になる数理を広くカバーしたテキスト。強化学習を扱うのに必須であるマルコフ決定過程や方策モデル、プランニング、探索と活用のトレードオフ、モデルフリー型の強化学習などについて丁寧に解説する。
書誌・年譜・年表 文献:p278~301
一般件名 機械学習-001210569-ndlsh
一般件名カナ キカイ ガクシュウ-001210569
一般件名 機械学習
一般件名カナ キカイ ガクシュウ
一般件名典拠番号

511957000000000

分類:都立NDC10版 007.13
資料情報1 『強化学習』(機械学習プロフェッショナルシリーズ) 森村 哲郎/著  講談社 2019.5(所蔵館:中央  請求記号:/007.1/5747/2019  資料コード:7111736560)
URL https://catalog.library.metro.tokyo.lg.jp/winj/opac/switch-detail.do?lang=ja&bibid=1153365191

目次 閉じる

第1章 準備
  1.1 強化学習とは
  1.2 マルコフ決定過程と逐次的意思決定問題
  1.3 方策
  1.4 逐次的意思決定問題の定式化
第2章 プランニング
  2.1 準備
  2.2 動的計画法
  2.3 動的計画法による解法
  2.4 線形計画法による解法
第3章 探索と活用のトレードオフ
  3.1 概要
  3.2 探索と活用のトレードオフ
  3.3 方策モデル
第4章 モデルフリー型の強化学習
  4.1 データにもとづく意思決定
  4.2 価値関数の推定
  4.3 方策と行動価値関数の学習
  4.4 収束性
  4.5 アクター・クリティック法
第5章 モデルベース型の強化学習
  5.1 問題設定の整理
  5.2 環境推定
  5.3 ブラックボックス生成モデルに対するプランニング
  5.4 オンラインのモデルベース型強化学習
第6章 関数近似を用いた強化学習
  6.1 概要
  6.2 価値関数の関数近似
  6.3 方策の関数近似
第7章 部分観測マルコフ決定過程
  7.1 部分観測マルコフ決定過程(POMDP)の基礎
  7.2 POMDPのプランニング
  7.3 POMDPの学習
第8章 最近の話題
  8.1 分布強化学習
  8.2 深層強化学習
付録A 補足
  A.1 証明
  A.2 ノルム
  A.3 線形計画法
  A.4 自然勾配法の補足