資料詳細

[ 和図書 ] 強化学習 ( 機械学習プロフェッショナルシリーズ )

森村哲郎／著 -- 講談社 -- 2019.5 --

所蔵

所蔵は 1 件です。

Eメールによる郵送複写申込みは、「東京都在住」の登録利用者の方が対象です。

ISBN	4-06-515591-2
ISBN13桁	978-4-06-515591-2
タイトル	強化学習
タイトルカナ	キョウカガクシュウ
著者名	森村哲郎／著
著者名典拠番号	110007532280000
出版地	東京
出版者	講談社
出版者カナ	コウダンシャ
出版年	2019.5
ページ数	12, 305p
大きさ	21cm
シリーズ名	機械学習プロフェッショナルシリーズ
シリーズ名のルビ等	キカイガクシュウプロフェッショナルシリーズ
シリーズの編者等	杉山将／編
シリーズの編者等の典拠番号	110005343620000
価格	¥3000
内容紹介	強化学習で必要になる数理を広くカバーしたテキスト。強化学習を扱うのに必須であるマルコフ決定過程や方策モデル、プランニング、探索と活用のトレードオフ、モデルフリー型の強化学習などについて丁寧に解説する。
書誌・年譜・年表	文献:p278～301
一般件名	機械学習-001210569-ndlsh
一般件名カナ	キカイガクシュウ-001210569
一般件名	機械学習
一般件名カナ	キカイガクシュウ
一般件名典拠番号	511957000000000
分類：都立NDC10版	007.13
資料情報1	『強化学習』（機械学習プロフェッショナルシリーズ）　森村哲郎／著　講談社　2019.5（所蔵館：中央　請求記号：/007.1/5747/2019　資料コード：7111736560）
URL	https://catalog.library.metro.tokyo.lg.jp/winj/opac/switch-detail.do?lang=ja&bibid=1153365191

第1章準備: 1.1 強化学習とは; 1.2 マルコフ決定過程と逐次的意思決定問題; 1.3 方策; 1.4 逐次的意思決定問題の定式化
第2章プランニング: 2.1 準備; 2.2 動的計画法; 2.3 動的計画法による解法; 2.4 線形計画法による解法
第3章探索と活用のトレードオフ: 3.1 概要; 3.2 探索と活用のトレードオフ; 3.3 方策モデル
第4章モデルフリー型の強化学習: 4.1 データにもとづく意思決定; 4.2 価値関数の推定; 4.3 方策と行動価値関数の学習; 4.4 収束性; 4.5 アクター・クリティック法
第5章モデルベース型の強化学習: 5.1 問題設定の整理; 5.2 環境推定; 5.3 ブラックボックス生成モデルに対するプランニング; 5.4 オンラインのモデルベース型強化学習
第6章関数近似を用いた強化学習: 6.1 概要; 6.2 価値関数の関数近似; 6.3 方策の関数近似
第7章部分観測マルコフ決定過程: 7.1 部分観測マルコフ決定過程(POMDP)の基礎; 7.2 POMDPのプランニング; 7.3 POMDPの学習
第8章最近の話題: 8.1 分布強化学習; 8.2 深層強化学習
付録A 補足: A.1 証明; A.2 ノルム; A.3 線形計画法; A.4 自然勾配法の補足