本多 淳也/著 -- 講談社 -- 2016.8 --

所蔵

所蔵は 1 件です。

所蔵館 所蔵場所 資料区分 請求記号 資料コード 所蔵状態 資料の利用
配架日 協力貸出 利用状況 返却予定日 資料取扱 予約数 付録注記 備考
中央 書庫 一般図書 /007.1/5490/2016 7107905587 Digital BookShelf
2016/09/20 可能 利用可   0
Eメールによる郵送複写申込みは、「東京都在住」の登録利用者の方が対象です。

資料詳細 閉じる

ISBN 4-06-152917-5
ISBN13桁 978-4-06-152917-5
タイトル バンディット問題の理論とアルゴリズム
タイトルカナ バンディット モンダイ ノ リロン ト アルゴリズム
著者名 本多 淳也 /著, 中村 篤祥 /著
著者名典拠番号

110007050550000 , 110006383260000

出版地 東京
出版者 講談社
出版者カナ コウダンシャ
出版年 2016.8
ページ数 10, 206p
大きさ 21cm
シリーズ名 機械学習プロフェッショナルシリーズ
シリーズ名のルビ等 キカイ ガクシュウ プロフェッショナル シリーズ
シリーズの編者等 杉山 将/編
シリーズの編者等の典拠番号

110005343620000

価格 ¥2800
内容紹介 バンディット問題のさまざまな方策が、定量的かつ直感的に理解できる! 最適腕識別や連続腕バンディットはもちろんのこと、モンテカルロ木探索やインターネット広告などのより具体的な状況への対応も紹介する。
書誌・年譜・年表 文献:p195~202
一般件名 確率論-ndlsh-00564753,数理統計学-00571746-ndlsh
一般件名カナ カクリツロン-00564753,スウリトウケイガク-00571746
一般件名 機械学習 , アルゴリズム
一般件名カナ キカイ ガクシュウ,アルゴリズム
一般件名典拠番号

511957000000000 , 510093100000000

分類:都立NDC10版 007.13
資料情報1 『バンディット問題の理論とアルゴリズム』(機械学習プロフェッショナルシリーズ) 本多 淳也/著, 中村 篤祥/著  講談社 2016.8(所蔵館:中央  請求記号:/007.1/5490/2016  資料コード:7107905587)
URL https://catalog.library.metro.tokyo.lg.jp/winj/opac/switch-detail.do?lang=ja&bibid=1152868935

目次 閉じる

第1章 バンディット問題とは
  1.1 はじめに
  1.2 バンディット問題の例
  1.3 確率的バンディットと敵対的バンディット
  1.4 プレイヤー方策の評価法
  1.5 バンディット問題の歴史
  1.6 関連分野
  1.7 本書の構成
第2章 確率的バンディット問題の基礎知識
  2.1 中心極限定理による確率近似
  2.2 裾確率の評価
  2.3 大偏差原理
第3章 確率的バンディット問題の方策
  3.1 定式化
  3.2 理論限界
  3.3 ε-貪欲法
  3.4 尤度に基づく方策
  3.5 確率一致法とトンプソン抽出
  3.6 最悪時の評価
第4章 確率的バンディット問題のリグレット解析
  4.1 リグレットの分解
  4.2 累積分布関数と期待値
  4.3 UCB方策の性能解析
  4.4 トンプソン抽出の性能解析
第5章 敵対的バンディット問題
  5.1 問題設定
  5.2 オンライン学習理論とHedgeアルゴリズム
  5.3 Exp3方策
  5.4 Exp3.P方策
  5.5 敵対的多腕バンディット問題のリグレット下界
  5.6 最適オーダーの方策
第6章 最適腕識別とA/Bテスト
  6.1 定式化
  6.2 標本複雑度
  6.3 最適腕識別の方策
  6.4 固定予算の設定
第7章 線形モデル上のバンディット問題
  7.1 線形バンディット
  7.2 文脈付きバンディット
  7.3 LinUCB方策
  7.4 線形モデル上のトンプソン抽出
  7.5 ロジスティック回帰モデル上のバンディット
第8章 連続腕バンディットとベイズ最適化
  8.1 定式化と観測モデル
  8.2 リグレットの設定
  8.3 期待値関数のクラス
  8.4 連続腕バンディットの方策
  8.5 共分散関数のパラメータ推定
第9章 バンディット問題の拡張
  9.1 時間変化のあるバンディット問題
  9.2 比較バンディット
  9.3 部分観測問題
  9.4 その他の拡張
第10章 バンディット手法の応用
  10.1 モンテカルロ木探索
  10.2 インターネット広告
  10.3 推薦システム
付録A 逆行列の更新
付録B ベータ分布の裾確率