Mykel J.Kochenderfer/著 -- コッヘンダーファー M.J. -- 朝倉書店 -- 2025.11 -- 417

所蔵

※「帯出区分」が「貸出禁止」のものは貸出・予約はできません。館内での閲覧のみが可能です。

※「状態」 が「在架」 のものは予約はできません。来館して貸出手続きを行ってください。

※奄美図書館からの取り寄せは、以下のいずれかの方法により申請してください。

  ・窓口(来館)  ・FAX

  ・郵送     ・電子申請

 詳しくは 「県立奄美図書館資料の取り寄せについて」をご覧ください。

所蔵は 1 件です。現在の予約件数は 0 件です。

所蔵館 所蔵場所 請求記号 資料コード 資料区分 帯出区分 状態
県図一般 2階閲覧室 417/コ025 /1 0116375130 一般図書   在架

館別所蔵

館名 所蔵数 貸出中数 貸出可能数
県図一般 1 0 1

資料詳細

タイトル 意思決定のためのアルゴリズム 1
書名カナ イシ ケッテイ ノ タメ ノ アルゴリズム
著者 Mykel J.Kochenderfer /著, Tim A.Wheeler /著, Kyle H.Wray /著, 林田 智弘 /訳, 西崎 一郎 /訳  
著者カナ コッヘンダーファー M.J.
出版地 東京
出版者 朝倉書店
出版者カナ アサクラ ショテン
出版年 2025.11
ページ数 8,216,26p
大きさ 26cm
巻の書名 確率的推論と逐次意思決定の基礎
巻の書名カナ カクリツテキ スイロン ト チクジ イシ ケッテイ ノ キソ
一般件名 意思決定 , アルゴリズム
内容紹介 意思決定に関連する様々な話題を取り上げ、基礎となる数理計画問題の定式化と、それを解くためのアルゴリズムを図や例を交えて紹介する。演習問題も掲載。1は、確率的推論、逐次的問題を取り上げる。
NDC分類(9版) 417
ISBN 4-254-12309-8
ISBN13桁 978-4-254-12309-8
定価 ¥6300

目次

1 序章
  1.1 意思決定
  1.2 アプリケーション
  1.3 手法
  1.4 歴史
  1.5 社会的な影響
  1.6 概略
第Ⅰ部 確率的推論
2 表現
  2.1 信念度と確率
  2.2 確率分布
  2.3 同時分布
  2.4 条件付き分布
  2.5 ベイズネットワーク
  2.6 条件付き独立性
  2.7 要約
  2.8 演習
3 推論
  3.1 ベイズネットワークにおける推論
  3.2 単純ベイズモデルにおける推論
  3.3 和積変数除去
  3.4 信念伝播
  3.5 計算複雑性
  3.6 直接サンプリング
  3.7 尤度重み付きサンプリング
  3.8 ギブスサンプリング
  3.9 ガウスモデルにおける推論
4 パラメータ学習
  4.1 最尤パラメータ学習
  4.2 ベイズパラメータ学習
  4.3 ノンパラメトリック学習
  4.4 データ欠測がある場合の学習
  4.5 要約
  4.6 演習
5 構造学習
  5.1 ベイズネットワークの評価
  5.2 有向グラフ探索
  5.3 マルコフ等価クラス
  5.4 部分有向グラフ探索
  5.5 要約
  5.6 演習
6 単純な意思決定
  6.1 合理的な選好に関する制約
  6.2 効用関数
  6.3 効用導出
  6.4 期待効用最大化原理
  6.5 意思決定ネットワーク
  6.6 情報の価値
  6.7 非合理性
  6.8 要約
  6.9 演習
第Ⅱ部 逐次的問題
7 厳密解法
  7.1 マルコフ決定過程
  7.2 方策評価
  7.3 価値関数方策
  7.4 方策反復
  7.5 価値反復
  7.6 非同期価値反復
  7.7 線形計画の定式化
  7.8 二次関数型報酬をもつ線形システム
  7.9 要約
8 近似価値関数
  8.1 パラメトリック表現
  8.2 最近傍
  8.3 カーネル平滑化
  8.4 線形補完
  8.5 シンプレックス補完
  8.6 線形回帰
  8.7 ニューラルネットワーク回帰
  8.8 要約
  8.9 演習
9 オンライン計画
  9.1 後退時間区間計画
  9.2 ロールアウトによる先読み
  9.3 前方探索
  9.4 分枝限定法
  9.5 スパースサンプリング
  9.6 モンテカルロツリー探索
  9.7 ヒューリスティック探索
  9.8 ラベル付きヒューリスティック探索
  9.9 開ループ計画
10 方策探索
  10.1 方策評価近似
  10.2 局所探索
  10.3 遺伝的アルゴリズム
  10.4 交差エントロピー法
  10.5 進化戦略
  10.6 等方性進化戦略
  10.7 要約
  10.8 演習
11 方策勾配推定
  11.1 有限差分
  11.2 回帰勾配
  11.3 尤度比
  11.4 未来報酬
  11.5 基準値減算
  11.6 要約
  11.7 演習
12 方策勾配最適化
  12.1 勾配上昇更新
  12.2 制限された勾配更新
  12.3 自然勾配更新
  12.4 信頼領域の更新
  12.5 クランプされた代理目的
  12.6 要約
  12.7 演習
13 アクター・クリティック法
  13.1 アクター・クリティック
  13.2 一般化アドバンテージ推定
  13.3 決定論的方策勾配
  13.4 モンテカルロツリー探索を用いたアクター・クリティック
  13.5 要約
  13.6 演習
14 方策検証
  14.1 パフォーマンス指標の評価
  14.2 希少事象に対するシミュレーション
  14.3 ロバスト性分析
  14.4 トレード分析
  14.5 敵対的分析
  14.6 要約
  14.7 演習