注目の良書を取り上げAI/機械学習の知識や実装力を高める無料オンライン勉強会。人気シリーズの第4弾で強化学習をテーマにした『ゼロから作るDeep Learning ❹』を取り上げています。
当勉強会では書籍の内容を確認しながらポイントごとに立ち止まり意見を交換。インタラクティブに理解を深める1時間です。
10月13日(木)は5章「モンテカルロ法」からスタートします。
5章 モンテカルロ法
(著:斎藤 康毅,『ゼロから作るDeep Learning ❹』,目次より引用, 2022年04月, 発行元:O’Reilly Japan, Inc., ISBN:978-4-87311-975-5)
5.1 モンテカルロ法の基礎
5.1.1 サイコロの目の和
5.1.2 分布モデルとサンプルモデル
5.1.3 モンテカルロ法の実装
5.2 モンテカルロ法による方策評価
5.2.1 価値関数をモンテカルロ法で求める
5.2.2 すべての状態の価値関数を求める
5.2.3 モンテカルロ法の効率の良い実装
5.3 モンテカルロ法の実装
5.3.1 stepメソッド
5.3.2 エージェントクラスの実装
5.3.3 モンテカルロ法を動かす
5.4 モンテカルロ法による方策制御
5.4.1 評価と改善
5.4.2 モンテカルロ法を使った方策制御の実装
5.4.3 ε-greedy法(1つ目の修正)
5.4.4 固定値α方式へ(2つ目の修正)
5.4.5 [修正版]モンテカルロ法を使った方策反復法の実装
5.5 方策オフ型と重点サンプリング
5.5.1 方策オン型とオフ型
5.5.2 重点サンプリング
5.5.3 分散を小さくするには
5.6 まとめ
学習共有サービス「Leranavi」やe-Learningサービス「Leranaviオンライン」、無料読書会参加者同士の質問・情報交換用Slackチャンネルも併せてご活用いただけます。今回も書籍の選定から当勉強会のSlackワークスペースにて行いました。
ご質問・ご相談はconnpassまたはソレイユデータ道場の申し込みフォームよりお気軽にお問い合わせください。
書籍はご自身で入手のうえ、ご参加ください。
書籍情報

ゼロから作るDeep Learning ❹
斎藤 康毅 著