Skip links

オンライン開催『ゼロから作る Deep Learning 4 – 強化学習編』無料読書会#3

注目の良書を取り上げAI/機械学習の知識や実装力を高める無料オンライン勉強会。人気シリーズの第4弾で強化学習をテーマにした『ゼロから作るDeep Learning ❹』を取り上げています。

当勉強会では書籍の内容を確認しながらポイントごとに立ち止まり意見を交換。インタラクティブに理解を深める1時間です。

9月29日(木)は3章からスタートします。

3章 ベルマン方程式
3.1 ベルマン方程式の導出
3.1.1 確率と期待値(ベルマン方程式のための下準備)
3.1.2 ベルマン方程式の導出
3.2 ベルマン方程式の例
3.2.1 2マスのグリッドワールド
3.2.2 ベルマン方程式の意義
3.3 行動価値関数とベルマン方程式
3.3.1 行動価値関数
3.3.2 行動価値関数を使ったベルマン方程式
3.4 ベルマン最適方程式
3.4.1 状態価値関数におけるベルマン最適方程式
3.4.2 Q関数におけるベルマン最適方程式
3.5 ベルマン最適方程式の例
3.5.1 ベルマン最適方程式の適用
3.5.2 最適方策を得る
3.6 まとめ

(著:斎藤 康毅,『ゼロから作るDeep Learning ❹』,目次より引用, 2022年04月, 発行元:O’Reilly Japan, Inc., ISBN:978-4-87311-975-5)

学習共有サービス「Leranavi」やe-Learningサービス「Leranaviオンライン」、無料読書会参加者同士の質問・情報交換用Slackチャンネルも併せてご活用いただけます。今回も書籍の選定から当勉強会のSlackワークスペースにて行いました。

ご質問・ご相談はconnpassまたはソレイユデータ道場の申し込みフォームよりお気軽にお問い合わせください。

書籍はご自身で入手のうえ、ご参加ください。

書籍情報

ゼロから作るDeep Learning ❹


斎藤 康毅 著 

🍪 This website uses cookies to improve your web experience.