Skip links

オンライン開催『ゼロから作る Deep Learning 4 – 強化学習編』無料読書会#2

注目の良書を取り上げAI/機械学習の知識や実装力を高める無料オンライン勉強会。今年4月に発行された『ゼロから作るDeep Learning ❹』を取り上げています。

当勉強会では書籍の内容を確認しながらポイントごとに立ち止まり意見を交換。インタラクティブに理解を深める1時間です。

9月22日(木)は2章を見ていきます。

2章 マルコフ決定過程
2.1 MDPとは
2.1.1 MDPの具体例
2.1.2 エージェントと環境のやりとり
2.2 環境とエージェントの定式化
2.2.1 状態遷移
2.2.2 報酬関数
2.2.3 エージェントの方策
2.3 MDPの目標
2.3.1 エピソードタスクと連続タスク
2.3.2 収益
2.3.3 状態価値関数
2.3.4 最適方策と最適価値関数
2.4 MDPの例
2.4.1 バックアップ線図
2.4.2 最適方策を見つける
2.5 まとめ

(著:斎藤 康毅,『ゼロから作るDeep Learning ❹』,目次より引用, 2022年04月, 発行元:O’Reilly Japan, Inc., ISBN:978-4-87311-975-5)

学習共有サービス「Leranavi」やe-Learningサービス「Leranaviオンライン」、無料読書会参加者同士の質問・情報交換用Slackチャンネルも併せてご活用いただけます。今回も書籍の選定から当勉強会のSlackワークスペースにて行いました。

ご質問・ご相談はconnpassまたはソレイユデータ道場の申し込みフォームよりお気軽にお問い合わせください。

書籍はご自身で入手のうえ、ご参加ください。

書籍情報

ゼロから作るDeep Learning ❹


斎藤 康毅 著 

🍪 This website uses cookies to improve your web experience.