Skip links

オンライン開催『Vision Transformer入門』無料読書会#10

注目の良書を題材に、AI/機械学習の知識や実装力を高める無料オンライン勉強会。現在取り上げているのは『Vision Transformer入門』です。

自然言語処理分野におけるブレイクスルーとなったTransformerをコンピュータビジョンに応用したモデルViTに興味のある方、画像認識モデルの理解・Pythonによる実装力を高めて業務や研究に活用したい社会人・学生・研究者の方など、ぜひご参加ください。

当勉強会では、書籍の内容を確認しながらポイントごとに立ち止まり、意見を交換。インタラクティブに理解を深める1時間です。

4月5日(水)20時からは第7章の4「Layer Normalizationの謎」からスタートします。

第7章 Transformerの謎を読み解く
7-1 Transformerの謎に人々は驚き困惑した
7-2 Positional embeddingの謎
7-3 Multi-head Attentionの謎
7-4 Layer Normalizationの謎
第8章 Vision Transformerの謎を読み解く
8-1 ViT vs CNN vs MLPの三国時代の到来
8-2 ViTはCNNと同じく局所特徴を学習する
8-3 ViTはより形状に反応する?
8-4 ViTは早期から大域的な領域も見ている
8-5 ViTはCNNやMLPよりもノイズや敵対的攻撃に頑健?
8-6 3つのモデルの特性と使い分けの勘どころ
8-7 ViTの新常識

(片岡裕雄 監修,山本晋太郎,徳永匡臣,箕浦大晃,邱玥(QIU YUE),品川政太朗 著,『Vision Transformer入門 Computer Vision Library』,目次より引用, 2022年9月, 発行元:技術評論社, ISBN:978-4-297-13058-9)

無料読書会参加者同士の質問・情報交換用Slackチャンネルも併せてご活用いただけます。今回も書籍の選定から当勉強会のSlackワークスペースにて行いました。

ご質問・ご相談・参加のお申込は、connpassまたはソレイユデータ道場のフォームよりお気軽にお問い合わせください。

書籍はご自身で入手のうえ、ご参加ください。

書籍情報

Vision Transformer入門 Computer Vision Library


片岡裕雄 監修,山本晋太郎,徳永匡臣,箕浦大晃,邱玥(QIU YUE),品川政太朗 著 

🍪 This website uses cookies to improve your web experience.