Parco1021さん

フォロー

情報学部大学生のだらだら日記

https://parco1021.hatenablog.com

勉強中の技術的なことを書いたり日記的なことを書いたりします。php(laravel)、Python、機械学習、Webアプリ

av_timerブログ村参加: 2019/10/24

本日のランキング詳細

新着記事新着画像参加テーマ過去記事

SGDを使うにあたってのハイパーパラメータの設定(論文紹介③ Control Batch Size and Learning Rate to Generalize Well: Theoretical and Empirical Evidence)

概要深層学習において、確率的勾配降下法(SGD)はOptimizerとして良い結果を出しており、SGDをより良く動かすためにハイパーパラメータの調整が必要。複数あるハイパーパラメータのうち、特にバッチサイズ(Batch Size)と学習率(Learning Rate)に着目し、どのように設定すべきかを解析的に考えた論文。数値解析の結果、バッチサイズの大きさSと学習率ηの比S/ηが小さいほどより良い結果となる。 papers.nips.cc 予測損失と経験損失本来最小化したい損失は予測損失である。しかし、データの分布Dがわからないため予測損失と近似することのできる経験損失を用意する。でき…

2020/10/01 18:55

新着記事新着画像参加テーマ過去記事

「ブログリーダー」を活用して、Parco1021さんをフォローしませんか？

ハンドル名: Parco1021さん

ブログタイトル: 情報学部大学生のだらだら日記

フォロー