1口(1社3名まで受講可能)でのお申込は、

 受講料  が格安となります。





  
 基礎からわかる強化学習

 
 ~Q学習からAlphaGo Zeroまで~




 S180709K

 

開催日時:2018年7月9日(月) 10:30-16:30

会  場:オームビル(東京都千代田区神田錦町3‐1)
      【地下鉄】東西線『竹橋駅』徒歩3分
           三田線・新宿線・半蔵門線『神保町駅』徒歩7分
           新宿線・千代田線『小川町駅』徒歩7分
           丸ノ内線『淡路町駅』徒歩8分
      【JR】  中央線・山手線・京浜東北線『神田駅』徒歩12分
           中央線・総武線『御茶ノ水駅』徒歩11分


受 講 料:
1人様受講の場合 46,000円[税別]/1名

     1口でお申込の場合 57,000円[税別]/1口(3名まで受講可能)

 


 

 講 師


 飯間 等  氏

   京都工芸繊維大学 情報工学・人間科学系
   准教授 博士(工学)

  【ご略歴】
    1995年4月 京都工芸繊維大学、助手
    2007年4月 京都工芸繊維大学、助教
    2008年4月 京都工芸繊維大学、准教授 現在に至る。

  【専門・得意分野】
    強化学習、遺伝的アルゴリズム、群知能、機械学習、
    進化計算、計算知能、最適化、スケジューリング

  【所属学会】 
    計測自動制御学会、システム制御情報学会、電気学会、
    スケジューリング学会、電子情報通信学会、IEEE

  <受講後、習得できること>
    ・強化学習の問題
    ・様々な学習方法(伝統的なQ学習から最新のAlphaGo Zeroまで)
    ・実際の問題に対して強化学習を応用する方法




 講義項目


  1. 強化学習の例示(デモンストレーション)
   1.1 最短経路探索
    1.2 ゲームプレイ
    1.3 二足歩行
    

  
2. 強化学習問題
    2.1 学習エージェントと環境
    2.2 問題の定義
    2.3 例題:最短経路探索と二足歩行


  
3. 表形式の強化学習法
    3.1 価値関数
    3.2 行動選択法
    3.3 学習法:TD、Q学習、Sarsa、モンテカルロ木探索


  
4. 近似を用いる強化学習法
    4.1 価値関数の近似:放射基底関数、ニューラルネットワーク
    4.2 勾配法
    4.3 価値勾配を用いる学習法
    4.4 方策勾配を用いる学習法


  
5. 深層強化学習法
    
5.1 深層学習(ディープラーニング)
    5.2 ビデオゲームに対する学習法
    5.3 囲碁に対する学習法:AlphaGoとAlphaGo Zero


  6. 実際の応用における強化学習の使い方



 

 お1人様      受講申込要領  1口(1社3名まで) 受講申込要領   セミナー 総合日程