お知らせ ビープラウド、機械学習・データ分析の問題をオンライン学習サービスPyQにて提供開始

このエントリーをはてなブックマークに追加

4月

18

強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章 強化学習 前半」

#人工知能,#機械学習,#深層学習,#ニューラルネット,#ディープラーニング,#初心者

ハッシュタグ :#geek
募集内容

参加者

1000円(会場払い)

先着順
26/32

イベントの説明

発表形式を想定しています。
こちらの本を進めていく予定です。
発表してくださる方募集中!!


強化学習
https://www.morikita.co.jp/books/book/1990
強くなるロボティック・ゲームプレイヤーの作り方
https://book.mynavi.jp/ec/products/detail/id=52804
強化学習
https://www.morikita.co.jp/books/book/1990
http://neuro.bstu.by/ai/RL-3.pdf
オススメの本
https://www.morikita.co.jp/books/book/3034

ソース

Reinforcement Learning: An Introduction Python code for Sutton & Barto's book Reinforcement Learning: An Introduction (2nd Edition)
https://github.com/dennybritz/reinforcement-learning
Implementation of Reinforcement Learning Algorithms. Python, OpenAI Gym, Tensorflow. Exercises and Solutions to accompany Sutton's Book and David Silver's course.
https://github.com/ShangtongZhang/reinforcement-learning-an-introduction
A course in reinforcement learning in the wild
https://github.com/yandexdataschool/Practical_RL
techcircle_openai_handson
https://github.com/icoxfog417/techcircle_openai_handson

おまけ

some common TD Learning algorithms
https://github.com/chrodan/tdlearn

スケジュール

輪読本 https://book.mynavi.jp/ec/products/detail/id=52804

【4月】:強化学習
1週目:gym入門など●
2週目:
    1章 “強くなる”ロボティック・ゲームプレイヤーを作るには
    2章 学習とは?
3週目:
    3章 強化学習●
     3.1 強化学習の背景
     3.2 強化学習の構成
     3.3 マルコフ決定過程
     3.4 最適政策関数
4週目:
    3章 強化学習●
     3.5 状態価値関数
     3.6 状態・行動価値関数
     3.7 動的計画法の問題点
【5月】:強化学習
1週目:
お休み
2週目:
    4章 離散的な空間での学習●
     4.1 はじめに
     4.2 ルックアップテーブルで表される価値関数の例
     4.3 標本を抽出する
     4.4 モンテカルロ法
3週目:
    4章 離散的な空間での学習
     4.5 価値関数近似における教師付き学習
     4.6 TD法
     4.7 Q学習
     4.8 三目並べ(Tic-Tac-Toe)の例
     4.9 実行例
4週目:
suttonに変える?
5週目:
【6月】:強化学習
1週目:
2週目:
3週目:
4週目:
【7月】:強化学習
1週目:
2週目:
3週目:
4週目:

以降〜
    5章 連続的な空間での学習
     5.5 カーネルモデル
     5.6 線形モデルの最小二乗推定
     5.7 カーネルモデルの最小二乗推定
     5.8 アクロボットの例

5章 連続的な空間での学習
     5.1 はじめに
     5.2 台車の山登りゲーム
     5.3 価値関数の近似誤差
     5.4 価値関数のモデル

6章 政策を直接近似する
     6.1 はじめに
     6.2 政策勾配法
     6.3 最小分散ベースライン
     6.4 ガウスモデル政策モデル
    6章 政策を直接近似する
     6.5 自然政策勾配法
     6.6 政策勾配の例
     6.7 4足ロボットへの実装


次の輪読テーマ募集!!

電子回路系

FPGAなど
Raspberry Piで学ぶ ROSロボット入門
https://www.amazon.co.jp/dp/4822239292/ref=pd_sim_14_64?_encoding=UTF8&psc=1&refRID=AY8SJWTTVSZ0RDZ8GBY4
https://github.com/ryuichiueda/raspimouse_book_info
Prototyping Lab――「作りながら考える」ためのArduino実践レシピ
https://www.oreilly.co.jp/books/9784873114538/

データサイエンス系

Python機械学習プログラミング 達人データサイエンティストによる理論と実践
https://www.amazon.co.jp/Python%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0-%E9%81%94%E4%BA%BA%E3%83%87%E3%83%BC%E3%82%BF%E3%82%B5%E3%82%A4%E3%82%A8%E3%83%B3%E3%83%86%E3%82%A3%E3%82%B9%E3%83%88%E3%81%AB%E3%82%88%E3%82%8B%E7%90%86%E8%AB%96%E3%81%A8%E5%AE%9F%E8%B7%B5-impress-top-gear/dp/4844380605

数学系

プログラミングのための確率統計
https://estore.ohmsha.co.jp/titles/978427406775P
プログラミングのための線形代数
https://estore.ohmsha.co.jp/titles/978427406578P

暗号

暗号技術入門 第3版
http://www.hyuki.com/cr/
Hacking: 美しき策謀 第2版 ―脆弱性攻撃の理論と実際
https://www.amazon.co.jp/Hacking-%E7%BE%8E%E3%81%97%E3%81%8D%E7%AD%96%E8%AC%80-%E2%80%95%E8%84%86%E5%BC%B1%E6%80%A7%E6%94%BB%E6%92%83%E3%81%AE%E7%90%86%E8%AB%96%E3%81%A8%E5%AE%9F%E9%9A%9B-Jon-Erickson/dp/4873115140
セキュリティコンテストチャレンジブック -CTFで学ぼう! 情報を守るための戦い方-
https://www.amazon.co.jp/%E3%82%BB%E3%82%AD%E3%83%A5%E3%83%AA%E3%83%86%E3%82%A3%E3%82%B3%E3%83%B3%E3%83%86%E3%82%B9%E3%83%88%E3%83%81%E3%83%A3%E3%83%AC%E3%83%B3%E3%82%B8%E3%83%96%E3%83%83%E3%82%AF-CTF%E3%81%A7%E5%AD%A6%E3%81%BC%E3%81%86-%E6%83%85%E5%A0%B1%E3%82%92%E5%AE%88%E3%82%8B%E3%81%9F%E3%82%81%E3%81%AE%E6%88%A6%E3%81%84%E6%96%B9-%E7%A2%93%E4%BA%95-%E5%88%A9%E5%AE%A3/dp/4839956480/ref=sr_1_1?s=books&ie=UTF8&qid=1492399052&sr=1-1&keywords=CTF

web

flask
http://tatsu-zine.com/books/explore-flask/linkparts


実装をもっとしたい方はこちら

当日までに何かしら作ってくるミニハッカソン
発表のレベルは問いません。
https://aichatbot.connpass.com/event/

みんなでチャレンジしています。

House Price

https://www.kaggle.com/c/house-prices-advanced-regression-techniques

General AI Challenge

https://general-ai-challenge.connpass.com/event/50541/

Self-Driving Car Challenge

https://www.udacity.com/didi-challenge

持ち物

実装をされる方はPC

対象

人工知能を1から始めたい方、考えてる方
人工知能に少し興味のあるプログラマ

ドキュメント

ゼロから作るDeep Learning Pythonで学ぶディープラーニングの理論と実装
→終了
https://www.oreilly.co.jp/books/9784873117584/
kerasドキュメント
→終了
https://keras.io/ja/

参加費

1000円(会場費)

開催場所

コワーキングスペース秋葉原 Weeyble(ウィーブル)
http://weeyble.com/
東京都千代田区神田須田町2丁目19−23(野村第3ビル4階)
秋葉原駅電気街口または中央改札口より徒歩3分。 都営新宿線 岩本町駅徒歩3分、銀座線 神田駅6番出口徒歩2分


その他

途中参加や途中退出は自由です。
電源、Wi-Fiはあります。
一緒に運営してくださる方募集してます。


グループ

https://www.facebook.com/groups/1515619948454253/
資料もこちらに貼る予定です。また質問などご自由にどうぞ。

資料 資料をもっと見る/編集する

資料が投稿されると、最新の3件が表示されます。

フィード

hm2016

hm2016 さんが書き込みました。

2017/04/22 12:04

先週の火曜に話題になったSuttonのReinforcement Learning の2016年バージョンですが、2ndのドラフトして以下からダウンロードできます。http://incompleteideas.net/sutton/book/the-book-2nd.html

コワーキングスペース秋葉原Weeyble

コワーキングスペース秋葉原Weeyble さんが書き込みました。

2017/04/18 20:06

↓本日のファイルになります。

hm2016

hm2016 さんが書き込みました。

2017/04/18 19:58

https://drive.google.com/open?id=0B47wRYqL1S02YTFTZTMyamZYSnM

roller

roller さんが 強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章 強化学習 前半」 を公開しました。

2017/04/12 00:03

強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章 強化学習 前半」 を公開しました!

グループ

人工知能系の勉強会

イベント数 65回

メンバー数 952人

終了

2017/04/18(火)

20:00
22:00

募集期間
2017/04/12(水) 00:02 〜
2017/04/18(火) 22:00

会場

コワーキングスペース秋葉原 Weeyble(ウィーブル)

東京都千代田区神田須田町2丁目19−23 (野村第3ビル4階)

コワーキングスペース秋葉原 Weeyble(ウィーブル)

参加者(26人)

takumi

takumi

強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章 強化学習 前半」に参加を申し込みました!

ZhichaoLiu

ZhichaoLiu

I joined 強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章 強化学習 前半」!

bonetaro

bonetaro

強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章 強化学習 前半」 に参加を申し込みました!

kubo0311

kubo0311

強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章 強化学習 前半」に参加を申し込みました!

STK7M_ML

STK7M_ML

強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章 強化学習 前半」に参加を申し込みました!

hm2016

hm2016

強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章 強化学習 前半」 に参加を申し込みました!

e6i24v

e6i24v

強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章 強化学習 前半」 に参加を申し込みました!

2casa

2casa

強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章 強化学習 前半」 に参加を申し込みました!

miyayou

miyayou

強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章 強化学習 前半」 に参加を申し込みました!

hkoba

hkoba

強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章 強化学習 前半」に参加を申し込みました!

参加者一覧(26人)

キャンセルした人(12人)