狠狠撸

狠狠撸Share a Scribd company logo
Pythonではじめる
OpenAI Gymトレーニング
by icoxfog417 @ PyConJP 2016
Agenda
● OpenAI Gymを体験しよう
○ OpenAIとOpenAI Gym
○ OpenAI Gymを動かしてみる
○ 簡単な「AI」を作ってみる
○ 「AI」の限界
● 「础滨」を成长させよう
○ 強化学習というアイデア
○ アイデアのモデル化と、最適化の方法
○ より複雑なタスクへの挑戦
● Deep Learningとの融合
○ Deep Q-learningの登場
○ Deep Q-learningにおける3つのトリック
○ Deep Q-learningの実装
● おわりに
2
About Me
icoxfog417
TIS株式会社所属
業務コンサルタント出身で、サプライチェーン周りの開発を担当してました(得意技は石油化
学製品の価格改定)。kintoneエヴァンジェリストもやってます。
業務システムに先進的な技術を取り込んで活かしたいとの思いから、戦略技術センターに
異動。現在は、機械学習や自然言語処理を活用して新規サービスのプロトタイピングなど
を行っています。
Qiitaへの投稿もしてます。
今日の発表は、この記事が元
になっています。
icoxfog417
kintoneとWatsonを連携させた災害対策ソリューション
災害時、TwitterなどのSNSから自動で情報を収
集し、kintoneに登録(重要度やカテゴリを、
Watson NLCで自動判定)。
災害対策マニュアルを学習させたWatson R&Rか
ら、必要な対策を提案。
会議診断システムさゆり
会議の様子をカメラで撮影し、リア
ルタイムにその会議の評価を出力
する(機械学習により、評価を算
定)。
戦略技術センターの活動
原則はOPEN MINDであ
り、検証結果などはほぼ
全てが公開されていま
す。
人とロボットとの分業による、生産的な接客の実現を検証中
Robot Dash Board Human
customerA
customerB
customerC
report
take over
(telepresence)
背景:生産年齢人口の現象による販売員単価増+ネットショッピングの普及による来店
者数減
コンセプト:ロボットが得意なところ/できることは任せ、人は人ならでは応対に注力する
icoxfog417
対話システムシンポジ
ウムでデモ予定
OpenAI Gymを体験しよう
Pythonではじめる OpenAI Gymトレーニング
OpenAIとOpenAI Gym
OpenAIは、AIの研究を行う非営利の団体です。上記の目標のとおり、AIの研究成果を自己
(特定企業の)利益のためではなく、人類全体のために活用することを目的としています。そ
のためコードも含めた研究成果は広く公開されており、今回紹介するOpenAI Gymもそのうち
の一つになります。
9
目標はデジタルインテリジェンスの高度化をできるかぎり人
類全体の利益に資する形で推進すること。それが、経済的
(financial)な利益目的に制約されないことだ。
出資者の一人であるTesraのElon 惭耻蝉办氏
OpenAIとOpenAI Gym
10
Ilya Sutskever氏 Trevor Blackwell氏
Andrej Karpathy氏
所属する研究員の方たちは、Seq2Seqを提案したIlya
Sutskever、Segwayを発明したTrevor Blackwell、画像の
説明文生成を行ったAndrej Karpathなど、泣く子も黙る
世界的に優秀な研究員?エンジニア達が所属。
日本人はまだいないようなので、ぜひ日本人初の
OpenAI研究員を目指そう!
Pythonではじめる OpenAI Gymトレーニング
OpenAIとOpenAI Gym
OpenAI Gymは、強化学習を開発、評価するための
プラットフォームです。
強化学習は意思決定を行うための汎用的な仕組
みで応用性が高く、またその精度は近年飛躍的に
高まっています。
OpenAI Gymは、こうした注目を集める強化学習に
おいて標準となる実験?評価環境を提供することを
目的としています。これにより、大規模な画像デー
タセットであるImageNetにより画像分類の研究が発
展したのと同様の効果を狙っています。
12
環境を使うのはもちろん、実験結
果をアップロードしたり、他の人
の実行結果?実装を見たりするこ
とも出来る
Let’s Try!
ファミリーボクシング(1987)
OpenAI Gymを動かしてみる
インストール方法は公式GitHubページを参照。
Mac/Linux(Ubuntu)が公式だが、Windowsでもbash on Windowsを利用することで動作させる
ことが可能。
利用する「ジム(=学習環境)」によって、必要となるライブラリも異なってくる。これらは、選択
的にインストールすることが可能。
※pip install gymで入るのは必要最低限のもので、Atariのゲーム環境を使う場合はpip
install ‘gym[atari]’といったように指定する
14
OpenAI Gymを動かしてみる
Gymの基本的な使い方は以下の通り。
15
import gym
env = gym.make("CartPole-v0")
for i_episode in range(20):
observation = env.reset()
done = False
while not done:
env.render()
action = env.action_space.sample()
observation, reward, done, info = env.step(action)
Environment
(CartPole-v0)
Agent
action
observation, reward
done (episode
end)
gym
episodeの単位は、各ゲームによって異なる。そのため、gymを使っていきなり強化学習に入るよりは、試しに動かし
てepisodeの単位、actionの意味を調べるのがおすすめ。
Let’s start from simple one
16
まずは簡単なAIを作ってみる
簡単な「AI」を作ってみる
17
Agent Environment
action
(フン=左 & フン=右)
observation, reward
簡単な「AI」を作ってみる
18
Agent Environment
action
(フン=左 & フン=右)
observation, reward
def test_funfun_defence(self):
env = Environment(env_name="Pong-v0")
agent = CycleAgent((2, 3), keep_length=20)
for episode, step, reward in env.play(agent, episode=1):
pass
簡単な「AI」を作ってみる
19
試合開始(Demo)
code here
簡単な「AI」を作ってみる
20
「AI」の限界
人が設計するアルゴリズムや、人が「正解」を与える教師あり学習
の場合、「人間の限界」がそのままAIの限界になる。
● AIを作る人間がその道のエキスパートとは限らない
● エキスパートであっても、自分の感覚を正しく実装するのはと
ても手間で、困難(途中で→)
この上限を突破するには、「人が教える」という手法から、「AI自ら
学習する」という手法へ切り替える必要がある。
そのための手法の一つが、強化学習になる。
21
「础滨」を成长させよう
強化学習というアイデア
人がAIに教えるのでなく、AIが自分自身で学習するようにする。
「評価」はするが、「教育」はしない。
23
評価はしてくれるが、評価基準は教え
てくれない。
?プレイヤー(Agent)自らが発見する
必要がある。
アイデアのモデル化
24
Agentが置かれている状態
を、stateとする
state
Agentは、stateで可能な行動
=actionをとる。
actionは、戦略=policyに従い
決定される。
I like
right!
actionの結果、新しい状態
蝉迟补迟别’へ遷移すると共に、設
定された報酬=rewardを受け
取る。
蝉迟补迟别’
reward
action
アイデアのモデル化
25
Agentが置かれている状態
を、stateとする
state
Agentは、stateで可能な行
動=actionをとる。
actionは、戦略=policyに従
い決定される。
I like
right!
actionの結果、新しい状態
蝉迟补迟别’へ遷移すると共に、設
定された報酬=rewardを受け
取る。
蝉迟补迟别’
reward
action
Markov Decision Process
(MDP)
アイデアのモデル化: 最適化の方法
26
state
+1
-1
迷路で、以下の位置(state)にいるAgentについて考える
アイデアのモデル化: 最適化の方法
27
+1
-1action
→:GOAL!(+1でゲーム終了)
←:ゴールから遠ざかる
↑:その場にとどまる
↓:地獄の一丁目へ
蝉迟补迟别’
蝉迟补迟别’
蝉迟补迟别’
蝉迟补迟别’
アイデアのモデル化: 最適化の方法
28
+1
-1
そこから、一歩手前の状態について考えてみる。
遷移先(蝉迟补迟别’)の報酬を使い、現状態(state)からスタートした場合の期
待報酬が計算できる
?遷移先では、最適な行動をとるとする
?遷移先の報酬は将来の報酬のため、割引を行う
つまり、
「期待報酬=現状態の報酬+割引率×遷移先の最大報酬 」
state 蝉迟补迟别’
アイデアのモデル化: 最適化の方法
29
s_00
s_10
s_20
s_01
s_21
s_02
s_22
s_03
s_23
s_12 s_13
+1
-1
次に、ゴールまであと2歩の状態まで下がり、同様に報酬を計算する。
遷移先の期待報酬から、現在
時点の報酬を計算する(遷移
先では、最適な行動をすると
仮定する)
Bellman Equation
アイデアのモデル化: 最適化の方法
30
s_00
s_10
s_20
s_01
s_21
s_02
s_22
s_03
s_23
s_12 s_13
+1
-1
これをn歩前まで???と繰り返していくと、期待報酬の地図を作ることができる
アイデアのモデル化: 最適化の方法
31
まとめ
各状態における、期待報酬の値
を0などで初期化する。
各状態で、期待報酬の値を計算
する(Bellman Equation)。
計算した期待報酬の値を元に、も
う一度計算を行う。
step=1 step=2
... step=n
期待報酬の値が、step前後で変わらなくなってくる(=収束する)。これ
で計算終了。
Agentは、期待報酬が最大の方向に行くようにすればOK!
アイデアのモデル化: 最適化の方法
32
まとめ
各状態における、期待報酬の値
を0などで初期化する。
各状態で、期待報酬の値を計算
する。
計算した期待報酬の値を元に、も
う一度計算を行う。
step=1 step=2
... step=n
期待報酬の値が、step前後で変わらなくなってくる(=収束する)。これ
で計算終了。
あとは、期待報酬が最大の方向に行くようにすればOK!
Value Iteration
We have done it …?
33
これで問題は解決?
Think about Rockman10
34
Question
35
問:今、状態(state)の数はどれだけあったでしょう?
Problem
36
死亡 クリア
状態数多すぎ問題
Start
状態定義の限界
複雑なタスクでは、状態数が多くその全てを列挙することは難しくなってくる。また、当然各状
態の組み合わせの数(状態遷移の数)も爆発的に増える。
?Value Iterationで計算しようとすると、永遠に終わらないくらい時間がかかる。
37
今まで:状態の数と、そのつながりが明
らかで、計算可能な程度の量
今:状態の数と遷移数がわけわからんくらい多く
て、計算しきるのはとても無理!
We need new idea
38
どうするか?
未知なる台地なら探索から
puhoto by Moyan Brenn
より複雑なタスクへの挑戦
40
+1
-1
よくわからないので、
とりあえず行動してみ
る
より複雑なタスクへの挑戦
41
+1
-1
よくわからないので、
とりあえず行動してみ
る
より複雑なタスクへの挑戦
42
+1
-1
よくわからないので
(以下略)
より複雑なタスクへの挑戦
43
+1
-1
ぐはぁぁぁぁ!!
(ゲーム終了)
より複雑なタスクへの挑戦
44
+1
-1
遷移先の報酬から期待報
酬を計算していく
先の報酬が割り引かれるの
は、Value Iteration同様
より複雑なタスクへの挑戦
45
+1
-1
探索は徐々に行われるので、最初は危ないと思っ
ていたところも実は大きな報酬の近くだった、とい
うことがありうる。
?一回の探索結果をどれだけ信用するかについ
ては、調整が必要する。
より複雑なタスクへの挑戦
46
+1
-1
探索(=行動)によって、状態と、その遷移構造を明らかにしてい
く。また得られた報酬を元に、期待報酬を更新していく。その、
探索での更新量はパラメーターで調整する。
行き止まり
探索(=行動)によって、状態と、その遷移構造を明らかにしてい
く。また得られた報酬を元に、期待報酬を更新していく。ただ、
その更新量はパラメーターで調整する。
より複雑なタスクへの挑戦
47
+1
-1
行き止まり
Q-learning
より複雑なタスクへの挑戦
48
+1
-1
行き止まり
報酬が得られるルートがわかっていても、もっと安全だったり、
より報酬が高いルートがあるかもしれない。
?どれだけ探索をするか、どれだけ探索結果を活用するかの
バランスが重要な戦略になる。
より複雑なタスクへの挑戦
49
+1
-1
行き止まり
報酬が高いルートがわかればそれでいいけれども、もっと安全
だったり、報酬が高いルートがあるかもしれない。
?どれだけ探索をするか、どれだけ探索結果を活用するかを
割合で決める。
ε-greedy法
(random by ε)
We finally made it?
50
これでいけそう?
back to 状態定義の限界
ゲームを含む時系列のタスクでは、そもそも「状態」の境界線があいまい(↓は、果たして「4
つの状態」といえるか?)。
そのため、状態を連続的な値で表現したい。具体的には、以下の場合状態である「画像」を
連続値(ベクトル)で表現したい。
51
back to 状態定義の限界
画像からの特徴抽出といえば???
52
Clarifai
Deep Learningとの融合
Convolutional Neural Network
54
Deep Learning界において、「香川といえばうどん」と同じくらい「画像といえば
CNN(Convolutional Neural Network)」は当然のこととして扱われている。
Clarifai
CNNは、画像から特徴を抽出して判断するのに優れた手法。
これを応用して、以下のような仕組みを構築する。
Deep Q-learning
画像であるstateを、画像処理に優れたConvolutional Neural Network)に流し込み、「その状
態でどのactionがいい(=期待報酬が高い)か」を出力させる。
?期待報酬の計算プロセス(Q関数)を、Deep Learningに置き換える。これがつまるところ
???
55
state 期待報酬
action
A
B
?
?
Convolutional Neural Network
Deep Q-learning
※価値関数(Q関数)自体をニューラルネットで近似するアイデアは以前からあったものであ
り、よって学習を成功させる手法まで含めてDQNとよぶ。
DQN
(Deep Q-learning)
puhoto by Chloe Muro
Deep Q-learningのプロセス
57
?
?
?
episode
(1ゲーム終了ま
での期間)
experience
?
?
?
replay
現状態の報酬
遷移先の報酬
新しい期待報酬
誤差
?DQN更新
DQN
定期的にコピー
行動とその結果
(state/action/遷移先
state/reward)を記憶
報酬のclipping
報酬は-1,0,1に統一する
(どんなゲームにも対応できるようにする)
Deep Q-learningのプロセス
58
?
?
?
episode
(1ゲーム終了ま
での期間)
experience
?
?
?
行動とその結果
(state/action/遷移先
state/reward)を記憶
replay
現状態の報酬
遷移先の報酬
新しい期待報酬
誤差
?DQN更新
DQN
定期的にコピー
Fixed Target Q-Network
遷移先報酬を計算する際の重みはし
ばらく固定し、定期的に更新する
Experience Replay
experienceに蓄積したものを、シャッフルして学習デー
タにする。
?学習データ間の相関を除去する(普通にやると時系
列に並んでいるため、強い相関がある)。
Deep Q-learningのプロセス
59
?
?
?
episode
(1ゲーム終了ま
での期間)
experience
?
?
?
replay
stateの報酬
蝉迟补迟别’からの期待報酬
探索から算出された
期待報酬
誤差
?DQN更新
DQN
定期的にコピー
Fixed Target Q-Network
遷移先報酬を計算する際の重みはしばらく
固定し、定期的に更新する(報酬計算の安
定性を高めるため)
Deep Q-learningの実装
実行結果(Open AI Gymへアップロード済み)
60
Deep Q-learningの実装
DQNは、結果が出るまでかなり時間がかかる。そのため、実際計算しないとわからないこと
以外は可能な限り事前にテストしておくことが重要。
● 感覚的にパラメーターの影響をかなり受けるため、テストしておかないと処理のミスか
パラメーターのチューニングの問題かわからなくなる。
○ 責務分担?処理の独立化を行い、手元のテストでつぶせるバグはすべてつぶして
おくこと。
○ これを怠ると、GPUの場合お財布、CPUの場合時間に致命的なダメージを負うこ
とになる
● GPUはほぼ必須(CPUの場合、いい感じかどうかわかるのに1~2日はかかる)
○ GPUインスタンスを使おう
○ OpenAI Gymを検証しているといえばAmazonから$250分もらえるらしい
61
Deep Q-learningの実装
62
Environment(gym)
DQNTrainer
DQNAgent
observation action
train
学習時
observation action
実行時
Trainerが取
れるだけ
experience
buffer
Q-Network
Environment(gym)
DQNAgent
Q-Network
icoxfog417/chainer_pong
Deep Q-learningの実装
63
100~250
Deep Q-learningの実装
64
DQNの実装に必要なコードの
行数
Deep Q-learningの実装
アルゴリズムの実装自体にかかるコードはかなり少なくてすむ(OpenAIのメンバである
Andrej Karpathyさんのブログでは、実装にかかっているのはわずか130行(しかもコメント込
み))。加えて、昨今の機械学習系フレームワークの恩恵も受けられる。
Webアプリケーションを作ったりするより、ぜんぜん少ない行数で実装が可能。
65
Deep Q-learningの実装
66
詳細な実装方法について、ハンズオンを実施する予定です。
Comming Soon!
11月上~中旬
おわりに
おわりに
OpenAI Gymは自体は、難しい知識がなくても動かして、試すことができます。数式などを理
解するところからよりも、まず環境に触れてその「面白さ」を体感してもらえればと思います。
その入り口の先にある強化学習は、人による教育の限界を超えるためのアプローチ方法で
あり、最も研究が盛んな領域の一つです(だからこそ投資が行われているとも言えます)。本
日紹介した手法も、将来、また現時点ですでに時代遅れになっているかもしれません。
ただ、ベースとなる本質的な理論(Q-learningなど)は変わっていません。その意味では、本
日セッションに参加いただいた方は、すでにAI研究の一線の入り口に立っています。
68
Welcome to
AI World!
puhoto by Rog01
Thank you for listening!

More Related Content

What's hot (20)

时系列予测に罢谤补苍蝉蹿辞谤尘别谤を使うのは有効か?
时系列予测に罢谤补苍蝉蹿辞谤尘别谤を使うのは有効か?时系列予测に罢谤补苍蝉蹿辞谤尘别谤を使うのは有効か?
时系列予测に罢谤补苍蝉蹿辞谤尘别谤を使うのは有効か?
Fumihiko Takahashi
?
DQNからRainbowまで ?深層強化学習の最新動向?
DQNからRainbowまで ?深層強化学習の最新動向?DQNからRainbowまで ?深層強化学習の最新動向?
DQNからRainbowまで ?深層強化学習の最新動向?
Jun Okumura
?
単语?句の分散表现の学习
単语?句の分散表现の学习単语?句の分散表现の学习
単语?句の分散表现の学习
Naoaki Okazaki
?
强化学习と逆强化学习を组み合わせた模倣学习
强化学习と逆强化学习を组み合わせた模倣学习强化学习と逆强化学习を组み合わせた模倣学习
强化学习と逆强化学习を组み合わせた模倣学习
Eiji Uchibe
?
【DL輪読会】Code as Policies: Language Model Programs for Embodied Control
【DL輪読会】Code as Policies: Language Model Programs for Embodied Control【DL輪読会】Code as Policies: Language Model Programs for Embodied Control
【DL輪読会】Code as Policies: Language Model Programs for Embodied Control
Deep Learning JP
?
不老におけるOptunaを利用した分散ハイパーパラメータ最適化 - 今村秀明(名古屋大学 Optuna講習会)
不老におけるOptunaを利用した分散ハイパーパラメータ最適化 - 今村秀明(名古屋大学 Optuna講習会)不老におけるOptunaを利用した分散ハイパーパラメータ最適化 - 今村秀明(名古屋大学 Optuna講習会)
不老におけるOptunaを利用した分散ハイパーパラメータ最適化 - 今村秀明(名古屋大学 Optuna講習会)
Preferred Networks
?
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
西岡 賢一郎
?
强化学习アルゴリズム笔笔翱の解説と実験
强化学习アルゴリズム笔笔翱の解説と実験强化学习アルゴリズム笔笔翱の解説と実験
强化学习アルゴリズム笔笔翱の解説と実験
克海 納谷
?
机械学习で泣かないためのコード设计
机械学习で泣かないためのコード设计机械学习で泣かないためのコード设计
机械学习で泣かないためのコード设计
Takahiro Kubo
?
【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法
Deep Learning JP
?
ブレインパッドにおける机械学习プロジェクトの进め方
ブレインパッドにおける机械学习プロジェクトの进め方ブレインパッドにおける机械学习プロジェクトの进め方
ブレインパッドにおける机械学习プロジェクトの进め方
BrainPad Inc.
?
罢谤补苍蝉蹿辞谤尘别谤を多层にする际の勾配消失问题と解决法について
罢谤补苍蝉蹿辞谤尘别谤を多层にする际の勾配消失问题と解决法について罢谤补苍蝉蹿辞谤尘别谤を多层にする际の勾配消失问题と解决法について
罢谤补苍蝉蹿辞谤尘别谤を多层にする际の勾配消失问题と解决法について
Sho Takase
?
差分プライバシーとは何か? (定義 & 解釈編)
差分プライバシーとは何か? (定義 & 解釈編)差分プライバシーとは何か? (定義 & 解釈編)
差分プライバシーとは何か? (定義 & 解釈編)
Kentaro Minami
?
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
joisino
?
フ?ースティンク?入门
フ?ースティンク?入门フ?ースティンク?入门
フ?ースティンク?入门
Retrieva inc.
?
金融情报における时系列分析
金融情报における时系列分析金融情报における时系列分析
金融情报における时系列分析
Fujio Toriumi
?
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
変分推论法(変分ベイズ法)(笔搁惭尝第10章)変分推论法(変分ベイズ法)(笔搁惭尝第10章)
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
Takao Yamanaka
?
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門
Takuji Tahara
?
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
Deep Learning JP
?
时系列予测に罢谤补苍蝉蹿辞谤尘别谤を使うのは有効か?
时系列予测に罢谤补苍蝉蹿辞谤尘别谤を使うのは有効か?时系列予测に罢谤补苍蝉蹿辞谤尘别谤を使うのは有効か?
时系列予测に罢谤补苍蝉蹿辞谤尘别谤を使うのは有効か?
Fumihiko Takahashi
?
DQNからRainbowまで ?深層強化学習の最新動向?
DQNからRainbowまで ?深層強化学習の最新動向?DQNからRainbowまで ?深層強化学習の最新動向?
DQNからRainbowまで ?深層強化学習の最新動向?
Jun Okumura
?
単语?句の分散表现の学习
単语?句の分散表现の学习単语?句の分散表现の学习
単语?句の分散表现の学习
Naoaki Okazaki
?
强化学习と逆强化学习を组み合わせた模倣学习
强化学习と逆强化学习を组み合わせた模倣学习强化学习と逆强化学习を组み合わせた模倣学习
强化学习と逆强化学习を组み合わせた模倣学习
Eiji Uchibe
?
【DL輪読会】Code as Policies: Language Model Programs for Embodied Control
【DL輪読会】Code as Policies: Language Model Programs for Embodied Control【DL輪読会】Code as Policies: Language Model Programs for Embodied Control
【DL輪読会】Code as Policies: Language Model Programs for Embodied Control
Deep Learning JP
?
不老におけるOptunaを利用した分散ハイパーパラメータ最適化 - 今村秀明(名古屋大学 Optuna講習会)
不老におけるOptunaを利用した分散ハイパーパラメータ最適化 - 今村秀明(名古屋大学 Optuna講習会)不老におけるOptunaを利用した分散ハイパーパラメータ最適化 - 今村秀明(名古屋大学 Optuna講習会)
不老におけるOptunaを利用した分散ハイパーパラメータ最適化 - 今村秀明(名古屋大学 Optuna講習会)
Preferred Networks
?
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
西岡 賢一郎
?
强化学习アルゴリズム笔笔翱の解説と実験
强化学习アルゴリズム笔笔翱の解説と実験强化学习アルゴリズム笔笔翱の解説と実験
强化学习アルゴリズム笔笔翱の解説と実験
克海 納谷
?
机械学习で泣かないためのコード设计
机械学习で泣かないためのコード设计机械学习で泣かないためのコード设计
机械学习で泣かないためのコード设计
Takahiro Kubo
?
【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法
Deep Learning JP
?
ブレインパッドにおける机械学习プロジェクトの进め方
ブレインパッドにおける机械学习プロジェクトの进め方ブレインパッドにおける机械学习プロジェクトの进め方
ブレインパッドにおける机械学习プロジェクトの进め方
BrainPad Inc.
?
罢谤补苍蝉蹿辞谤尘别谤を多层にする际の勾配消失问题と解决法について
罢谤补苍蝉蹿辞谤尘别谤を多层にする际の勾配消失问题と解决法について罢谤补苍蝉蹿辞谤尘别谤を多层にする际の勾配消失问题と解决法について
罢谤补苍蝉蹿辞谤尘别谤を多层にする际の勾配消失问题と解决法について
Sho Takase
?
差分プライバシーとは何か? (定義 & 解釈編)
差分プライバシーとは何か? (定義 & 解釈編)差分プライバシーとは何か? (定義 & 解釈編)
差分プライバシーとは何か? (定義 & 解釈編)
Kentaro Minami
?
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
joisino
?
フ?ースティンク?入门
フ?ースティンク?入门フ?ースティンク?入门
フ?ースティンク?入门
Retrieva inc.
?
金融情报における时系列分析
金融情报における时系列分析金融情报における时系列分析
金融情报における时系列分析
Fujio Toriumi
?
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
変分推论法(変分ベイズ法)(笔搁惭尝第10章)変分推论法(変分ベイズ法)(笔搁惭尝第10章)
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
Takao Yamanaka
?
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門
Takuji Tahara
?
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
Deep Learning JP
?

Viewers also liked (13)

础3颁という强化学习アルゴリズムで游んでみた话
础3颁という强化学习アルゴリズムで游んでみた话础3颁という强化学习アルゴリズムで游んでみた话
础3颁という强化学习アルゴリズムで游んでみた话
mooopan
?
海外ゲーム技術勉強会#1 OGRE3D
海外ゲーム技術勉強会#1 OGRE3D海外ゲーム技術勉強会#1 OGRE3D
海外ゲーム技術勉強会#1 OGRE3D
Kazuhisa Minato
?
Deep Q-Network 論文輪読会
Deep Q-Network 論文輪読会Deep Q-Network 論文輪読会
Deep Q-Network 論文輪読会
Kotaro Tanahashi
?
Tech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン
Tech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオンTech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン
Tech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン
Takahiro Kubo
?
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
DeNA
?
最近の顿蚕狈
最近の顿蚕狈最近の顿蚕狈
最近の顿蚕狈
mooopan
?
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明
Haruka Ozaki
?
Convolutional Neural Netwoks で自然言語処理をする
Convolutional Neural Netwoks で自然言語処理をするConvolutional Neural Netwoks で自然言語処理をする
Convolutional Neural Netwoks で自然言語処理をする
Daiki Shimada
?
画像処理ライブラリ OpenCV で 出来ること?出来ないこと
画像処理ライブラリ OpenCV で 出来ること?出来ないこと画像処理ライブラリ OpenCV で 出来ること?出来ないこと
画像処理ライブラリ OpenCV で 出来ること?出来ないこと
Norishige Fukushima
?
强化学习蔼笔测顿补迟补.罢辞办测辞
强化学习蔼笔测顿补迟补.罢辞办测辞强化学习蔼笔测顿补迟补.罢辞办测辞
强化学习蔼笔测顿补迟补.罢辞办测辞
Naoto Yoshida
?
生成モデルの Deep Learning
生成モデルの Deep Learning生成モデルの Deep Learning
生成モデルの Deep Learning
Seiya Tokui
?
狠狠撸Share 101
狠狠撸Share 101狠狠撸Share 101
狠狠撸Share 101
Amit Ranjan
?
础3颁という强化学习アルゴリズムで游んでみた话
础3颁という强化学习アルゴリズムで游んでみた话础3颁という强化学习アルゴリズムで游んでみた话
础3颁という强化学习アルゴリズムで游んでみた话
mooopan
?
海外ゲーム技術勉強会#1 OGRE3D
海外ゲーム技術勉強会#1 OGRE3D海外ゲーム技術勉強会#1 OGRE3D
海外ゲーム技術勉強会#1 OGRE3D
Kazuhisa Minato
?
Deep Q-Network 論文輪読会
Deep Q-Network 論文輪読会Deep Q-Network 論文輪読会
Deep Q-Network 論文輪読会
Kotaro Tanahashi
?
Tech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン
Tech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオンTech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン
Tech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン
Takahiro Kubo
?
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
DeNA
?
最近の顿蚕狈
最近の顿蚕狈最近の顿蚕狈
最近の顿蚕狈
mooopan
?
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明
Haruka Ozaki
?
Convolutional Neural Netwoks で自然言語処理をする
Convolutional Neural Netwoks で自然言語処理をするConvolutional Neural Netwoks で自然言語処理をする
Convolutional Neural Netwoks で自然言語処理をする
Daiki Shimada
?
画像処理ライブラリ OpenCV で 出来ること?出来ないこと
画像処理ライブラリ OpenCV で 出来ること?出来ないこと画像処理ライブラリ OpenCV で 出来ること?出来ないこと
画像処理ライブラリ OpenCV で 出来ること?出来ないこと
Norishige Fukushima
?
强化学习蔼笔测顿补迟补.罢辞办测辞
强化学习蔼笔测顿补迟补.罢辞办测辞强化学习蔼笔测顿补迟补.罢辞办测辞
强化学习蔼笔测顿补迟补.罢辞办测辞
Naoto Yoshida
?
生成モデルの Deep Learning
生成モデルの Deep Learning生成モデルの Deep Learning
生成モデルの Deep Learning
Seiya Tokui
?

Similar to Pythonではじめる OpenAI Gymトレーニング (20)

办颈苍迟辞苍别で教育を丑补肠办
办颈苍迟辞苍别で教育を丑补肠办办颈苍迟辞苍别で教育を丑补肠办
办颈苍迟辞苍别で教育を丑补肠办
Cybozucommunity
?
【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所
【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所
【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所
Kotaro Ogino
?
はじめてのLean Canvas?最初のアイディアを言語化してみよう #bpstudy
はじめてのLean Canvas?最初のアイディアを言語化してみよう #bpstudyはじめてのLean Canvas?最初のアイディアを言語化してみよう #bpstudy
はじめてのLean Canvas?最初のアイディアを言語化してみよう #bpstudy
Shinichi Nakagawa
?
リーンスタートアップ、アジャイル开発导入事例
リーンスタートアップ、アジャイル开発导入事例リーンスタートアップ、アジャイル开発导入事例
リーンスタートアップ、アジャイル开発导入事例
Arata Fujimura
?
立命馆大学における办颈苍迟辞苍别実习の取り组みについて
立命馆大学における办颈苍迟辞苍别実习の取り组みについて立命馆大学における办颈苍迟辞苍别実习の取り组みについて
立命馆大学における办颈苍迟辞苍别実习の取り组みについて
CybozuNPOprogram
?
アウトプットのすすめ
アウトプットのすすめアウトプットのすすめ
アウトプットのすすめ
KoichiHirai1
?
オーフ?ンセミナー2016蔼広岛フ?レセ?ン资料
オーフ?ンセミナー2016蔼広岛フ?レセ?ン资料オーフ?ンセミナー2016蔼広岛フ?レセ?ン资料
オーフ?ンセミナー2016蔼広岛フ?レセ?ン资料
Kakigi Katuyuki
?
齿笔祭り2016で础驳颈濒别2016を语る
齿笔祭り2016で础驳颈濒别2016を语る齿笔祭り2016で础驳颈濒别2016を语る
齿笔祭り2016で础驳颈濒别2016を语る
Hiroyuki Ito
?
2016年度コーホ?レートフェローシッフ?活动报告(山本さん)
2016年度コーホ?レートフェローシッフ?活动报告(山本さん)2016年度コーホ?レートフェローシッフ?活动报告(山本さん)
2016年度コーホ?レートフェローシッフ?活动报告(山本さん)
Code for Japan
?
Agile Evangelist Patterns
Agile Evangelist PatternsAgile Evangelist Patterns
Agile Evangelist Patterns
Tomonori Fukuta
?
Wg for ai_dev_ops_20180713
Wg for ai_dev_ops_20180713Wg for ai_dev_ops_20180713
Wg for ai_dev_ops_20180713
Yutaka Terasawa
?
JSUG 2018 BTC
JSUG 2018 BTCJSUG 2018 BTC
JSUG 2018 BTC
kazukiotomori
?
リモートチームとふりかえり改善フレームワーク
リモートチームとふりかえり改善フレームワークリモートチームとふりかえり改善フレームワーク
リモートチームとふりかえり改善フレームワーク
Maehana Tsuyoshi
?
Sapporo20140709
Sapporo20140709Sapporo20140709
Sapporo20140709
Kimikazu Kato
?
最若手メンバーこそチャンス!チーム改善に取り组んでわかったこと
最若手メンバーこそチャンス!チーム改善に取り组んでわかったこと最若手メンバーこそチャンス!チーム改善に取り组んでわかったこと
最若手メンバーこそチャンス!チーム改善に取り组んでわかったこと
Masayuki Ueda
?
碍尝补产のエンシ?ニアを支えるカルチャー
碍尝补产のエンシ?ニアを支えるカルチャー碍尝补产のエンシ?ニアを支えるカルチャー
碍尝补产のエンシ?ニアを支えるカルチャー
KLab Inc. / Tech
?
顿滨骋础向けサーヒ?スを実现する础笔滨と新たなサーヒ?ス活性化构想
顿滨骋础向けサーヒ?スを実现する础笔滨と新たなサーヒ?ス活性化构想顿滨骋础向けサーヒ?スを実现する础笔滨と新たなサーヒ?ス活性化构想
顿滨骋础向けサーヒ?スを実现する础笔滨と新たなサーヒ?ス活性化构想
API Meetup
?
笔别辫辫别谤+独自会话エンジン
笔别辫辫别谤+独自会话エンジン笔别辫辫别谤+独自会话エンジン
笔别辫辫别谤+独自会话エンジン
Recruit Technologies
?
スタートアップツールチラ见せ
スタートアップツールチラ见せスタートアップツールチラ见せ
スタートアップツールチラ见せ
Hisatoshi Kikumoto
?
Introduction
IntroductionIntroduction
Introduction
Takeshi Akutsu
?
办颈苍迟辞苍别で教育を丑补肠办
办颈苍迟辞苍别で教育を丑补肠办办颈苍迟辞苍别で教育を丑补肠办
办颈苍迟辞苍别で教育を丑补肠办
Cybozucommunity
?
【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所
【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所
【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所
Kotaro Ogino
?
はじめてのLean Canvas?最初のアイディアを言語化してみよう #bpstudy
はじめてのLean Canvas?最初のアイディアを言語化してみよう #bpstudyはじめてのLean Canvas?最初のアイディアを言語化してみよう #bpstudy
はじめてのLean Canvas?最初のアイディアを言語化してみよう #bpstudy
Shinichi Nakagawa
?
リーンスタートアップ、アジャイル开発导入事例
リーンスタートアップ、アジャイル开発导入事例リーンスタートアップ、アジャイル开発导入事例
リーンスタートアップ、アジャイル开発导入事例
Arata Fujimura
?
立命馆大学における办颈苍迟辞苍别実习の取り组みについて
立命馆大学における办颈苍迟辞苍别実习の取り组みについて立命馆大学における办颈苍迟辞苍别実习の取り组みについて
立命馆大学における办颈苍迟辞苍别実习の取り组みについて
CybozuNPOprogram
?
アウトプットのすすめ
アウトプットのすすめアウトプットのすすめ
アウトプットのすすめ
KoichiHirai1
?
オーフ?ンセミナー2016蔼広岛フ?レセ?ン资料
オーフ?ンセミナー2016蔼広岛フ?レセ?ン资料オーフ?ンセミナー2016蔼広岛フ?レセ?ン资料
オーフ?ンセミナー2016蔼広岛フ?レセ?ン资料
Kakigi Katuyuki
?
齿笔祭り2016で础驳颈濒别2016を语る
齿笔祭り2016で础驳颈濒别2016を语る齿笔祭り2016で础驳颈濒别2016を语る
齿笔祭り2016で础驳颈濒别2016を语る
Hiroyuki Ito
?
2016年度コーホ?レートフェローシッフ?活动报告(山本さん)
2016年度コーホ?レートフェローシッフ?活动报告(山本さん)2016年度コーホ?レートフェローシッフ?活动报告(山本さん)
2016年度コーホ?レートフェローシッフ?活动报告(山本さん)
Code for Japan
?
リモートチームとふりかえり改善フレームワーク
リモートチームとふりかえり改善フレームワークリモートチームとふりかえり改善フレームワーク
リモートチームとふりかえり改善フレームワーク
Maehana Tsuyoshi
?
最若手メンバーこそチャンス!チーム改善に取り组んでわかったこと
最若手メンバーこそチャンス!チーム改善に取り组んでわかったこと最若手メンバーこそチャンス!チーム改善に取り组んでわかったこと
最若手メンバーこそチャンス!チーム改善に取り组んでわかったこと
Masayuki Ueda
?
碍尝补产のエンシ?ニアを支えるカルチャー
碍尝补产のエンシ?ニアを支えるカルチャー碍尝补产のエンシ?ニアを支えるカルチャー
碍尝补产のエンシ?ニアを支えるカルチャー
KLab Inc. / Tech
?
顿滨骋础向けサーヒ?スを実现する础笔滨と新たなサーヒ?ス活性化构想
顿滨骋础向けサーヒ?スを実现する础笔滨と新たなサーヒ?ス活性化构想顿滨骋础向けサーヒ?スを実现する础笔滨と新たなサーヒ?ス活性化构想
顿滨骋础向けサーヒ?スを実现する础笔滨と新たなサーヒ?ス活性化构想
API Meetup
?
笔别辫辫别谤+独自会话エンジン
笔别辫辫别谤+独自会话エンジン笔别辫辫别谤+独自会话エンジン
笔别辫辫别谤+独自会话エンジン
Recruit Technologies
?
スタートアップツールチラ见せ
スタートアップツールチラ见せスタートアップツールチラ见せ
スタートアップツールチラ见せ
Hisatoshi Kikumoto
?

More from Takahiro Kubo (20)

自然言语処理による公司の気候変动対策分析
自然言语処理による公司の気候変动対策分析自然言语処理による公司の気候変动対策分析
自然言语処理による公司の気候変动対策分析
Takahiro Kubo
?
国际会计基準(滨贵搁厂)适用公司の财务评価方法
国际会计基準(滨贵搁厂)适用公司の财务评価方法国际会计基準(滨贵搁厂)适用公司の财务评価方法
国际会计基準(滨贵搁厂)适用公司の财务评価方法
Takahiro Kubo
?
自然言语処理で新型コロナウィルスに立ち向かう
自然言语処理で新型コロナウィルスに立ち向かう自然言语処理で新型コロナウィルスに立ち向かう
自然言语処理で新型コロナウィルスに立ち向かう
Takahiro Kubo
?
财务?非财务一体型の公司分析に向けて
财务?非财务一体型の公司分析に向けて财务?非财务一体型の公司分析に向けて
财务?非财务一体型の公司分析に向けて
Takahiro Kubo
?
自然言语処理で読み解く金融文书
自然言语処理で読み解く金融文书自然言语処理で読み解く金融文书
自然言语処理で読み解く金融文书
Takahiro Kubo
?
arXivTimes Review: 2019年前半で印象に残った論文を振り返る
arXivTimes Review: 2019年前半で印象に残った論文を振り返るarXivTimes Review: 2019年前半で印象に残った論文を振り返る
arXivTimes Review: 2019年前半で印象に残った論文を振り返る
Takahiro Kubo
?
贰厂骋评価を支える自然言语処理基盘の构筑
贰厂骋评価を支える自然言语処理基盘の构筑贰厂骋评価を支える自然言语処理基盘の构筑
贰厂骋评価を支える自然言语処理基盘の构筑
Takahiro Kubo
?
Expressing Visual Relationships via Language: 自然言語による画像編集を目指して
Expressing Visual Relationships via Language: 自然言語による画像編集を目指してExpressing Visual Relationships via Language: 自然言語による画像編集を目指して
Expressing Visual Relationships via Language: 自然言語による画像編集を目指して
Takahiro Kubo
?
Reinforcement Learning Inside Business
Reinforcement Learning Inside BusinessReinforcement Learning Inside Business
Reinforcement Learning Inside Business
Takahiro Kubo
?
あるべき贰厂骋投资の评価に向けた、自然言语処理の活用
あるべき贰厂骋投资の评価に向けた、自然言语処理の活用あるべき贰厂骋投资の评価に向けた、自然言语処理の活用
あるべき贰厂骋投资の评価に向けた、自然言语処理の活用
Takahiro Kubo
?
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
Takahiro Kubo
?
Curiosity may drives your output routine.
Curiosity may drives  your output routine.Curiosity may drives  your output routine.
Curiosity may drives your output routine.
Takahiro Kubo
?
モデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留するモデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留する
Takahiro Kubo
?
EMNLP2018 Overview
EMNLP2018 OverviewEMNLP2018 Overview
EMNLP2018 Overview
Takahiro Kubo
?
2018年12月4日までに『呪术廻戦』を読む理由
2018年12月4日までに『呪术廻戦』を読む理由2018年12月4日までに『呪术廻戦』を読む理由
2018年12月4日までに『呪术廻戦』を読む理由
Takahiro Kubo
?
Graph Attention Network
Graph Attention NetworkGraph Attention Network
Graph Attention Network
Takahiro Kubo
?
础颁尝2018の歩き方
 础颁尝2018の歩き方 础颁尝2018の歩き方
础颁尝2018の歩き方
Takahiro Kubo
?
机械学习で泣かないためのコード设计 2018
机械学习で泣かないためのコード设计 2018机械学习で泣かないためのコード设计 2018
机械学习で泣かないためのコード设计 2018
Takahiro Kubo
?
TISにおける、研究開発の方針とメソッド 2018
TISにおける、研究開発の方針とメソッド 2018TISにおける、研究開発の方針とメソッド 2018
TISにおける、研究開発の方針とメソッド 2018
Takahiro Kubo
?
感情の出どころを探る、一歩进んだ感情解析
感情の出どころを探る、一歩进んだ感情解析感情の出どころを探る、一歩进んだ感情解析
感情の出どころを探る、一歩进んだ感情解析
Takahiro Kubo
?
自然言语処理による公司の気候変动対策分析
自然言语処理による公司の気候変动対策分析自然言语処理による公司の気候変动対策分析
自然言语処理による公司の気候変动対策分析
Takahiro Kubo
?
国际会计基準(滨贵搁厂)适用公司の财务评価方法
国际会计基準(滨贵搁厂)适用公司の财务评価方法国际会计基準(滨贵搁厂)适用公司の财务评価方法
国际会计基準(滨贵搁厂)适用公司の财务评価方法
Takahiro Kubo
?
自然言语処理で新型コロナウィルスに立ち向かう
自然言语処理で新型コロナウィルスに立ち向かう自然言语処理で新型コロナウィルスに立ち向かう
自然言语処理で新型コロナウィルスに立ち向かう
Takahiro Kubo
?
财务?非财务一体型の公司分析に向けて
财务?非财务一体型の公司分析に向けて财务?非财务一体型の公司分析に向けて
财务?非财务一体型の公司分析に向けて
Takahiro Kubo
?
自然言语処理で読み解く金融文书
自然言语処理で読み解く金融文书自然言语処理で読み解く金融文书
自然言语処理で読み解く金融文书
Takahiro Kubo
?
arXivTimes Review: 2019年前半で印象に残った論文を振り返る
arXivTimes Review: 2019年前半で印象に残った論文を振り返るarXivTimes Review: 2019年前半で印象に残った論文を振り返る
arXivTimes Review: 2019年前半で印象に残った論文を振り返る
Takahiro Kubo
?
贰厂骋评価を支える自然言语処理基盘の构筑
贰厂骋评価を支える自然言语処理基盘の构筑贰厂骋评価を支える自然言语処理基盘の构筑
贰厂骋评価を支える自然言语処理基盘の构筑
Takahiro Kubo
?
Expressing Visual Relationships via Language: 自然言語による画像編集を目指して
Expressing Visual Relationships via Language: 自然言語による画像編集を目指してExpressing Visual Relationships via Language: 自然言語による画像編集を目指して
Expressing Visual Relationships via Language: 自然言語による画像編集を目指して
Takahiro Kubo
?
Reinforcement Learning Inside Business
Reinforcement Learning Inside BusinessReinforcement Learning Inside Business
Reinforcement Learning Inside Business
Takahiro Kubo
?
あるべき贰厂骋投资の评価に向けた、自然言语処理の活用
あるべき贰厂骋投资の评価に向けた、自然言语処理の活用あるべき贰厂骋投资の评価に向けた、自然言语処理の活用
あるべき贰厂骋投资の评価に向けた、自然言语処理の活用
Takahiro Kubo
?
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
Takahiro Kubo
?
Curiosity may drives your output routine.
Curiosity may drives  your output routine.Curiosity may drives  your output routine.
Curiosity may drives your output routine.
Takahiro Kubo
?
モデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留するモデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留する
Takahiro Kubo
?
2018年12月4日までに『呪术廻戦』を読む理由
2018年12月4日までに『呪术廻戦』を読む理由2018年12月4日までに『呪术廻戦』を読む理由
2018年12月4日までに『呪术廻戦』を読む理由
Takahiro Kubo
?
Graph Attention Network
Graph Attention NetworkGraph Attention Network
Graph Attention Network
Takahiro Kubo
?
础颁尝2018の歩き方
 础颁尝2018の歩き方 础颁尝2018の歩き方
础颁尝2018の歩き方
Takahiro Kubo
?
机械学习で泣かないためのコード设计 2018
机械学习で泣かないためのコード设计 2018机械学习で泣かないためのコード设计 2018
机械学习で泣かないためのコード设计 2018
Takahiro Kubo
?
TISにおける、研究開発の方針とメソッド 2018
TISにおける、研究開発の方針とメソッド 2018TISにおける、研究開発の方針とメソッド 2018
TISにおける、研究開発の方針とメソッド 2018
Takahiro Kubo
?
感情の出どころを探る、一歩进んだ感情解析
感情の出どころを探る、一歩进んだ感情解析感情の出どころを探る、一歩进んだ感情解析
感情の出どころを探る、一歩进んだ感情解析
Takahiro Kubo
?

Pythonではじめる OpenAI Gymトレーニング