16. 自己紹介
2014.4 博士(情報理工学)、東京大学
2014.4~2016.3 NTT CS研 研究員
2016.4~ 東京大学 講師 (原田?牛久研究室)
2016.9~ 産業技術総合研究所 協力研究員
2016.12~ 国立国語研究所 共同研究員
2018.4~ オムロンサイニックエックス株式会社
技術アドバイザ(NEW!!)
[Ushiku+, ACMMM 2012]
[Ushiku+, ICCV 2015]
画像キャプション生成 主観的な感性表現を持つ
画像キャプション生成
動画の特定区間と
キャプションの相互検索
[Yamaguchi+, ICCV 2017]
A guy is skiing with no shirt on and
yellow snow pants.
A zebra standing in a field with a
tree in the dirty background.
[Shin+, BMVC 2016]
A yellow train on the tracks near a
train station.
17. 自己紹介
2014.3 博士(情報理工学)、東京大学
2014.4~2016.3 NTTコミュニケーション科学基礎研究所 研究員
2016.4~2018.9 東京大学 講師 (原田?牛久研究室)
2016.9~ 産業技術総合研究所 協力研究員
2016.12~2018.9 国立国語研究所 共同研究員
2018.4~2018.9 オムロンサイニックエックス株式会社 技術アドバイザ
2018.10~ オムロンサイニックエックス株式会社
Principal Investigator
2019.1~ 株式会社Ridge-I 社外 Chief Research Officer
[Ushiku+, ACMMM 2012]
[Ushiku+, ICCV 2015]
画像キャプション生成 主観的な感性表現を持つ
画像キャプション生成
動画の特定区間と
キャプションの相互検索
[Yamaguchi+, ICCV 2017]
A guy is skiing with no shirt on and
yellow snow pants.
A zebra standing in a field with a
tree in the dirty background.
[Shin+, BMVC 2016]
A yellow train on the tracks near a
train station.
18. 自己紹介
2014.3 博士(情報理工学)、東京大学
2014.4~2016.3 NTTコミュニケーション科学基礎研究所 研究員
2016.4~2018.9 東京大学 講師 (原田?牛久研究室)
2016.9~ 産業技術総合研究所 協力研究員
2016.12~2018.9 国立国語研究所 共同研究員
2018.4~2018.9 オムロンサイニックエックス株式会社 技術アドバイザ
2018.10~ オムロンサイニックエックス株式会社
Principal Investigator
2019.1~ 株式会社Ridge-I 社外 Chief Research Officer
[Ushiku+, ACMMM 2012]
[Ushiku+, ICCV 2015]
画像キャプション生成 主観的な感性表現を持つ
画像キャプション生成
動画の特定区間と
キャプションの相互検索
[Yamaguchi+, ICCV 2017]
A guy is skiing with no shirt on and
yellow snow pants.
A zebra standing in a field with a
tree in the dirty background.
[Shin+, BMVC 2016]
A yellow train on the tracks near a
train station.
いよっ!job-hopp…
関東CV勉強会のおかげで
転職も兼職もできました!
32. 集められたインストラクションの例
? Pass the pool and go indoors
using the double glass doors.
Pass the large table with
chairs and turn left and wait
by the wine bottles that have
grapes by them.
? Go up the stairs and turn
right. Go past the bathroom
and stop next to the bed.
52. 実験設定
R2Rデータセットを利用
? 7189経路を抽出
? 4つに分割
– 既知&訓練データ+既知&検証データ
– 未知&検証データ+未知&評価データ
提案手法の学習方法
? 最初はアテンション付き翻訳モデルとして最尤推定による訓練
? 途中から提案するRCMとSILによる訓練に切り替え
評価指標
? PL: Path Length 生成パスの長さ
? NE: Navigation Error 生成パスの終点とゴールの間の長さ
? OSR: Oracle Success Rate パスがゴールの近くを通る確率
? SR: Success Rate パスがゴールの近くで止まる確率
? SPL: SR weighted by inverse PL PLの逆数で重みづけたSR
1. Turn right and head towards the kitchen.
2. Then turn left, pass a table and enter the
hallway.
3. Walk down the hallway and turn into the
entry way to your right without doors.
4. Stop in front of the toilet.
61. 実行結果1
? Exit the door and turn left towards the staircase.
? Walk all the way up the stairs, and stop at the top of the stairs.
62. 実行結果1
? Exit the door and turn left towards the staircase.
? Walk all the way up the stairs, and stop at the top of the stairs.
63. 実行結果1
? Exit the door and turn left towards the staircase.
? Walk all the way up the stairs, and stop at the top of the
stairs.
64. 実行結果1
? Exit the door and turn left towards the staircase.
? Walk all the way up the stairs, and stop at the top of the
stairs.
65. 実行結果1
? Exit the door and turn left towards the staircase.
? Walk all the way up the stairs, and stop at the top of the
stairs.
66. 実行結果1
? Exit the door and turn left towards the staircase.
? Walk all the way up the stairs, and stop at the top of the
stairs.
Intrinsic Reward: 0.53 Result: Success (error = 0m)
67. 実行結果2
? Turn right and go down the stairs.
? Turn left and go straight until you get to the laundry room.
? Wait there.
68. 実行結果2
? Turn right and go down the stairs.
? Turn left and go straight until you get to the laundry room.
? Wait there.
69. 実行結果2
? Turn right and go down the stairs.
? Turn left and go straight until you get to the laundry room.
? Wait there.
70. 実行結果2
? Turn right and go down the stairs.
? Turn left and go straight until you get to the laundry room.
? Wait there.
71. 実行結果2
? Turn right and go down the stairs.
? Turn left and go straight until you get to the laundry room.
? Wait there.
72. 実行結果2
? Turn right and go down the stairs.
? Turn left and go straight until you get to the laundry room.
? Wait there.
Intrinsic Reward: 0.54 Result: Failure (error = 5.5m)
さっき見切れていた laundry room を見過ごしていた
84. Vision + Language…?
For x = 0 to 99,
– CVPR 20xx: here is a great new Vision+Language
dataset everyone should use!!!
– CVPR 20xx+1: oops, nearest neighbors, blind
baselines bet everything…