16. 自己紹介
2014.4 博士(情報理工学)、東京大学
2014.4~2016.3 NTT CS研 研究員
2016.4~ 東京大学 講師 (原田?牛久研究室)
2016.9~ 産業技術総合研究所 協力研究員
2016.12~ 国立国語研究所 共同研究員
2018.4~ オムロンサイニックエックス株式会社
[Ushiku+, ACMMM 2012]
[Ushiku+, ICCV 2015]
画像キャプション生成 主観的な感性表現を持つ
[Yamaguchi+, ICCV 2017]
A guy is skiing with no shirt on and
yellow snow pants.
A zebra standing in a field with a
tree in the dirty background.
[Shin+, BMVC 2016]
A yellow train on the tracks near a
train station.
17. 自己紹介
2014.3 博士(情報理工学)、東京大学
2014.4~2016.3 NTTコミュニケーション科学基礎研究所 研究員
2016.4~2018.9 東京大学 講師 (原田?牛久研究室)
2016.9~ 産業技術総合研究所 協力研究員
2016.12~2018.9 国立国語研究所 共同研究員
2018.4~2018.9 オムロンサイニックエックス株式会社 技術アドバイザ
2018.10~ オムロンサイニックエックス株式会社
Principal Investigator
2019.1~ 株式会社Ridge-I 社外 Chief Research Officer
[Ushiku+, ACMMM 2012]
[Ushiku+, ICCV 2015]
画像キャプション生成 主観的な感性表現を持つ
[Yamaguchi+, ICCV 2017]
A guy is skiing with no shirt on and
yellow snow pants.
A zebra standing in a field with a
tree in the dirty background.
[Shin+, BMVC 2016]
A yellow train on the tracks near a
train station.
18. 自己紹介
2014.3 博士(情報理工学)、東京大学
2014.4~2016.3 NTTコミュニケーション科学基礎研究所 研究員
2016.4~2018.9 東京大学 講師 (原田?牛久研究室)
2016.9~ 産業技術総合研究所 協力研究員
2016.12~2018.9 国立国語研究所 共同研究員
2018.4~2018.9 オムロンサイニックエックス株式会社 技術アドバイザ
2018.10~ オムロンサイニックエックス株式会社
Principal Investigator
2019.1~ 株式会社Ridge-I 社外 Chief Research Officer
[Ushiku+, ACMMM 2012]
[Ushiku+, ICCV 2015]
画像キャプション生成 主観的な感性表現を持つ
[Yamaguchi+, ICCV 2017]
A guy is skiing with no shirt on and
yellow snow pants.
A zebra standing in a field with a
tree in the dirty background.
[Shin+, BMVC 2016]
A yellow train on the tracks near a
train station.
32. 集められたインストラクションの例
? Pass the pool and go indoors
using the double glass doors.
Pass the large table with
chairs and turn left and wait
by the wine bottles that have
grapes by them.
? Go up the stairs and turn
right. Go past the bathroom
and stop next to the bed.
52. 実験設定
? 7189経路を抽出
? 4つに分割
– 既知&訓練データ+既知&検証データ
– 未知&検証データ+未知&評価データ
? 最初はアテンション付き翻訳モデルとして最尤推定による訓練
? 途中から提案するRCMとSILによる訓練に切り替え
? PL: Path Length 生成パスの長さ
? NE: Navigation Error 生成パスの終点とゴールの間の長さ
? OSR: Oracle Success Rate パスがゴールの近くを通る確率
? SR: Success Rate パスがゴールの近くで止まる確率
? SPL: SR weighted by inverse PL PLの逆数で重みづけたSR
1. Turn right and head towards the kitchen.
2. Then turn left, pass a table and enter the
3. Walk down the hallway and turn into the
entry way to your right without doors.
4. Stop in front of the toilet.
61. 実行結果1
? Exit the door and turn left towards the staircase.
? Walk all the way up the stairs, and stop at the top of the stairs.
62. 実行結果1
? Exit the door and turn left towards the staircase.
? Walk all the way up the stairs, and stop at the top of the stairs.
63. 実行結果1
? Exit the door and turn left towards the staircase.
? Walk all the way up the stairs, and stop at the top of the
64. 実行結果1
? Exit the door and turn left towards the staircase.
? Walk all the way up the stairs, and stop at the top of the
65. 実行結果1
? Exit the door and turn left towards the staircase.
? Walk all the way up the stairs, and stop at the top of the
66. 実行結果1
? Exit the door and turn left towards the staircase.
? Walk all the way up the stairs, and stop at the top of the
Intrinsic Reward: 0.53 Result: Success (error = 0m)
67. 実行結果2
? Turn right and go down the stairs.
? Turn left and go straight until you get to the laundry room.
? Wait there.
68. 実行結果2
? Turn right and go down the stairs.
? Turn left and go straight until you get to the laundry room.
? Wait there.
69. 実行結果2
? Turn right and go down the stairs.
? Turn left and go straight until you get to the laundry room.
? Wait there.
70. 実行結果2
? Turn right and go down the stairs.
? Turn left and go straight until you get to the laundry room.
? Wait there.
71. 実行結果2
? Turn right and go down the stairs.
? Turn left and go straight until you get to the laundry room.
? Wait there.
72. 実行結果2
? Turn right and go down the stairs.
? Turn left and go straight until you get to the laundry room.
? Wait there.
Intrinsic Reward: 0.54 Result: Failure (error = 5.5m)
さっき見切れていた laundry room を見過ごしていた
84. Vision + Language…?
For x = 0 to 99,
– CVPR 20xx: here is a great new Vision+Language
dataset everyone should use!!!
– CVPR 20xx+1: oops, nearest neighbors, blind
baselines bet everything…