端端舝

1
陔悝胍薆郖☆汜昜瓜申必奈扑亦件及扑旦氾丞褪悝ㄗ汜昜痄�ロ�悝ㄘ★本立瓜奈
March 16, 2018
漆纏及磊繚軑聆及凶戶及欄ッ趙悝炾
ⅸ捶秫
笢窒湮悝辻迮眭�伕示氾奴弁旦弘伙奈皿

2
磊繚軑䛐及失皿伕奈民
矛奶朮乒犯伙巨生伙幼奈郔苤趙
旮𦵴悝� 欄�趙悝�
袨颷
俴�
�喚

3
欄�趙悝�卞價勿仁失皿伕奈民 (1)
? �趙悝� ＃巨奈斥尼件玄及俴��毛陂腕
? 俴�及謎今毛�喚匹啐�
? �喚互詢仁卅月方丹卅源習ㄗ俴��ㄘ毛�俴嶒悷仄卅互日陂腕
? 陂腕仄凶源習毛蚚中化巨奈斥尼件玄及俴�毛𢜪隅
巨奈斥尼件玄
源習
袨颷卞價勿五俴�毛𢜪隅
悝�け
源習及蜊囡
袨颷紝䛐け
巨奈斥尼件玄及袨颷及芢隅
虐噫
俴�
�喚
袨颷腛痄
譎繚
瞰) 打奈伙卞善絻: +10
打奈伙卞帤善絻: -10

4
? �趙悝� ＃巨奈斥尼件玄及俴��毛陂腕
? 俴�及謎今毛�喚匹啐�
? �喚互詢仁卅月方丹卅源習ㄗ俴��ㄘ毛�俴嶒悷仄卅互日陂腕
? 陂腕仄凶源習毛蚚中化巨奈斥尼件玄及俴�毛𢜪隅
磊繚軑䛐
巨奈斥尼件玄
源習
悝�け
源習及蜊囡
袨颷紝䛐け
虐噫
俴�
�喚
袨颷腛痄
�喚毛𢜪隅允月及互嬪褣

5
? 欄�趙悝� ＃ ☆�喚★毛А戶月
? 諒�犯奈正ㄗ婬政仄凶中俴�及犯奈正ㄘ井日�喚ㄗ+源習ㄘ毛悝�
? А戶凶源習毛蚚中化ㄛ巨奈斥尼件玄及�五ㄗ俴�ㄘ毛𢜪隅
磊繚軑䛐
巨奈斥尼件玄
源習
悝�け
源習及蜊囡
袨颷紝䛐け
虐噫
俴�
袨颷腛痄
�喚
婬政仄凶中俴�犯奈正

6
Activity Forecasting
? Markov Decision Process (MDP)
? 政婓及袨颷午俴� 井日袨颷互腛痄
? 政婓華午痄�源砃井日政婓華互腛痄
? 俴�腢亼匹痄�磊繚互𢜪引月
? Activity Forecasting [Kitani et al., 2012]
? �砓及俴�毛軑䛐允月�觳偞隅
? 俴�卞方曰劐趙仄凶袨颷ㄗ釱㻢ㄘ及炵蹈互磊繚軑䛐磐彆
↗ Path prediction: 跪媆覦及釱㻢毛眻諉芢隅?堤薯
袨颷
俴�
�喚

7
Activity Forecasting [Kitani, et al., 2012]
? �嶲及痄�磊繚反笚�及虐噫卞湮五仁荌�
? �耋?餜耋?膘昜
? 欄�趙悝�毛蚚中化俴��毛陂腕
? Maximum Entropy Inverse Reinforcement Learning
(MaxEnt IRL)
Physical attribute Forecast distribution

8
汜昜及痄�磊繚 ~僕籵萸~
? �嶲
? 餜耋毛疑氏匹痄�
? 豪�支膘昜反痄�仄卅中
? 餜俴氪及痄�犯奈正井日��毛悝�
? 欄�趙悝�
? 左左立朮瓜幼玉伉
? 漆奻毛鵁俴
? �華反鵁俴仄卅中
? GPS匹�䛐仄凶鵁俴犯奈正毛妏蚚褫夔
? 欄�趙悝�匹軑䛐匹五月及匹反ˋ

9
汜昜及痄�磊繚 ~綃中~
? �嶲
? 眻�腔卅痄�毛�隅
? 左左立朮瓜幼玉伉
? 衯隙允月磊繚毛午勻化中月
暫湔忒楊分午丹引仁中井卅中

10
醴腔
? 眻�腔匹卅中痄�磊繚及軑䛐
? �嶲眕俋及�砓及痄�磊繚毛軑䛐褫夔卞
失皿伕奈民
? 袨颷諾嶲毛媆嶲源砃卞��
? �砓互打奈伙卞善絻允月引匹及媆嶲ㄗ俴�隙杅ㄘ毛迵尹月
? 眻�腔匹卅中�五毛蕉𩬅

11
隅膽 1
袨颷: ? ＃ �砓及弇离
俴�: ? ＃ �砓及痄�源砃
�聑: ? = ?0, ?0 , ?1, ?1 , ＃
杻釾矛弁玄伙ㄗ穴永皿ㄘ: ?(??)

12
枑偶忒楊及袨颷諾嶲
? 媆嶲源砃卞��
? �僅?磊僅?鵁俴媆嶲ㄗ俴�隙杅ㄘ
? ㄠ隙及俴�匹媆嶲源砃尺ㄠ媆覦ㄗ旦氾永皿ㄘ筳戈
Start Goal Environment (land) Trajectory 1 Trajectory 2
t = 0 t = 1 t = 2 t = 3 t = 4 t = 5 t = 6
? = ?, ?, ?

13
隅膽 2
? 欄�趙悝�卞云仃月�喚
? 笭心矛弁玄伙午杻釾矛弁玄伙及�倛磐磁匹桶政
丐月袨颷??匹腕日木月�喚
丐月�聑?匹腕日木月�喚
? ??; ? = ?T ?(??)
? ?; ? =
?
?(??; ?) =
?
? ? ?(??)
∥
迵尹日木化中月
(赻煦匹𨃨�允月)
∥
仇木毛А戶凶中!
悝�犯奈正及俴�毛婬政允月方丹卅�喚毛А戶月
↙ 笭心矛弁玄伙毛А戶月
欄�趙悝�

14
欄�趙悝�及失皿伕奈民
? �倰�賒楊 [Ng, et al., 2000]
? 手勻午手嘉萎腔卅失皿伕奈民
? Apprenticeship learning
[Abbeel, et al., 2004]
? Max margin楊?Projection楊毛妏勻化?毛А戶月
? Maximum entropy IRL [Ziebart, et al., 2008]
? 復薹腔卅忒楊卞��
? Maximum Entropy Deep IRL [Wulfmeir, et al., 2015]
? 旮𦵴悝�毛妏丹倛卞��

15
�聑毛復薹腔卞隅膽
? 丐月杻釾矛弁玄伙?午由仿丟奈正?互迵尹日木凶午允月
? ?及手午匹ㄛ�聑?毛龰曰丹月復薹
? Maximum entropy distribution匹隅膽
? = ? =
0.1
?
0.6
? ? ? =
exp ? ?T ? ??
?(?)
≦ exp
?
?T ? ??

16
ヽ渾��喚
? 復薹?(?|?)及手午匹腕日木月�喚及ヽ渾�
? 悝�犯奈正午肮元方丹卅�聑毛軑䛐ㄗ汜傖ㄘ允月
? 巨平旦由奈玄午肮元�喚互腕日木月反內
? 腕日木月杻釾矛弁玄伙及濛搪�ㄗヽ渾�ㄘ互肮元卞卅月反內
? ? ? ? ?(?; ?) = ? ? ? ?
?
?T ?(??) = ?T ? ? ? ? ?
?
?(??)
? ? ? ?
?
?(??) =
?
?( ??)
↗ ?? 悝�犯奈正及釱㻢ㄗ蹈ㄘ

17
悝�源楊
? 郔蚧芢隅ㄗmaximum likelihood estimation; MLEㄘ
? 悝�犯奈正及�聑 ?及蚧僅毛郔湮趙允月 ?毛А戶月
? Exponentiated gradient descent匹?載陔
1. 僑饜毛�呾
2. 笭心矛弁玄伙?毛載陔
? = ?????? ? ? ? = ?????? ? log ?( ?|?)
?? ? =
?
?( ??) ? ? ? ? ?
?
?(??)
? ↘ ? exp{ ???(?)}

18
悝�?氾旦玄源楊ㄗ復薹煦票及�呾源楊ㄘ
? Backward pass
? 丐月袨颷井日打奈伙尺砃井丹俴�毛芢隅
? 蕕諉允月袨颷及�喚午及船煦毛�呾
? �喚互湮五中幻升俴�及復薹互詢仁卅月
? Forward pass
? 芢隅仄凶俴�毛手午卞復薹煦票毛汜傖
? 旦正奈玄卞郔湮及復薹毛悵厥
? 芢隅仄凶復薹煦票毛妏勻化ㄛ復薹�毛�唸

19
啐�灍歠
? 2意�及偞隅匹灍歠
灍歠1: 磊繚軑䛐 [Hirakawa, et al., 2017]
? 旦正奈玄井日打奈伙引匹及磊繚毛
復薹煦票匹堤薯
灍歠2: セ𢖯仄凶�聑及娗嶲
? �聑及珨窒煦毛セ𢖯今六ㄛ磊繚軑䛐
? 跪袨颷匹及郔湮及復薹及俴�毛腢亼仄ㄛ
�聑ㄗ釱㻢蹈ㄘ毛堤薯
岈ロ卞方曰云�六匹五引六氏

20
犯奈正本永玄
? GPS logger匹�䛐仄凶左左立朮瓜幼玉伉及鵁俴犯奈正
? �僅?磊僅?鵁俴媆嶲
? 左旦: 53, 丟旦: 53
? �䛐嶱宎華萸井日郔手褩木凶華萸引匹及⑵耋ㄝ
? 湮五卅セ𢖯及卅中手及
? 悝�: 80%ㄛ氾旦玄: 20%妏蚚
左旦及�聑丟旦及�聑

21
杻釾穴永皿?袨颷諾嶲扔奶朮
? �?漆及ロ�毛手午卞釬傖
? 袨颷諾嶲
? �僅: 200
? 磊僅: 300
? 鵁俴媆嶲: 600

22
灍歠1及磐彆 ~左旦~
? �華毛旌仃月方丹卅復薹煦票毛汜傖
? 衯隙毛蕉𩬅匹五化中月及井ˋ
? 煦票互𣷣互勻凶分仃卞�尹月
媆嶲蕉𩬅丐曰媆嶲蕉𩬅卅仄

23
灍歠1及磐彆 ~丟旦~
? �華毛旌仃月方丹卅復薹煦票毛汜傖
? 衯隙毛蕉𩬅匹五化中月及井ˋ
? 煦票互𣷣互勻凶分仃卞�尹月
媆嶲蕉𩬅丐曰媆嶲蕉𩬅卅仄

24
引午戶
? 衯隙允月方丹卅痄�毛蕉𩬅仄凶磊繚軑䛐忒楊毛枑偶
? 欄�趙悝�ㄗMaxEnt IRLㄘ矛奈旦
? 袨颷諾嶲毛媆嶲源砃卞��
? 打奈伙尺善絻允月引匹及俴�隙杅毛隴尨腔卞迵尹月
? 眻�腔卅磊繚眕俋毛軑䛐褫夔
? 踏摽及軑隅
? 媆嶲源砃卞劐趙允月杻釾及爀⻌
? 絅珗
? 毞緊
? �薹腔卅�呾失伙打伉朮丞及蕉偶
? 政婓及悝�媆嶲: 3~4゜ㄗ32旦伊永玉�I燴ㄘ

端端舝

漆纏及磊繚軑聆及凶戶及欄ッ趙悝炾

Recommended

More Related Content

What's hot (20)

Similar to 漆纏及磊繚軑聆及凶戶及欄ッ趙悝炾 (20)

漆纏及磊繚軑聆及凶戶及欄ッ趙悝炾

Editor's Notes