10. 动画认识の流れ – Sparse, Dense and Deep
Sparse Space-Time feature Dense Space-Time feature Deeply-Learned Representation
34. Two-stream ConvNetsの基本的な情報
? 考案者
– Karen Simonyan (発表当時Oxford所属、現Deep Mind)
– NIPS2014
? ?法
– RGBのみでなく、時間情報を画像に投影したフロー画像に対してCNN
40. IDTとTwo-stream ConvNetsの統合: TDD
? TDD(Trajectory-pooled Deep-convolutional Descriptors)
– 動線抽出まではIDTと同様
– TDD:畳み込みマップから値を抽出
Feature extraction
(HOG, HOF, MBH, Traj.)
Fisher Vectors (FVs)
x x x
x x
Feature extraction
(spa4, spa5, tem3, tem4)
Fisher Vectors (FVs)
xxxxx x x x xx x xxx x xxxxx x x x xx x xxx x
48. What Actions are Needed? (ICCV 2017)
– アノテーション/アルゴリズム構築等への提?
– マルチラベル,より詳細説明かつ物体/?体関節情報が重
49. What makes a video a video (CVPR 2018)
– 動画から重要フレームを選択/?成して認識
– 動きを学習しているのではなく,実は??から識別しや
54. 提案?法の問題設定
? 2つの?動間に遷移?動 (TA; Transitional Action)を挿?
– 予測のためのヒントがTAに含有: 早期?動認識より時間的に早く認識
– TAの認識が即ち次?動の予測: ?動予測より安定した予測
Short-term action prediction
recognize “cross” at time t5
【Previous works】
Early action recognition
recognize “cross” at time t9
Walk straight
Walk straight – Cross
(Transitional action)
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12
55. 提案?法の問題設定
? 2つの?動間に遷移?動 (TA; Transitional Action)を挿?
– 予測のためのヒントがTAに含有: 早期?動認識より時間的に早く認識
– TAの認識が即ち次?動の予測: ?動予測より安定した予測
手法 設定
f (F1...t
) → At
f (F1...t?L
) → At
f (F1...t
) → At+L
f (F1...t
) → At+L