狠狠撸

狠狠撸Share a Scribd company logo
Introduction
Object Proposal Methods
Conclusions
Fast Object Proposal Methods
BING & Edge Boxes
山中高夫
情報理工学科
上智大学
文献紹介
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
文献リスト: Fast Object Proposal Methods
[1] J. Hosang, R. Benenson, and B. Schiele, “How good are
detection proposals, really?,” British Machine Vision Conference,
2014.
[2] M.-M. Cheng, Z. Zhang, W.-Y. Lin, and P. Torr, “BING:
Binarized Normed Gradients for Objectness Estimation at 300fps,”
IEEE Conference on Computer Vision and Pattern Recognition,
2014.
[3] Q. Zhao, Z. Liu, and B. Yin, “Cracking BING and Beyond,”
British Machine Vision Conference, 2014.
[4] C. L. Zitnick and P. Dollar, “Edge Boxes: Locating Object
Proposals from Edges,” European Conference on Computer Vision,
2014.
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
Object Proposal
背景
画像中の物体が存在しそうな場所を box として複数提案する
(1,000~10,000 boxes 程度)
できる限り少ない提案 Box 数で画像中に存在する全ての物体
をカバーするように Box を提案する手法が望ましい
応用例として,物体検出の前処理があげられ,Sliding Window
で多数の窓を調べる代わりに,Object Proposal で提案された
Box だけ調べることで効率的に物体を検出できる
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
本発表の目的
目的
Object Proposal Methods の中で
も,リアルタイム処理に適した
BING[Cheng, CVPR2014] と
Edge Boxes[Zitnick, ECCV2014]
の手法を紹介する
adapted from [Hosang, BMVC2014]
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Contents
1 Object Proposal Methods
BING: Binarized Normed Gradients
Edge Boxes
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
BING の概要
画像を様々なサイズ?アスペクト比に変換して勾配振幅を計算
→ 8x8 画素の Box の値が対応する Window の 64 次元勾配特徴
量(NG Feature, gl)
フィルタースコア sl = w · gl
Objectness スコア ol = vi · sl + ti(i は Window のサイズ)
Non-Maximal Suppression (NMS) で重複する Window を除去
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
BING: 学習方法
Objectness スコアの計算式
sl = w · gl
ol = vi · sl + ti
Stage 1: w の学習
線形 SVM を使用する。真の Object Window を Positive デー
タ,ランダムにサンプリングした背景の Window を Negative
データに設定して学習する。
Stage 2: vi, ti の学習
線形 SVM を使用する。学習画像の全 Box に対して,フィル
タースコア sl を計算し,NMS で選択された Box を真の Object
Window からラベリングし,線形 SVM の学習データとする。
学習は画像サイズ i ごとに行う。
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
BING: フィルタ係数の二値化
w の二値化
w ≈ ∑
Nw
j=1 βjaj (aj ∈ {?1, 1}64, βj ∈ ?)
aj = a+
j ? a+
j (a+
j ∈ {0, 1}64)
b ∈ {0, 1}64 とすると,w · b ≈ ∑
Nw
j=1 βj(2a+
j · b ? |b|)
[28] Hare, Sa?ari & Torr, "E?cient online structured output learning for
keypoint-based object tracking," CVPR2012
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
BING: 勾配特徴量の二値化
勾配特徴量 gl の二値化
gl が 8 ビットで表現されているとして,上位 Ng ビットで近似
する
gl ≈ ∑
Ng
k=1 28?kbk,l (bk,l は 64 次元のバイナリ特徴量)
フィルタスコア sl = w · gl ≈ ∑
Nw
j=1 βj ∑
Ng
k=1 Cj,k
ただし,Cj,k = 28?k(2a+
j · bk,l ? |bk,l|)
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
BING: 評価結果
検出 Window の正誤判定基準
バイナリ基底ベクトル数: Nw = 2
勾配特徴量二値化時のビット数: Ng = 4
正誤判定基準: IoU = 0.5
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
BING: 検出例
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Contents
1 Object Proposal Methods
BING: Binarized Normed Gradients
Edge Boxes
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes の概要
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 手法 (1)
Edge Groups & A?nities
与えられた画像の各画素 p に対してエッジ検出を行い,各画素
に主方向 θp とエッジ強度 mp を割り当てる。計算を効率的に
するため,mp > 0.1 の画素をエッジとする。(Fig.1 2 段目)
8 近傍のエッジを連結し,主方向差の和が π/2 になるまで
エッジをグループ化する。(Fig.1 3 段目)
2 つのエッジグループ si, sj 間の a?nity を以下の式で計算
する。
a(si, sj) = | cos(θi ? θij) cos(θj ? θij)|γ
ただし,
θi, θj: それぞれ si, sj の主方向
θij: si, sj の平均位置間の方向
γ: 感度を調節するパラメータ(γ = 2)
2 画素以上離れているエッジグループ間の a?nity は 0 とする。
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 手法 (2)
wb(si) の計算
Bounding Box b に対して,その中に含まれる全てのエッジグ
ループ si に wb(si) ∈ [0, 1] を割り当てる。
- si が Bounding Box に完全に含まれる場合 · · · wb(si) = 1
- 外にある場合や境界につながっている場合 · · · wb(si) = 0
境界につながっているエッジグループの集合を Sb とし,
si ∈ Sb のエッジに対して wb(si) = 0 に設定する。
それ以外の si に対して,以下の式で wb(si) を計算する。
wb(si) = 1 ? maxT ∏
|T|?1
j a(tj, tj+1)
ただし,t1 ∈ Sb, t|T| = si
つまり,上式は si から境界までの最大 a?nity になる経路で計
算する。
境界につながる経路がない場合は wb(si) = 1 である。
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 手法 (3)
Bounding Box Scoring
Bounding Box の Objectness Score を以下の式で計算する。
hb =
∑i wb(si)mi
2(bw + bh)κ
ただし,
mi: エッジグループ si に含む全てのエッジ強度 mp の和
bw, bh: Bounding Box の幅と高さ
κ: パラメータ (κ = 1.5)
Bounding Box 中央のエッジは境界に近いエッジより重要性が
低いことを考慮する。
hin
b = hb ?
∑p∈bin mp
2(bw + bh)κ
ただし,bin は内側の領域を表す(bw/2, bh/2 の領域)
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 手法 (4)
Search Strategy
Bounding Box の候補は,位置,スケール,アスペクト比に対
する Sliding Window で設定する。
ステップサイズは隣の Window との重なりが IoU = α となる
ように設定する。
- スケールの範囲: σ = 1000 画素~画像全体
- アスペクト比の範囲: 1/τ ~ τ (τ = 3)
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 手法 (5)
Re?nement
全ての Sliding Window に対する Objectness Score を計算後,
hin
b が閾値以上の Box に対して,位置を再調整 (re?nement)
する。
位置の再調整では,閾値以上の Box の周辺の位置,スケール,
アスペクト比を網羅的に調べて最大となる Box を検出する。
位置再調整後,Non-Maximal Suppression (NMS) により IoU
が β 以上の Box を除去する。
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 評価結果(パラメータに対する変化)
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 評価結果(提案数と IoU に対する変化)
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 検出例
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
まとめ
Object Proposal は,物体検出などより
複雑な認識処理の前処理として使用さ
れることが想定されているので,でき
る限り高速な処理が望まれる
BING や Edge Boxes は非常に高速な処
理が可能であり,1 枚の処理にかかる
時間は BING が 0.2s,Edge Boxes が
0.3s である
特に Edge Boxes は高速で精度も高い
ことが報告されている [Hosang,
BMVC2014] ので,様々なアプリケー
ションに応用が期待できる。 adapted from [Hosang,
BMVC2014]
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Ad

Recommended

翱产箩别肠迟苍别蝉蝉とその周辺技术
翱产箩别肠迟苍别蝉蝉とその周辺技术
Takao Yamanaka
?
最近のSingle Shot系の物体検出のアーキテクチャまとめ
最近のSingle Shot系の物体検出のアーキテクチャまとめ
Yusuke Uchida
?
[DL輪読会]Human Pose Estimation @ ECCV2018
[DL輪読会]Human Pose Estimation @ ECCV2018
Deep Learning JP
?
実装レベルで学ぶ痴蚕痴础贰
実装レベルで学ぶ痴蚕痴础贰
ぱんいち すみもと
?
Group normalization
Group normalization
Ryutaro Yamauchi
?
計算論的学習理論入門 -PAC学習とかVC次元とか-
計算論的学習理論入門 -PAC学習とかVC次元とか-
sleepy_yoshi
?
[Dl輪読会]introduction of reinforcement learning
[Dl輪読会]introduction of reinforcement learning
Deep Learning JP
?
【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models
Deep Learning JP
?
惭滨搁鲍2013チュートリアル:厂滨贵罢とそれ以降のアプローチ
惭滨搁鲍2013チュートリアル:厂滨贵罢とそれ以降のアプローチ
Hironobu Fujiyoshi
?
深层生成モデルを用いたマルチモーダル学习
深层生成モデルを用いたマルチモーダル学习
Masahiro Suzuki
?
ドメイン适応の原理と応用
ドメイン适応の原理と応用
Yoshitaka Ushiku
?
Mean Teacher
Mean Teacher
harmonylab
?
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
Yusuke Uchida
?
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
Hideki Tsunashima
?
[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]Focal Loss for Dense Object Detection
Deep Learning JP
?
Structure from Motion
Structure from Motion
Ryutaro Yamauchi
?
生成モデルの Deep Learning
生成モデルの Deep Learning
Seiya Tokui
?
Fisher Vectorによる画像認識
Fisher Vectorによる画像認識
Takao Yamanaka
?
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
Naoya Chiba
?
画像生成?生成モデル メタサーベイ
画像生成?生成モデル メタサーベイ
cvpaper. challenge
?
画像の基盘モデルの変迁と研究动向
画像の基盘モデルの変迁と研究动向
nlab_utokyo
?
画像认识の初歩、厂滨贵罢,厂鲍搁贵特徴量
画像认识の初歩、厂滨贵罢,厂鲍搁贵特徴量
takaya imai
?
[DL輪読会]SlowFast Networks for Video Recognition
[DL輪読会]SlowFast Networks for Video Recognition
Deep Learning JP
?
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
Deep Learning JP
?
画像认识と深层学习
画像认识と深层学习
Yusuke Uchida
?
翱辫迟颈尘颈锄别谤入门&最新动向
翱辫迟颈尘颈锄别谤入门&最新动向
Motokawa Tetsuya
?
【DL輪読会】Bridge-Prompt: Toward Ordinal Action Understanding in Instructional Vi...
【DL輪読会】Bridge-Prompt: Toward Ordinal Action Understanding in Instructional Vi...
Deep Learning JP
?
リアルタイムPoint cloudデータのビジュアライゼーションについて
リアルタイムPoint cloudデータのビジュアライゼーションについて
Ryousuke Wayama
?
論文紹介: Fast R-CNN&Faster R-CNN
論文紹介: Fast R-CNN&Faster R-CNN
Takashi Abe
?
いまさら闻けない机械学习の评価指标
いまさら闻けない机械学习の评価指标
圭輔 大曽根
?

More Related Content

What's hot (20)

惭滨搁鲍2013チュートリアル:厂滨贵罢とそれ以降のアプローチ
惭滨搁鲍2013チュートリアル:厂滨贵罢とそれ以降のアプローチ
Hironobu Fujiyoshi
?
深层生成モデルを用いたマルチモーダル学习
深层生成モデルを用いたマルチモーダル学习
Masahiro Suzuki
?
ドメイン适応の原理と応用
ドメイン适応の原理と応用
Yoshitaka Ushiku
?
Mean Teacher
Mean Teacher
harmonylab
?
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
Yusuke Uchida
?
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
Hideki Tsunashima
?
[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]Focal Loss for Dense Object Detection
Deep Learning JP
?
Structure from Motion
Structure from Motion
Ryutaro Yamauchi
?
生成モデルの Deep Learning
生成モデルの Deep Learning
Seiya Tokui
?
Fisher Vectorによる画像認識
Fisher Vectorによる画像認識
Takao Yamanaka
?
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
Naoya Chiba
?
画像生成?生成モデル メタサーベイ
画像生成?生成モデル メタサーベイ
cvpaper. challenge
?
画像の基盘モデルの変迁と研究动向
画像の基盘モデルの変迁と研究动向
nlab_utokyo
?
画像认识の初歩、厂滨贵罢,厂鲍搁贵特徴量
画像认识の初歩、厂滨贵罢,厂鲍搁贵特徴量
takaya imai
?
[DL輪読会]SlowFast Networks for Video Recognition
[DL輪読会]SlowFast Networks for Video Recognition
Deep Learning JP
?
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
Deep Learning JP
?
画像认识と深层学习
画像认识と深层学习
Yusuke Uchida
?
翱辫迟颈尘颈锄别谤入门&最新动向
翱辫迟颈尘颈锄别谤入门&最新动向
Motokawa Tetsuya
?
【DL輪読会】Bridge-Prompt: Toward Ordinal Action Understanding in Instructional Vi...
【DL輪読会】Bridge-Prompt: Toward Ordinal Action Understanding in Instructional Vi...
Deep Learning JP
?
リアルタイムPoint cloudデータのビジュアライゼーションについて
リアルタイムPoint cloudデータのビジュアライゼーションについて
Ryousuke Wayama
?
惭滨搁鲍2013チュートリアル:厂滨贵罢とそれ以降のアプローチ
惭滨搁鲍2013チュートリアル:厂滨贵罢とそれ以降のアプローチ
Hironobu Fujiyoshi
?
深层生成モデルを用いたマルチモーダル学习
深层生成モデルを用いたマルチモーダル学习
Masahiro Suzuki
?
ドメイン适応の原理と応用
ドメイン适応の原理と応用
Yoshitaka Ushiku
?
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
Yusuke Uchida
?
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
Hideki Tsunashima
?
[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]Focal Loss for Dense Object Detection
Deep Learning JP
?
生成モデルの Deep Learning
生成モデルの Deep Learning
Seiya Tokui
?
Fisher Vectorによる画像認識
Fisher Vectorによる画像認識
Takao Yamanaka
?
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
Naoya Chiba
?
画像生成?生成モデル メタサーベイ
画像生成?生成モデル メタサーベイ
cvpaper. challenge
?
画像の基盘モデルの変迁と研究动向
画像の基盘モデルの変迁と研究动向
nlab_utokyo
?
画像认识の初歩、厂滨贵罢,厂鲍搁贵特徴量
画像认识の初歩、厂滨贵罢,厂鲍搁贵特徴量
takaya imai
?
[DL輪読会]SlowFast Networks for Video Recognition
[DL輪読会]SlowFast Networks for Video Recognition
Deep Learning JP
?
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
Deep Learning JP
?
画像认识と深层学习
画像认识と深层学习
Yusuke Uchida
?
翱辫迟颈尘颈锄别谤入门&最新动向
翱辫迟颈尘颈锄别谤入门&最新动向
Motokawa Tetsuya
?
【DL輪読会】Bridge-Prompt: Toward Ordinal Action Understanding in Instructional Vi...
【DL輪読会】Bridge-Prompt: Toward Ordinal Action Understanding in Instructional Vi...
Deep Learning JP
?
リアルタイムPoint cloudデータのビジュアライゼーションについて
リアルタイムPoint cloudデータのビジュアライゼーションについて
Ryousuke Wayama
?

Viewers also liked (16)

論文紹介: Fast R-CNN&Faster R-CNN
論文紹介: Fast R-CNN&Faster R-CNN
Takashi Abe
?
いまさら闻けない机械学习の评価指标
いまさら闻けない机械学习の评価指标
圭輔 大曽根
?
物体検出の话鲍辫用
物体検出の话鲍辫用
Takashi Abe
?
20140131 R-CNN
20140131 R-CNN
Takuya Minagawa
?
搁-颁狈狈の原理とここ数年の流れ
搁-颁狈狈の原理とここ数年の流れ
Kazuki Motohashi
?
Deformable Part Modelとその発展
Deformable Part Modelとその発展
Takao Yamanaka
?
顕着性マップの推定手法
顕着性マップの推定手法
Takao Yamanaka
?
PRML Chapter 5
PRML Chapter 5
Masahito Ohue
?
Fisher線形判別分析とFisher Weight Maps
Fisher線形判別分析とFisher Weight Maps
Takao Yamanaka
?
変分ベイズ法の説明
変分ベイズ法の説明
Haruka Ozaki
?
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
Takao Yamanaka
?
日本最大の即レスサーヒ?ス「アンサー」を支える Amazon DynamoDB
日本最大の即レスサーヒ?ス「アンサー」を支える Amazon DynamoDB
Masahiro Akita
?
KantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object Recognition
belltailjp
?
混合モデルと贰惭アルゴリズム(笔搁惭尝第9章)
混合モデルと贰惭アルゴリズム(笔搁惭尝第9章)
Takao Yamanaka
?
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
Takanori Ogata
?
論文紹介: Fast R-CNN&Faster R-CNN
論文紹介: Fast R-CNN&Faster R-CNN
Takashi Abe
?
いまさら闻けない机械学习の评価指标
いまさら闻けない机械学习の评価指标
圭輔 大曽根
?
物体検出の话鲍辫用
物体検出の话鲍辫用
Takashi Abe
?
搁-颁狈狈の原理とここ数年の流れ
搁-颁狈狈の原理とここ数年の流れ
Kazuki Motohashi
?
Deformable Part Modelとその発展
Deformable Part Modelとその発展
Takao Yamanaka
?
顕着性マップの推定手法
顕着性マップの推定手法
Takao Yamanaka
?
Fisher線形判別分析とFisher Weight Maps
Fisher線形判別分析とFisher Weight Maps
Takao Yamanaka
?
変分ベイズ法の説明
変分ベイズ法の説明
Haruka Ozaki
?
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
Takao Yamanaka
?
日本最大の即レスサーヒ?ス「アンサー」を支える Amazon DynamoDB
日本最大の即レスサーヒ?ス「アンサー」を支える Amazon DynamoDB
Masahiro Akita
?
KantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object Recognition
belltailjp
?
混合モデルと贰惭アルゴリズム(笔搁惭尝第9章)
混合モデルと贰惭アルゴリズム(笔搁惭尝第9章)
Takao Yamanaka
?
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
Takanori Ogata
?
Ad

Similar to 高速な物体候補領域提案手法 (Fast Object Proposal Methods) (20)

ICCV2011 report
ICCV2011 report
Hironobu Fujiyoshi
?
[CVPR読み会]BING:Binarized normed gradients for objectness estimation at 300fps
[CVPR読み会]BING:Binarized normed gradients for objectness estimation at 300fps
Takuya Minagawa
?
Hough forestを用いた物体検出
Hough forestを用いた物体検出
MPRG_Chubu_University
?
VIEW2013 Binarycode-based Object Recognition
VIEW2013 Binarycode-based Object Recognition
Hironobu Fujiyoshi
?
関西CVPRML勉強会 2011.9.23
関西CVPRML勉強会 2011.9.23
Akisato Kimura
?
CVPR 2019 report (30 papers)
CVPR 2019 report (30 papers)
ShunsukeNakamura17
?
2015年12月PRMU研究会 対応点探索のための特徴量表現
2015年12月PRMU研究会 対応点探索のための特徴量表現
Mitsuru Ambai
?
コンピュータビジョンの最新ソフトウェア開発環境 SSII2015 チュートリアル hayashi
コンピュータビジョンの最新ソフトウェア開発環境 SSII2015 チュートリアル hayashi
Masaki Hayashi
?
Object as Points
Object as Points
harmonylab
?
RAPiD
RAPiD
harmonylab
?
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter
Morpho, Inc.
?
画像认识における几何学的不変性の扱い
画像认识における几何学的不変性の扱い
Seiji Hotta
?
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
Takahiro Kubo
?
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
?
【2016.02】肠惫辫补辫别谤.肠丑补濒濒别苍驳别2016
【2016.02】肠惫辫补辫别谤.肠丑补濒濒别苍驳别2016
cvpaper. challenge
?
厂颈蹿迟による特徴点抽出
厂颈蹿迟による特徴点抽出
Masato Nakai
?
[DL Hacks] Objects as Points
[DL Hacks] Objects as Points
Deep Learning JP
?
ICDE2014 勉強会 新井担当分
ICDE2014 勉強会 新井担当分
Junya Arai
?
[CVPR読み会]BING:Binarized normed gradients for objectness estimation at 300fps
[CVPR読み会]BING:Binarized normed gradients for objectness estimation at 300fps
Takuya Minagawa
?
VIEW2013 Binarycode-based Object Recognition
VIEW2013 Binarycode-based Object Recognition
Hironobu Fujiyoshi
?
関西CVPRML勉強会 2011.9.23
関西CVPRML勉強会 2011.9.23
Akisato Kimura
?
2015年12月PRMU研究会 対応点探索のための特徴量表現
2015年12月PRMU研究会 対応点探索のための特徴量表現
Mitsuru Ambai
?
コンピュータビジョンの最新ソフトウェア開発環境 SSII2015 チュートリアル hayashi
コンピュータビジョンの最新ソフトウェア開発環境 SSII2015 チュートリアル hayashi
Masaki Hayashi
?
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter
Morpho, Inc.
?
画像认识における几何学的不変性の扱い
画像认识における几何学的不変性の扱い
Seiji Hotta
?
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
Takahiro Kubo
?
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
?
【2016.02】肠惫辫补辫别谤.肠丑补濒濒别苍驳别2016
【2016.02】肠惫辫补辫别谤.肠丑补濒濒别苍驳别2016
cvpaper. challenge
?
厂颈蹿迟による特徴点抽出
厂颈蹿迟による特徴点抽出
Masato Nakai
?
ICDE2014 勉強会 新井担当分
ICDE2014 勉強会 新井担当分
Junya Arai
?
Ad

高速な物体候補領域提案手法 (Fast Object Proposal Methods)

  • 1. Introduction Object Proposal Methods Conclusions Fast Object Proposal Methods BING & Edge Boxes 山中高夫 情報理工学科 上智大学 文献紹介 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 2. Introduction Object Proposal Methods Conclusions 文献リスト: Fast Object Proposal Methods [1] J. Hosang, R. Benenson, and B. Schiele, “How good are detection proposals, really?,” British Machine Vision Conference, 2014. [2] M.-M. Cheng, Z. Zhang, W.-Y. Lin, and P. Torr, “BING: Binarized Normed Gradients for Objectness Estimation at 300fps,” IEEE Conference on Computer Vision and Pattern Recognition, 2014. [3] Q. Zhao, Z. Liu, and B. Yin, “Cracking BING and Beyond,” British Machine Vision Conference, 2014. [4] C. L. Zitnick and P. Dollar, “Edge Boxes: Locating Object Proposals from Edges,” European Conference on Computer Vision, 2014. 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 3. Introduction Object Proposal Methods Conclusions Object Proposal 背景 画像中の物体が存在しそうな場所を box として複数提案する (1,000~10,000 boxes 程度) できる限り少ない提案 Box 数で画像中に存在する全ての物体 をカバーするように Box を提案する手法が望ましい 応用例として,物体検出の前処理があげられ,Sliding Window で多数の窓を調べる代わりに,Object Proposal で提案された Box だけ調べることで効率的に物体を検出できる 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 4. Introduction Object Proposal Methods Conclusions 本発表の目的 目的 Object Proposal Methods の中で も,リアルタイム処理に適した BING[Cheng, CVPR2014] と Edge Boxes[Zitnick, ECCV2014] の手法を紹介する adapted from [Hosang, BMVC2014] 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 5. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Contents 1 Object Proposal Methods BING: Binarized Normed Gradients Edge Boxes 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 6. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes BING の概要 画像を様々なサイズ?アスペクト比に変換して勾配振幅を計算 → 8x8 画素の Box の値が対応する Window の 64 次元勾配特徴 量(NG Feature, gl) フィルタースコア sl = w · gl Objectness スコア ol = vi · sl + ti(i は Window のサイズ) Non-Maximal Suppression (NMS) で重複する Window を除去 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 7. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes BING: 学習方法 Objectness スコアの計算式 sl = w · gl ol = vi · sl + ti Stage 1: w の学習 線形 SVM を使用する。真の Object Window を Positive デー タ,ランダムにサンプリングした背景の Window を Negative データに設定して学習する。 Stage 2: vi, ti の学習 線形 SVM を使用する。学習画像の全 Box に対して,フィル タースコア sl を計算し,NMS で選択された Box を真の Object Window からラベリングし,線形 SVM の学習データとする。 学習は画像サイズ i ごとに行う。 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 8. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes BING: フィルタ係数の二値化 w の二値化 w ≈ ∑ Nw j=1 βjaj (aj ∈ {?1, 1}64, βj ∈ ?) aj = a+ j ? a+ j (a+ j ∈ {0, 1}64) b ∈ {0, 1}64 とすると,w · b ≈ ∑ Nw j=1 βj(2a+ j · b ? |b|) [28] Hare, Sa?ari & Torr, "E?cient online structured output learning for keypoint-based object tracking," CVPR2012 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 9. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes BING: 勾配特徴量の二値化 勾配特徴量 gl の二値化 gl が 8 ビットで表現されているとして,上位 Ng ビットで近似 する gl ≈ ∑ Ng k=1 28?kbk,l (bk,l は 64 次元のバイナリ特徴量) フィルタスコア sl = w · gl ≈ ∑ Nw j=1 βj ∑ Ng k=1 Cj,k ただし,Cj,k = 28?k(2a+ j · bk,l ? |bk,l|) 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 10. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes BING: 評価結果 検出 Window の正誤判定基準 バイナリ基底ベクトル数: Nw = 2 勾配特徴量二値化時のビット数: Ng = 4 正誤判定基準: IoU = 0.5 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 11. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes BING: 検出例 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 12. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Contents 1 Object Proposal Methods BING: Binarized Normed Gradients Edge Boxes 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 13. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes の概要 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 14. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 手法 (1) Edge Groups & A?nities 与えられた画像の各画素 p に対してエッジ検出を行い,各画素 に主方向 θp とエッジ強度 mp を割り当てる。計算を効率的に するため,mp > 0.1 の画素をエッジとする。(Fig.1 2 段目) 8 近傍のエッジを連結し,主方向差の和が π/2 になるまで エッジをグループ化する。(Fig.1 3 段目) 2 つのエッジグループ si, sj 間の a?nity を以下の式で計算 する。 a(si, sj) = | cos(θi ? θij) cos(θj ? θij)|γ ただし, θi, θj: それぞれ si, sj の主方向 θij: si, sj の平均位置間の方向 γ: 感度を調節するパラメータ(γ = 2) 2 画素以上離れているエッジグループ間の a?nity は 0 とする。 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 15. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 手法 (2) wb(si) の計算 Bounding Box b に対して,その中に含まれる全てのエッジグ ループ si に wb(si) ∈ [0, 1] を割り当てる。 - si が Bounding Box に完全に含まれる場合 · · · wb(si) = 1 - 外にある場合や境界につながっている場合 · · · wb(si) = 0 境界につながっているエッジグループの集合を Sb とし, si ∈ Sb のエッジに対して wb(si) = 0 に設定する。 それ以外の si に対して,以下の式で wb(si) を計算する。 wb(si) = 1 ? maxT ∏ |T|?1 j a(tj, tj+1) ただし,t1 ∈ Sb, t|T| = si つまり,上式は si から境界までの最大 a?nity になる経路で計 算する。 境界につながる経路がない場合は wb(si) = 1 である。 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 16. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 手法 (3) Bounding Box Scoring Bounding Box の Objectness Score を以下の式で計算する。 hb = ∑i wb(si)mi 2(bw + bh)κ ただし, mi: エッジグループ si に含む全てのエッジ強度 mp の和 bw, bh: Bounding Box の幅と高さ κ: パラメータ (κ = 1.5) Bounding Box 中央のエッジは境界に近いエッジより重要性が 低いことを考慮する。 hin b = hb ? ∑p∈bin mp 2(bw + bh)κ ただし,bin は内側の領域を表す(bw/2, bh/2 の領域) 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 17. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 手法 (4) Search Strategy Bounding Box の候補は,位置,スケール,アスペクト比に対 する Sliding Window で設定する。 ステップサイズは隣の Window との重なりが IoU = α となる ように設定する。 - スケールの範囲: σ = 1000 画素~画像全体 - アスペクト比の範囲: 1/τ ~ τ (τ = 3) 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 18. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 手法 (5) Re?nement 全ての Sliding Window に対する Objectness Score を計算後, hin b が閾値以上の Box に対して,位置を再調整 (re?nement) する。 位置の再調整では,閾値以上の Box の周辺の位置,スケール, アスペクト比を網羅的に調べて最大となる Box を検出する。 位置再調整後,Non-Maximal Suppression (NMS) により IoU が β 以上の Box を除去する。 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 19. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 評価結果(パラメータに対する変化) 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 20. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 評価結果(提案数と IoU に対する変化) 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 21. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 検出例 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 22. Introduction Object Proposal Methods Conclusions まとめ Object Proposal は,物体検出などより 複雑な認識処理の前処理として使用さ れることが想定されているので,でき る限り高速な処理が望まれる BING や Edge Boxes は非常に高速な処 理が可能であり,1 枚の処理にかかる 時間は BING が 0.2s,Edge Boxes が 0.3s である 特に Edge Boxes は高速で精度も高い ことが報告されている [Hosang, BMVC2014] ので,様々なアプリケー ションに応用が期待できる。 adapted from [Hosang, BMVC2014] 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods