狠狠撸

OHS#3 論文紹介
Object Detection & Instance Segmentation
半谷

Contents
? Object Detection
? タスクについて
? R-CNN
? Faster R-CNN
? Region Proposal Networkのしくみ
? SSD: Single Shot Multibox Detector
? Instance Segmentation
? タスクについて
? End-to-End Instance Segmentation and Counting with Recurrent
Attention
2

一般物体認識分野でのDeep Learning
? 静止の分類タスクは、CNNによる特徴量抽出および学習により発展
? より高度なタスクである物体検出、物体領域抽出へと発展
Classification Object Detection Semantic
Segmentation
Instance
Segmentation
Plants
http://www.nlab.ci.i.u-tokyo.ac.jp/pdf/CNN_survey.pdf
http://host.robots.ox.ac.uk/pascal/VOC/voc2012/segexamples/index.html
Plants
Plants Plants
より高度
3

Object Detection
紹介する論文：
SSD: Single Shot MultiBox Detector

Object Detection
? 画像中の複数の物体を漏れなく／重複無く検出することが目的。
? 物体の検出精度（Precision）と、漏れなく検出できているかの指標である適合率
（Recall）の関係(Precision-recall curve)から算出した、Average Precision (AP)
が主な指標。
? 実問題への応用が期待され、APのほか予測時の計算時間も重要で、リアルタイム性が求め
られている。
http://host.robots.ox.ac.uk/pascal/VOC/voc2007/
Precision
Recall1
1
面積 = AP
5

主なモデル(1): Regions with CNN
? R-CNN (Regions with CNN)
? 物体領域候補の生成にSelective Search（SS）などの手法を利用
? 生成した領域を画像分類用のCNNに入力し、各領域に何が写っているか（あるいは
背景か）を分類する。
? Recallを確保するためには領域候補が2000程度必要であり、全てをCNNに入力し
計算するため非常に時間が掛かる
? また多段階の学習が必要となり煩雑である
R-CNN: http://arxiv.org/abs/1311.2524 6

主なモデル(2): Faster R-CNN
? Faster R-CNN
? 特徴抽出部分を共通化（これはFast R-CNNで提案された方法）
? 特徴マップを入力に物体領域候補を生成するRegion Proposal Networkを提案
? 300程度の領域候補で十分な精度が確保できる
? 1枚あたり0.2～0.3秒で処理できる
Region Proposal Net
(RPN)
CNN
(特徴抽出）
Classifier
物体領域候補を生成
（～300程度）
各領域候補に写る物体を
分類する
Faster R-CNN: http://arxiv.org/abs/1506.014977

Region Proposal Network
? 特徴マップ上にAnchorを定義（方眼紙に見立てて、各マスの中心のイメージ）
? 各Anchor毎にk個のAnchor Boxを定義（スケールとアスペクト比の組み合わせ）
? 各Anchor Box毎に、物体らしさのスコアと位置?サイズの修正項を予測するように訓練する
Faster R-CNN: http://arxiv.org/abs/1506.01497
画像
特徴
マップ
CNN
(特徴抽出）
???
スケールアスペクト比
×
各アンカーごとにk個のBox
（例: k = 3 × 3）
2k scores
（物体 or 背景）
4k coordinates
（x, y, w, hの
修正項）
H x W x 3 H/16 x W/16 x 3
8

SSD: Single Shot Multibox Detector
Region Proposal Net
(RPN)
CNN
(特徴抽出）
Classifier
① 物体領域候補を生成
（物体らしさのスコア）
② 各クラスに分類
CNN
(特徴抽出）
Region
Proposal
+
Classifier
物体領域候補を生成
（クラス毎のスコア）SSD
Faster
R-CNN
? Faster RCNNよりも高速で精度も良いモデル
? 入力画像サイズの小さいモデル（精度はそこそこ）では58FPSを達成
? Fasterにおいて①領域候補生成、②各領域の特徴ベクトルを切り出して分類、と2段階で
行っていた処理を一気に行う。
? 深さの異なる複数の特徴マップを使い、浅い側は小さい物体、深い側は大きい物体を検出。
SSD: http://arxiv.org/abs/1512.02325
9

? Faster RCNNよりも高速で精度も良いモデル
? 入力画像サイズの小さいモデル（精度はそこそこ）では58FPSを達成
? Fasterにおいて①領域候補生成、②各領域の特徴ベクトルを切り出して分類、と2段階で
行っていた処理を一気に行う。
? 深さの異なる複数の特徴マップを使い、浅い側は小さい物体、深い側は大きい物体を検出。
（深さにより、デフォルトのBoxサイズを変えている）
浅い側の特徴マップからは
小さい物体を検出する
深い側の特徴マップからは
大きい物体を検出する
10

? Pascal VOC 2007のDetectionタスクの結果
? 入力画像サイズが300x300のモデル（SSD300)では58FPSを達成し、mean AP
も70%を超えている。
? 入力画像サイズが500x500のモデル(SSD500)では、Faster R-CNNより精度も高
く処理速度も速い。
11

Instance Segmentation
紹介する論文：
End-to-End Instance Segmentation and Counting with
Recurrent Attention

Instance Segmentation
? 領域分割（Segmentation）
? ピクセル毎のラベルを予測する
? 形状や面積といった情報が得られるため応用先も多く、活発に研究されている。
? タスクの分類
? Semantic Segmentation
? 各ピクセルにクラスのラベルを付与する問題。
? ボトルが4本ある場合でも、全て「ボトルクラス」のラベルをつける
? Instance Segmentation
? 個々の物体ごとに別のラベルを付与する問題
? ボトルが4本ある場合、別々のラベルを付与する
(b) Instance ~ (a) Semantic ~Raw Image
http://host.robots.ox.ac.uk/pascal/VOC/voc2012/segexamples/index.html 13

突然ですが問題です。
葉っぱは何枚あるでしょうか？
http://juser.fz-juelich.de/record/154525/files/FZJ-2014-03837.pdf 14

どのように数えましたか？
http://juser.fz-juelich.de/record/154525/files/FZJ-2014-03837.pdf
? 目線を移しながら一枚一枚注目する
? 一度見たものは記憶しておく
といった感じで数えたのではないでしょうか???？
15

End-to-End Instance Segmentation and
Counting with Recurrent Attention
? Instance Segmentation用のニューラルネットワーク
? ステップ毎に１つの物体に注目して領域分割する
? 一度見た領域は記憶しておく
（人間の数え方を参考にしている）
End-to-End Instance Segmentation and Counting with Recurrent Attention: https://arxiv.org/abs/1605.09410
16

? モデルの全体像：
17

一度見た領域を記憶しておく部品
18

どこに注目するかを決める
19

注目した領域のSegmentationを行う
20

物体が見つかったかどうかの判定を行う
（スコアが0.5以下になったら終了）
21

一度見た部分は記憶する。
（以下繰返し）
22

? 結果（１）葉っぱの領域分割
23

? 結果（2）車両の領域分割
24

狠狠撸

Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3

Recommended

More Related Content

What's hot (20)

Similar to Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3 (20)

Recently uploaded (11)

Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3

Editor's Notes