狠狠撸

狠狠撸Share a Scribd company logo
第28回 CV勉強会@関東
コンピュータビジョン
最先端ガイド5
Multi-View Stereo #3
Mar. 28, 2015
Hiroki Mizuno
1
話す場所
?? 複数画像からの三次元復元手法
1.? はじめに
2.? システム概要と構成上の注意
1.? 画像収集
2.? カメラパラメータ推定
3.? 密な形状復元
1.? 最先端のMVS研究例
3.? 多眼ステレオ (Multi-View Stereo)
1.? フォトメトリックコンシステンシー
2.? デプスマップ復元
3.? デプスマップからのメッシュ復元
4.? 復元結果
4.? むすび
2
密な形状復元
?? Structure from Motion (SfM) の結果
–?カメラパラメータ
–?カメラ間の対応点 (特徴点) の三次元点群
= 疎な形状復元
3
SfM
bundlerのExamplesより借用
密な形状復元
4
密な形状復元
http://www.di.ens.fr/pmvs/gallery.html 5
密な形状復元
6http://www.di.ens.fr/pmvs/gallery.html
Multi-View Stereo
?? What's Multi-View Stereo
–?キャリブレーション済みの多視点画像から高
精度?高密度な三次元形状復元
?? 長所
–?高解像度
–?撮影速度
–?価格
?? 短所
–?テクスチャが必要
–?リアルタイム復元が困難
7
Multi-View Stereo Algorithm サーベイ
?? A Comparison and Evaluation of Multi-View
Stereo Reconstruction Algorithm
–? CVPR 2006
–? Authors :
?? Steven M. Seitz
?? Brain Curless
?? James Diebel
?? Daniel Scharstein
?? Richard Szeliski
?? 各種アルゴリズムの分類
?? 復元性能のベンチマーク?ランキング
8
Multi-View Stereo taxonomy
?? Scene representation
?? Photo-consistency measure
?? Visibility model
?? Shape prior
?? Reconstruction algorithm
?? Initialization requirements
9
Scene representation
?? 取り扱う3次元空間の表現方法
–?Volume
–?Polygon Mesh
–?Set of depth maps
10
Scene representation
?? Volume
–?3次元空間をGrid状に分割した空間
?? Voxel
?? Level-Set
Voxel
?? 各Gridにオブジェクトの占有率(二値)を格納
Level-Set
?? 各Gridに、最も近い面までの距離を格納
11
Scene representation
?? Polygon Mesh
–?頂点とそれを繋ぐ面のセット
12
Scene representation
?? Set of depth maps
–?各カメラのピクセルごとの深度情報集合
13
Photo-consistency measure
?? 画像間の「見え」の対応を計算する方法
–?Scene space
–?Image space
?? 反射モデル
–?多くのアルゴリズムは"Lambertモデル"を仮定
?? 見えが視点位置に依存しない
?? 陰影は光源と面の傾きのみに依存
–?最近 (2006年時点) の新しいアルゴリズムでは
BRDFなどを想定したものもある
14
Photo-consistency measure
?? Scene space
–?シーン中の点を各カメラに投影しPhoto-
consistencyを計算
–?Photo-consistencyはSSDやNCCで計算するこ
とが一般的
15
538 Computer Vision: Algorithms and Applications (Septemb
p
x1
x0
(R,t)
p∞
e1e0c0 c1
epipolar plane
p
(R,t)
c0
epipolar
lines
x
0
e0 e1
l0
Photo-consistency measure
?? Image space
–?カメラ画像をシーンに投影してPhoto-
consistencyを計算
16
11.1 Epipolar geometry 541
Virtual camera
d
x
y
Input image k
u
v
Homography:
u = H x
x
y
k
d
k
(a) (b)
Visibility model
?? 各カメラでの可視?不可視の判断方法
–? オクルージョンの問題
?? Geometric
–? 真面目に取り組むアプローチ
–? 基本的にチキン?エッグ問題なので、カメラ配置に制約を
持たせるなどで対応
?? Quasi-geometric
–? 近似情報を使うアプローチ
–? Visual Hullなどで粗い復元をしてからPhoto-Consistencyを
計算
?? Outlier-based
–? 外れ値を無視するアプローチ
–? "複数の画像からのphoto-consistency"で説明されているア
プローチもこれに該当
17
Shape prior
?? 形状に対する事前知識モデル
–? Photo-consistencyだけでは失敗する
–? 特にTextureのない領域
?? Minimal Surface
–? 面は滑らかである
–? 曲率の高い部分は苦手
–? Level-set, mesh-based algorithm
?? Maximal Surface
–? 空間を削る系のアプローチ
–? 輝度が一致する解が見つかればその場で停止
–? 高い曲率も表現できる
–? 全体的に復元結果が大きくなる傾向になる
–? Voxel-coloring, Space carving
?? Image-based
–? 近傍PixelのDepthはSmooth
–? 2D Markov Random Field
18
Reconstruction algorithm
?? 3D Volume
–? Volumeの各格子でコスト関数を計算
–? その後、Surfaceを抽出
–? Voxel-coloring, Volumetric MRF
?? Evolving surface
–? 徐々に面を形成してくアプローチ
–? Level-set, Space carving
?? Depth map
–? 複数のDepth mapを独立に計算し、統合
?? Feature Point
–? 疎な再構成を行ってから、それらを補間
19
Initialization requirements
?? 初期化の要件
–?Rough Bounding Box or Volume
?? Space carving
?? Level-set (質の高い初期値が必要)
–?Foreground/background segmentation
?? silhouette
–?Range of disparity or depth values
?? Image-space algorithm
20
Benchmark Datasets
21
bird dogs
lti-view datasets with laser-scanned 3D models.
317 camera positions and orientations for the temple
gaps are due to shadows. The 47 cameras correspond-
g dataset are shown in blue and red, and the 16 sparse
only in red.
at serves as an initial estimate of scene geom-
31,47,48].
tion of 640 × 480 pixels att
arm. At this resolution, a pix
0.25mm on the surface of th
10cm × 16cm × 8cm, and th
The system was calibrated
tion grid from 68 viewpoints
[61] to compute intrinsic an
these parameters, we compu
and rotational offset relative t
abling us to determine the cam
as a function of any desired a
The target object sits on
center of the gantry sphere an
lights. Because the gantry c
certain viewpoints, we double
two different arm con?gurat
images. After shadowed im
we obtained roughly 80% cov
resulting images, we created
corresponding to a full hemis
temple temple model
temple
dino
カメラ配置??47視点
カメラ解像度?640x480
Temple
10x16x8 cm
Dino
7x9x7 cm
Benchmark Result
22
http://vision.middlebury.edu/mview/eval/
最先端のMVS研究例
?? "Silhouette and stereo fusion for 3D object modeling"
–? CVIU 2004
–? ターンテーブルを使い、10度ごとに画像取得
–? Visual Hull → Polygon Mesh復元
–? レーザレンジセンサーレベルの復元に成功
23
Input Image Reconstructed Model 頂点数 114,496点
Gouraud shading Textured
最先端のMVS研究例
?? "A Globally Optimal Algorithm for Robust TV-L1"
–? ICCV2007
–?中間データとしてDepth-Mapを保持
–?複数のDepth-Mapを併合することでポリゴン
メッシュ復元
24
(a) Depth image #1 (b) Depth image #2 (c) Mesh view #1 (d) Mesh view #2
Figure 3. Selected depth images and the ?nal mesh (379958 triangles) for the “Dino” dataset.
最先端のMVS研究例
?? Depth-Map復元の利点
–?三次元でなく、二次元の画像でドメインでの
問題
–?リアルタムでの復元も可能
25
最先端のMVS研究例
?? "Towards Internet-scale Multi-view Stereo "
–? CVPR 2010
–? 法線付きの点群として3次元復元
–? 大規模MVS
26
cale Multi-view Stereo
Steven M. Seitz1,2
Richard Szeliski3
Washington 3
Microsoft Research
Figure 1. Our dense reconstruction of Piazza San Marco (Venice)
Pizza San Marco
(Venice)
視点数 : 13,703
点群数 : 27,707,825
最先端のMVS研究例
?? 大規模MVSのChallenge
–?ビュークラスタリング問題
?? SfMの出力からMVSに必要な視点をクラスタリング
–?PCクラスタで並列化
?? とはいえ、数時間はかかる
27
公開されている無償ソフトウェア
Structure from Motion (SfM)
–? Bundler
?? Photo Tourismはこれを使ってる
–? Voodoo Camera Tracker
?? 動画からのSfM
Multi-View Stereo (MVS)
–? Patch-based Multi-view Stereo (PMVS)
–? Poisson Surface Reconstruction
?? 法線付き点群からのMesh生成
Web Service
–? My3DScanner (サービス終了???)
?? Bundler + PMVS + Poisson Surface Reconstruction
–? Photosynth
–? Automatic Reconstruction Conduit
Viewer
–? MeshLab
28

More Related Content

What's hot (20)

PDF
厂尝础惭チュートリアル大会资料(翱搁叠-厂尝础惭)
Masaya Kaneko
?
PPTX
SLAM勉強会(3) LSD-SLAM
Iwami Kazuya
?
PPTX
LSD-SLAM:Large Scale Direct Monocular SLAM
EndoYuuki
?
PDF
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII
?
PPTX
颁狈狈-厂尝础惭ざっくり
EndoYuuki
?
PDF
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Masaya Kaneko
?
PDF
SSII2021 [OS3] 広域環境の3D計測と認識 ~ 人が活動する場のセンシングとモデル化 ~(オーガナイザーによる冒頭の導入)
SSII
?
PDF
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII
?
PPTX
論文読み会2018 (CodeSLAM)
Masaya Kaneko
?
PDF
第41回関東CV勉強会 CNN-SLAM
邦洋 長谷川
?
PDF
论文読み会(顿别惭辞狈;颁痴笔搁2017)
Masaya Kaneko
?
PPTX
Camera calibration
Takahashi Kosuke
?
PDF
論文紹介:Using the Forest to See the Trees: A Graphical. Model Relating Features,...
Takuma Yagi
?
PDF
Probabilistic Graphical Models 輪読会 #1
Takuma Yagi
?
PDF
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII
?
PDF
Neural scene representation and rendering の解説(第3回3D勉強会@関東)
Masaya Kaneko
?
PDF
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)
Takuma Yagi
?
PPT
Light weightbinocular sigasia2012_face
ishii yasunori
?
PDF
确率的深层学习における中间层の改良と高性能学习法の提案
__106__
?
PPTX
[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...
Deep Learning JP
?
厂尝础惭チュートリアル大会资料(翱搁叠-厂尝础惭)
Masaya Kaneko
?
SLAM勉強会(3) LSD-SLAM
Iwami Kazuya
?
LSD-SLAM:Large Scale Direct Monocular SLAM
EndoYuuki
?
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII
?
颁狈狈-厂尝础惭ざっくり
EndoYuuki
?
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Masaya Kaneko
?
SSII2021 [OS3] 広域環境の3D計測と認識 ~ 人が活動する場のセンシングとモデル化 ~(オーガナイザーによる冒頭の導入)
SSII
?
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII
?
論文読み会2018 (CodeSLAM)
Masaya Kaneko
?
第41回関東CV勉強会 CNN-SLAM
邦洋 長谷川
?
论文読み会(顿别惭辞狈;颁痴笔搁2017)
Masaya Kaneko
?
Camera calibration
Takahashi Kosuke
?
論文紹介:Using the Forest to See the Trees: A Graphical. Model Relating Features,...
Takuma Yagi
?
Probabilistic Graphical Models 輪読会 #1
Takuma Yagi
?
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII
?
Neural scene representation and rendering の解説(第3回3D勉強会@関東)
Masaya Kaneko
?
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)
Takuma Yagi
?
Light weightbinocular sigasia2012_face
ishii yasunori
?
确率的深层学习における中间层の改良と高性能学习法の提案
__106__
?
[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...
Deep Learning JP
?

Viewers also liked (20)

PDF
cvsaisentan5 Multi View Stereo 3.3
Takuya Minagawa
?
PDF
惭滨搁鲍2013チュートリアル:厂滨贵罢とそれ以降のアプローチ
Hironobu Fujiyoshi
?
PDF
実践コンピュータビジョン 3章 画像間の写像
yaju88
?
PDF
2008-12-07_PTAM_Kansai.AR
masayashi Kobayashi
?
PPTX
Structure from motion
Fatima Radi
?
PPTX
エンジニアのプレゼン资料作成/入门
iKenji
?
PDF
翱搁叠-厂尝础惭を动かしてみた
Takuya Minagawa
?
PPTX
颁别蝉颈耻尘を用いた3次元リアルタイムデータの可视化について
Ryousuke Wayama
?
PPTX
画像処理ライブラリ OpenCV で 出来ること?出来ないこと
Norishige Fukushima
?
PDF
厂颈蹿迟特徴量について
la_flance
?
PDF
尝颈顿础搁点群と厂蹿惭点群との位置合わせ
Takuya Minagawa
?
PDF
滨罢系エンジニアのためのプレゼンテーション入门
Masahito Zembutsu
?
PDF
初期研修医のための学会スライドのキホン
k-kajiwara
?
PDF
【企画书】搁别肠别搁别肠辞:新规事业讨议用社内资料
Find Job Startup
?
PDF
【企画書】UIscope:MOVIDA JAPAN_Demo Day用資料
Find Job Startup
?
PDF
P2 P 奨学金プロジェクト Ver3 5
Daisuke Miyoshi
?
PDF
【企画書】omiai:IVS_LAUNCH PAD用資料
Find Job Startup
?
PDF
T TIME 滞在時間割キャンペーン(第4回販促会議企画コンペティション)
Keita Takizawa
?
PDF
【企画书】驳补尘产补!(ガンバ):サムライインキュベート様向け冲企画プレゼン资料
Find Job Startup
?
PDF
【企画书】チャットワーク:社内検讨用资料
Find Job Startup
?
cvsaisentan5 Multi View Stereo 3.3
Takuya Minagawa
?
惭滨搁鲍2013チュートリアル:厂滨贵罢とそれ以降のアプローチ
Hironobu Fujiyoshi
?
実践コンピュータビジョン 3章 画像間の写像
yaju88
?
2008-12-07_PTAM_Kansai.AR
masayashi Kobayashi
?
Structure from motion
Fatima Radi
?
エンジニアのプレゼン资料作成/入门
iKenji
?
翱搁叠-厂尝础惭を动かしてみた
Takuya Minagawa
?
颁别蝉颈耻尘を用いた3次元リアルタイムデータの可视化について
Ryousuke Wayama
?
画像処理ライブラリ OpenCV で 出来ること?出来ないこと
Norishige Fukushima
?
厂颈蹿迟特徴量について
la_flance
?
尝颈顿础搁点群と厂蹿惭点群との位置合わせ
Takuya Minagawa
?
滨罢系エンジニアのためのプレゼンテーション入门
Masahito Zembutsu
?
初期研修医のための学会スライドのキホン
k-kajiwara
?
【企画书】搁别肠别搁别肠辞:新规事业讨议用社内资料
Find Job Startup
?
【企画書】UIscope:MOVIDA JAPAN_Demo Day用資料
Find Job Startup
?
P2 P 奨学金プロジェクト Ver3 5
Daisuke Miyoshi
?
【企画書】omiai:IVS_LAUNCH PAD用資料
Find Job Startup
?
T TIME 滞在時間割キャンペーン(第4回販促会議企画コンペティション)
Keita Takizawa
?
【企画书】驳补尘产补!(ガンバ):サムライインキュベート様向け冲企画プレゼン资料
Find Job Startup
?
【企画书】チャットワーク:社内検讨用资料
Find Job Startup
?
Ad

Similar to 28th CV勉強会@関東 #3 (19)

PDF
SSII2020 [O3-01] Extreme 3D センシング
SSII
?
PDF
Cvpr 2021 manydepth
Kenta Tanaka
?
PDF
Fusion4dIntroduction
Hideki Iwasawa
?
PDF
ICCV2019読み会「Learning Meshes for Dense Visual SLAM」
Sho Kagami
?
PPTX
Direct Sparse Odometryの解説
Masaya Kaneko
?
PDF
[DL輪読会]Stereo Magnification: Learning view synthesis using multiplane images, +α
Deep Learning JP
?
PDF
Learning Spatial Common Sense with Geometry-Aware Recurrent Networks
Kento Doi
?
PDF
20190825 vins mono
Takuya Minagawa
?
PDF
BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東)
Mai Nishimura
?
PPTX
滨厂惭础搁2016まとめ
Shohei Mori
?
PDF
Reconstructing the World’s Museums
ketsumedo_yarou
?
PDF
20190307 visualslam summary
Takuya Minagawa
?
PPTX
Soft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
Kohei Nishimura
?
PPTX
Computer Vision Chapter 4 Section 4
Kei Kawamura
?
PDF
20140726 関東cv勉強会
M Kimura
?
PDF
叁次元表现まとめ(深层学习を中心に)
Tomohiro Motoda
?
PPTX
Structured Light 技術俯瞰
Teppei Kurita
?
PDF
FastDepth: Fast Monocular Depth Estimation on Embedded Systems
harmonylab
?
PDF
20160525はじめてのコンピュータビジョン
Takuya Minagawa
?
SSII2020 [O3-01] Extreme 3D センシング
SSII
?
Cvpr 2021 manydepth
Kenta Tanaka
?
Fusion4dIntroduction
Hideki Iwasawa
?
ICCV2019読み会「Learning Meshes for Dense Visual SLAM」
Sho Kagami
?
Direct Sparse Odometryの解説
Masaya Kaneko
?
[DL輪読会]Stereo Magnification: Learning view synthesis using multiplane images, +α
Deep Learning JP
?
Learning Spatial Common Sense with Geometry-Aware Recurrent Networks
Kento Doi
?
20190825 vins mono
Takuya Minagawa
?
BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東)
Mai Nishimura
?
滨厂惭础搁2016まとめ
Shohei Mori
?
Reconstructing the World’s Museums
ketsumedo_yarou
?
20190307 visualslam summary
Takuya Minagawa
?
Soft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
Kohei Nishimura
?
Computer Vision Chapter 4 Section 4
Kei Kawamura
?
20140726 関東cv勉強会
M Kimura
?
叁次元表现まとめ(深层学习を中心に)
Tomohiro Motoda
?
Structured Light 技術俯瞰
Teppei Kurita
?
FastDepth: Fast Monocular Depth Estimation on Embedded Systems
harmonylab
?
20160525はじめてのコンピュータビジョン
Takuya Minagawa
?
Ad

Recently uploaded (13)

PDF
論文紹介:Unbiasing through Textual Descriptions: Mitigating Representation Bias i...
Toru Tamaki
?
PDF
安尾 萌, 北村 茂生, 松下 光範. 災害発生時における被害状況把握を目的とした情報共有システムの基礎検討, 電子情報通信学会HCGシンポジウム2018...
Matsushita Laboratory
?
PDF
論文紹介:AutoPrompt: Eliciting Knowledge from Language Models with Automatically ...
Toru Tamaki
?
PDF
SIG-AUDIO 2025 Vol.02 オンラインセミナー 「GDC2025 オーディオ報告会」SIG-Audio_GDC2025_報告会資料_渡辺さ...
IGDA Japan SIG-Audio
?
PDF
安尾 萌, 藤代 裕之, 松下 光範. 協調的情報トリアージにおけるコミュニケーションの影響についての検討, 第11回データ工学と情報マネジメントに関する...
Matsushita Laboratory
?
PDF
マルチAIエージェントの産業界での実践に向けたオープンソース活動の展望 - Japan Regional User Group (RUG) Meet-Up
Kosaku Kimura
?
PDF
渔船に搭载されている电子装备と渔法について冲痴搁颁海洋学研究会冲海の尝罢会発表资料
Yuuitirou528 default
?
PDF
API認可を支えるKeycloakの基本と設計の考え方 ~ OAuth/OIDCによるAPI保護のベストプラクティス ~
Hitachi, Ltd. OSS Solution Center.
?
PDF
第3回テ?シ?タル理学疗法学会のシンポジウム「デジタル理学疗法の组织活用:教育?管理?研究を繋ぐ新たな地平」での话题提供
Matsushita Laboratory
?
PDF
第3回デジタル理学疗法研究会学术大会シンポジウム「デジタル理学疗法の组织活用:教育?管理?研究を繋ぐ新たな地平」の讲演资料.
Matsushita Laboratory
?
PDF
安尾 萌, 松下 光範. 環境馴致を計量可能にするための試み,人工知能学会第4回仕掛学研究会, 2018.
Matsushita Laboratory
?
PDF
SIG-AUDIO 2025 Vol.02 オンラインセミナー 「GDC2025 オーディオ報告会」SIG-Audio_GDC2024_報告会資料_増野さ...
IGDA Japan SIG-Audio
?
PDF
AIツールを使った研究の効率化 Improving Research Efficiency with AI Tools
Tohoku University
?
論文紹介:Unbiasing through Textual Descriptions: Mitigating Representation Bias i...
Toru Tamaki
?
安尾 萌, 北村 茂生, 松下 光範. 災害発生時における被害状況把握を目的とした情報共有システムの基礎検討, 電子情報通信学会HCGシンポジウム2018...
Matsushita Laboratory
?
論文紹介:AutoPrompt: Eliciting Knowledge from Language Models with Automatically ...
Toru Tamaki
?
SIG-AUDIO 2025 Vol.02 オンラインセミナー 「GDC2025 オーディオ報告会」SIG-Audio_GDC2025_報告会資料_渡辺さ...
IGDA Japan SIG-Audio
?
安尾 萌, 藤代 裕之, 松下 光範. 協調的情報トリアージにおけるコミュニケーションの影響についての検討, 第11回データ工学と情報マネジメントに関する...
Matsushita Laboratory
?
マルチAIエージェントの産業界での実践に向けたオープンソース活動の展望 - Japan Regional User Group (RUG) Meet-Up
Kosaku Kimura
?
渔船に搭载されている电子装备と渔法について冲痴搁颁海洋学研究会冲海の尝罢会発表资料
Yuuitirou528 default
?
API認可を支えるKeycloakの基本と設計の考え方 ~ OAuth/OIDCによるAPI保護のベストプラクティス ~
Hitachi, Ltd. OSS Solution Center.
?
第3回テ?シ?タル理学疗法学会のシンポジウム「デジタル理学疗法の组织活用:教育?管理?研究を繋ぐ新たな地平」での话题提供
Matsushita Laboratory
?
第3回デジタル理学疗法研究会学术大会シンポジウム「デジタル理学疗法の组织活用:教育?管理?研究を繋ぐ新たな地平」の讲演资料.
Matsushita Laboratory
?
安尾 萌, 松下 光範. 環境馴致を計量可能にするための試み,人工知能学会第4回仕掛学研究会, 2018.
Matsushita Laboratory
?
SIG-AUDIO 2025 Vol.02 オンラインセミナー 「GDC2025 オーディオ報告会」SIG-Audio_GDC2024_報告会資料_増野さ...
IGDA Japan SIG-Audio
?
AIツールを使った研究の効率化 Improving Research Efficiency with AI Tools
Tohoku University
?

28th CV勉強会@関東 #3