狠狠撸

狠狠撸Share a Scribd company logo
CUDAを利用したPIV解析の
  高速化に関する研究


指導教員      熱工学研究室
二宮?尚        史?翔新
CUDAを利用したPIV解析の
  高速化に関する研究


指導教員      熱工学研究室
二宮?尚        史?翔新
PIV
Particle Image Velocimetry
    粒子画像流速测定法
Particle Image Velocimetry




 時刻 t
Particle Image Velocimetry



        +
 時刻 t       時刻 t+Δt
Particle Image Velocimetry



        +             =
 時刻 t       時刻 t+Δt       ベクトル図
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
颁笔鲍で解析
颁笔鲍で解析

ベクトルを一個ずつ解析
颁笔鲍で解析

ベクトルを一個ずつ解析

    +
数千~数万のベクトル
颁笔鲍で解析

ベクトルを一個ずつ解析

    +
数千~数万のベクトル

    ??
 解析时间が長い
颁笔鲍で解析

ベクトルを一個ずつ解析

    +
数千~数万のベクトル

    ??
  解析时间が長い
 (1枚10秒ほど)
同时に复数ベクトル解析
并列演算
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
GPGPU
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
CUDA?
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
解析时间



CPU (Average)




  GTX 560 Ti




                0   5          10     15




     ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析时间



CPU (Average)                       13.07 sec




  GTX 560 Ti




                0   5          10       15




     ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析时间



CPU (Average)                                  13.07 sec




  GTX 560 Ti        1.77 sec




                0              5          10       15




     ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
10




5




               1X


0
        i5 (Sandy Bridge)          GTX 560 Ti


     ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
10



                                      7X




5




               1X


0
        i5 (Sandy Bridge)          GTX 560 Ti


     ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
まだ足りない!
3
1
□Speed Up
最适化
最适化   スピード   読みやすさ   メンテナンス性
最适化   スピード   読みやすさ   メンテナンス性
最适化   スピード   読みやすさ   メンテナンス性
最适化   スピード   読みやすさ   メンテナンス性
最适化   スピード   読みやすさ   メンテナンス性
最适化   スピード   読みやすさ   メンテナンス性
最适化   スピード   読みやすさ   メンテナンス性
最适化   スピード   読みやすさ   メンテナンス性
最适化   スピード   読みやすさ   メンテナンス性
最适化   スピード   読みやすさ   メンテナンス性
最适化   スピード   読みやすさ   メンテナンス性
最适化   スピード   読みやすさ   メンテナンス性
解析时间


   CPU (Average)                                  13.07 sec




GTX 560 Ti (Old)       1.77 sec




GTX 560 Ti (New)



                   0              5          10       15




        ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析时间


   CPU (Average)                                       13.07 sec




GTX 560 Ti (Old)            1.77 sec




GTX 560 Ti (New)       0.12 sec




                   0                   5          10       15




        ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
150




100




50




                            7X
           1X
 0
      CPU (Average)   GTX 560 Ti (Old)   GTX 560 Ti (Old)


      ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
150




                                              109X

100




50




                            7X
           1X
 0
      CPU (Average)   GTX 560 Ti (Old)   GTX 560 Ti (Old)


      ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
□Speed Up
?
□Speed Up
2
□サブピクセル解析
ガウス分布
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
□サブピクセル解析
?
□サブピクセル解析
3
□误ベクトル除去
周りのベクトルと照合
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
□误ベクトル除去
?
□误ベクトル除去
?
□误ベクトル除去
?
□Speed Up
?
□サブピクセル解析
?
□误ベクトル除去
?
□Speed Up
?
□サブピクセル解析
?
□误ベクトル除去
解析速度
150




                                              109X

100




50




                            7X
           1X
 0
      CPU (Average)   GTX 560 Ti (Old)   GTX 560 Ti (Old)


      ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
150




                                              109X

100

          □   □            □   □              □   □
          誤   サ            誤   サ              誤   サ
          ベ   ブ            ベ   ブ              ベ   ブ
          ク   ピ            ク   ピ              ク   ピ
50        ト   ク            ト   ク              ト   ク
          ル   セ            ル   セ              ル   セ
          除   ル            除   ル              除   ル
          去   解            去   解              去   解
              析                析                  析
                            7X
           1X
 0
      CPU (Average)   GTX 560 Ti (Old)   GTX 560 Ti (Old)


      ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
150




                                              109X

100

          ?
          □   ?
              □            □   □              □   □
          誤   サ            誤   サ              誤   サ
          ベ   ブ            ベ   ブ              ベ   ブ
          ク   ピ            ク   ピ              ク   ピ
50        ト   ク            ト   ク              ト   ク
          ル   セ            ル   セ              ル   セ
          除   ル            除   ル              除   ル
          去   解            去   解              去   解
              析                析                  析
                            7X
           1X
 0
      CPU (Average)   GTX 560 Ti (Old)   GTX 560 Ti (Old)


      ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
150




                                              109X

100




                          ?
          ?
          □   ?
              □            □   □              □   □
          誤   サ            誤   サ              誤   サ
          ベ   ブ            ベ   ブ              ベ   ブ
          ク   ピ            ク   ピ              ク   ピ
50        ト   ク            ト   ク              ト   ク
          ル   セ            ル   セ              ル   セ
          除   ル            除   ル              除   ル
          去   解            去   解              去   解
              析                析                  析
                            7X
           1X
 0
      CPU (Average)   GTX 560 Ti (Old)   GTX 560 Ti (Old)


      ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
150




                                              109X

100




                          ?
          ?
          □   ?
              □            □   □              ?
                                              □   ?
                                                  □
          誤   サ            誤   サ              誤   サ
          ベ   ブ            ベ   ブ              ベ   ブ
          ク   ピ            ク   ピ              ク   ピ
50        ト   ク            ト   ク              ト   ク
          ル   セ            ル   セ              ル   セ
          除   ル            除   ル              除   ル
          去   解            去   解              去   解
              析                析                  析
                            7X
           1X
 0
      CPU (Average)   GTX 560 Ti (Old)   GTX 560 Ti (Old)


      ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
正真正铭の>100倍の速さ
颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)
「PIV解析において、GPGPUをうまく
駆使すれば、CPUより遥かに速い解析
スピードが得られます。」
おまけ
? 論文を一般公開(ソースコード含む)
? 論文を一般公開(ソースコード含む)
? iPad専用Multi-touch 产辞辞办同时公开
検索
CUDA PIV   検索
!ank y"
Ad

Recommended

【テストレポート】Datrium DVXによるIOmark-VM性能テスト
【テストレポート】Datrium DVXによるIOmark-VM性能テスト
デイトリウム
?
Tezos hands-on : Tezos exercise
Tezos hands-on : Tezos exercise
Jun Furuse
?
脱炭素社会に向けたエネルギーシナリオ
脱炭素社会に向けたエネルギーシナリオ
Naoyuki Yamagishi
?
Proposal for a New Climate Target
Proposal for a New Climate Target
Naoyuki Yamagishi
?
GPGPU Seminar (GPU Accelerated Libraries, 1 of 3, cuBLAS)
GPGPU Seminar (GPU Accelerated Libraries, 1 of 3, cuBLAS)
智啓 出川
?
GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE)
GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE)
智啓 出川
?
松岛克守教授最终讲义
松岛克守教授最终讲义
bizmodel
?
2015年度骋笔骋笔鲍実践基础工学 第10回 骋笔鲍のプログラム构造
2015年度骋笔骋笔鲍実践基础工学 第10回 骋笔鲍のプログラム构造
智啓 出川
?
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
智啓 出川
?
More modern gpu
More modern gpu
Preferred Networks
?
DRONE BORG 第一回ドローンビジネス勉強会資料
DRONE BORG 第一回ドローンビジネス勉強会資料
DRONE BORG
?
颁耻笔测解説
颁耻笔测解説
Ryosuke Okuta
?
できる!并列?并行プログラミング
できる!并列?并行プログラミング
Preferred Networks
?
車載組み込み用ディープラーニング?エンジン NVIDIA DRIVE PX
車載組み込み用ディープラーニング?エンジン NVIDIA DRIVE PX
NVIDIA Japan
?
The Top Skills That Can Get You Hired in 2017
The Top Skills That Can Get You Hired in 2017
LinkedIn
?
ハッカソンに使うSwift & Swift 3.0のGCD
ハッカソンに使うSwift & Swift 3.0のGCD
翔新 史
?
颁鲍顿础を利用した笔滨痴解析の高速化
颁鲍顿础を利用した笔滨痴解析の高速化
翔新 史
?
Steve jobs introducton
Steve jobs introducton
翔新 史
?
2010 english honors camp music intro
2010 english honors camp music intro
翔新 史
?
事业计画书
事业计画书
翔新 史
?
工学部の魅力
工学部の魅力
翔新 史
?
Honors camp music intro
Honors camp music intro
翔新 史
?

More Related Content

Viewers also liked (7)

GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
智啓 出川
?
More modern gpu
More modern gpu
Preferred Networks
?
DRONE BORG 第一回ドローンビジネス勉強会資料
DRONE BORG 第一回ドローンビジネス勉強会資料
DRONE BORG
?
颁耻笔测解説
颁耻笔测解説
Ryosuke Okuta
?
できる!并列?并行プログラミング
できる!并列?并行プログラミング
Preferred Networks
?
車載組み込み用ディープラーニング?エンジン NVIDIA DRIVE PX
車載組み込み用ディープラーニング?エンジン NVIDIA DRIVE PX
NVIDIA Japan
?
The Top Skills That Can Get You Hired in 2017
The Top Skills That Can Get You Hired in 2017
LinkedIn
?
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
智啓 出川
?
DRONE BORG 第一回ドローンビジネス勉強会資料
DRONE BORG 第一回ドローンビジネス勉強会資料
DRONE BORG
?
できる!并列?并行プログラミング
できる!并列?并行プログラミング
Preferred Networks
?
車載組み込み用ディープラーニング?エンジン NVIDIA DRIVE PX
車載組み込み用ディープラーニング?エンジン NVIDIA DRIVE PX
NVIDIA Japan
?
The Top Skills That Can Get You Hired in 2017
The Top Skills That Can Get You Hired in 2017
LinkedIn
?

More from 翔新 史 (7)

ハッカソンに使うSwift & Swift 3.0のGCD
ハッカソンに使うSwift & Swift 3.0のGCD
翔新 史
?
颁鲍顿础を利用した笔滨痴解析の高速化
颁鲍顿础を利用した笔滨痴解析の高速化
翔新 史
?
Steve jobs introducton
Steve jobs introducton
翔新 史
?
2010 english honors camp music intro
2010 english honors camp music intro
翔新 史
?
事业计画书
事业计画书
翔新 史
?
工学部の魅力
工学部の魅力
翔新 史
?
Honors camp music intro
Honors camp music intro
翔新 史
?
ハッカソンに使うSwift & Swift 3.0のGCD
ハッカソンに使うSwift & Swift 3.0のGCD
翔新 史
?
颁鲍顿础を利用した笔滨痴解析の高速化
颁鲍顿础を利用した笔滨痴解析の高速化
翔新 史
?
Steve jobs introducton
Steve jobs introducton
翔新 史
?
2010 english honors camp music intro
2010 english honors camp music intro
翔新 史
?
工学部の魅力
工学部の魅力
翔新 史
?
Honors camp music intro
Honors camp music intro
翔新 史
?
Ad

颁鲍顿础を利用した笔滨痴解析の高速化に関する研究(卒业発表)