際際滷

際際滷Share a Scribd company logo
Jetson Nano 龍してみた+
みよしたけふみ
Cq off 20190718
いつものベンチマ`ク
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
Rpi 3B+
Jetson Nano
Jetson TX2
1: ラズパイJetson NanoJetson TX2のUnixBenchによる來嬬曳^Y惚
ラズパイのスコアを1として屎サしたスコア
0
10000000
20000000
30000000
40000000
50000000
60000000
70000000
80000000
90000000
Dhrystone2usingregistervariables
Dhrystone 2 using register variables
RaspberryPi
RaspberryPi1
RasbperryPi2(1)
RaspberryPi2(4)
RaspberryPi3(1.2GHz)
RaspberryPi3
RaspberryPi3(4core)
Rpi 3B+
Rpi 3B+ x4
Zybo
Dospara StickPC
DragonBoard 410c
Edison
Edison(2core)
Tinker Board
D525(1)
D525(4)
Jetson TX2
Jetson TX2 x4
Jetson Nano
Jetson Nano x4
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
Double-PrecisionWhetstone
Double-Precision Whetstone
RaspberryPi
RaspberryPi1
RasbperryPi2(1)
RaspberryPi2(4)
RaspberryPi3(1.2GHz)
RaspberryPi3
RaspberryPi3(4core)
Rpi 3B+
Rpi 3B+ x4
Zybo
Dospara StickPC
DragonBoard 410c
Edison
Edison(2core)
Tinker Board
D525(1)
D525(4)
Jetson TX2
Jetson TX2 x4
Jetson Nano
Jetson Nano x4
0
5000
10000
15000
20000
25000
1 2 3
Rpi 3B+
Jetson Nano
Jetson TX2
僕堀業(MBps)
スレッド方
2: ラズパイJetson NanoJetson TX2のStreamによるメモリ僕來嬬の曳^Y惚
0
5000
10000
15000
20000
25000
Triad
Triad
RaspberryPi
RaspberryPi3(2)
RaspberryPi3(3)
RaspberryPi3(4)
Zybo(1)
Zybo(2)
Dospara StickPC
Dospara StickPC(2)
Dospara StickPC(4)
DragonBoard 410c
DragonBoard 410c(2)
DragonBoard 410c(4)
D525(1)
D525(2)
D525(3)
D525(4)
Rpi 3B+
Rpi 3B+ x2
Rpi 3B+ x4
Jetson TX2
Jetson TX2 x2
Jetson TX2 x4
Jetson Nano
MBps
0
5000
10000
15000
20000
25000
30000
RaspberryPi3 B+
Jetson Nano
Jetson TX2
3: ラズパイJetson NanoJetson TX2のOctane 2.0によるuの曳^Y惚
スコア┫鵑いほうがいい
鰻鰻來嬬得
0
20
40
60
80
100
120
Rpi 3B+ Rpi 3B+ (NNPACK) Jetson Nnao Jetson Nano(without
GPU)
Jetson TX2 Jetson TX2(without GPU)
0.14蔚/
25.6昼
1蔚/
3.57昼
47.2蔚/
0.076昼
3.69蔚/
0.97昼
112蔚/
0.032昼
1.59蔚/
2.25昼
JetsonNanoでGPUを聞喘しない栽を1として屎サした堀業曳
┫鵑いほうが互來嬬
4: ラズパイJetson NanoJetson TX2でのDarknetを喘いたYOLO v2による麗悶JRのg佩rgの曳^Y惚
https://pjreddie.com/darknet/
5: TensorFlowチュ`トリアルのmnistの僥および容のg佩rgの曳^
0
1
2
3
4
5
6
7
TensorFlow mnist learning TensorFlow mnist inference
RaspberryPi3 B+
Jetson Nano
Jetson TX2
Jetson Nano(without GPU)
Jetson TX2(without GPU)
ラズパイでのg佩rgを1として屎サした堀業曳
┫鵑いほうが互來嬬
545昼
114昼
89.7昼
165昼
113昼
5.63昼
1.57昼
0.954昼
1.97昼
1.22昼
6: tf_cnn_benchmarkによる鮫騁JRアプリケ`ションでのI尖來嬬のJetson NanoとJetson TX2の曳^Y惚
0
20
40
60
80
100
120
140
160
180
0 20 40 60 80 100 120 140
Jetson Nano
Jetson TX2
Jetson Nano(without GPU)
バッチサイズ
Images/sec匯昼あたりに容辛嬬な鮫饕曲
寄きいほうがよい
赫永雨の三
7: GPUには弌さなコアがたくさんつめこまれていて揖じ凋綜を匯業に`うデ`タにm喘できる
凋綜崙囮
レジスタファイル
コア コア コア
コア コア コア








揖じ凋綜をそれぞ
れのデ`タにm喘
できるコアが32
凋綜崙囮
レジスタファイル
コア コア コア
コア コア コア







揖じ凋綜をそれぞ
れのデ`タにm喘
できるコアが32
凋綜崙囮
レジスタファイル
コア コア コア
コア コア コア








揖じ凋綜をそれぞ
れのデ`タにm喘
できるコアが32
凋綜崙囮
レジスタファイル
コア コア コア
コア コア コア







揖じ凋綜をそれぞ
れのデ`タにm喘
できるコアが32
GPU
8: GPUでプログラムがK双g佩される徨
凋綜崙囮
レジスタファイル
コア コア コア
コア コア コア







i i+1 i+31
i i+1 i+31
i i+1 i+31
x
y
y
+
=
+= +
=
+
=
+
=
+
=



+
=



それぞれのコアがデ`タを蛍毅して處麻
どう蛍毅させるかを柵び竃しrの <<< >>>
のパラメタで峺協できる
赫永雨鬚韻離廛蹈哀薀爐諒蕕圭
赫永雨鬚韻離廛蹈哀薀爐諒蕕圭
9: Jetson NanoのGPUのK双g佩によるI尖rgを曳^したY惚
0
50
100
150
200
250
300
リスト2 リスト3 リスト4
狼双1
201m昼
2.18m昼
0.721m昼
リスト2(K双晒なし)のI尖rgを1としたときの
I尖堀業來嬬曳┫鵑いほうがいい
10: CUDAのサンプルnbody をベンチマ`クにGPUのI尖來嬬を曳^したY惚
0
50
100
150
200
250
300
350
400
450
500
0 2000 4000 6000 8000 10000 12000 14000 16000 18000
Jetson Nano
Jetson Nano(without GPU)
Jetson TX2
Jetson TX2(without GPU)
GFLOPS┫鵑いほうがI尖來嬬が互い
亟寔2: nbodyのg佩箭
こういうのがとっても堀くなって、すごい
NumPyそっくりのCuPyというのがある
https://tutorials.chainer.org/ja/10_Introduction_to_CuPy.html
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
0 200 400 600 800 1000 1200
numpy
cupy
11: Jetson NanoでNumPyとCuPyを聞って佩双とベクトルの處麻をしたときのg佩rgの曳^Y惚
g佩rg(昼)寄きいほうが來嬬が詰い
佩双とベクトルのサイズ
おまけ
Cq off 20190718
Cq off 20190718

More Related Content

More from Takefumi MIYOSHI (20)

Reconf 201901
Reconf 201901Reconf 201901
Reconf 201901
Takefumi MIYOSHI
?
Hls friends 201803.key
Hls friends 201803.keyHls friends 201803.key
Hls friends 201803.key
Takefumi MIYOSHI
?
Abstracts of FPGA2017 papers (Temporary Version)
Abstracts of FPGA2017 papers (Temporary Version)Abstracts of FPGA2017 papers (Temporary Version)
Abstracts of FPGA2017 papers (Temporary Version)
Takefumi MIYOSHI
?
Hls friends 20161122.key
Hls friends 20161122.keyHls friends 20161122.key
Hls friends 20161122.key
Takefumi MIYOSHI
?
際際滷
際際滷際際滷
際際滷
Takefumi MIYOSHI
?
Synthesijer and Synthesijer.Scala in HLS-friends 201512
Synthesijer and Synthesijer.Scala in HLS-friends 201512Synthesijer and Synthesijer.Scala in HLS-friends 201512
Synthesijer and Synthesijer.Scala in HLS-friends 201512
Takefumi MIYOSHI
?
Das 2015
Das 2015Das 2015
Das 2015
Takefumi MIYOSHI
?
Microblaze loader
Microblaze loaderMicroblaze loader
Microblaze loader
Takefumi MIYOSHI
?
Reconf 201506
Reconf 201506Reconf 201506
Reconf 201506
Takefumi MIYOSHI
?
Synthesijer jjug 201504_01
Synthesijer jjug 201504_01Synthesijer jjug 201504_01
Synthesijer jjug 201504_01
Takefumi MIYOSHI
?
Synthesijer zynq qs_20150316
Synthesijer zynq qs_20150316Synthesijer zynq qs_20150316
Synthesijer zynq qs_20150316
Takefumi MIYOSHI
?
Synthesijer fpgax 20150201
Synthesijer fpgax 20150201Synthesijer fpgax 20150201
Synthesijer fpgax 20150201
Takefumi MIYOSHI
?
Synthesijer hls 20150116
Synthesijer hls 20150116Synthesijer hls 20150116
Synthesijer hls 20150116
Takefumi MIYOSHI
?
Synthesijer.Scala (PROSYM 2015)
Synthesijer.Scala (PROSYM 2015)Synthesijer.Scala (PROSYM 2015)
Synthesijer.Scala (PROSYM 2015)
Takefumi MIYOSHI
?
ICD/CPSY 201412
ICD/CPSY 201412ICD/CPSY 201412
ICD/CPSY 201412
Takefumi MIYOSHI
?
Reconf_201409
Reconf_201409Reconf_201409
Reconf_201409
Takefumi MIYOSHI
?
酷永赫粥のトレンドをまとめてみた
酷永赫粥のトレンドをまとめてみた酷永赫粥のトレンドをまとめてみた
酷永赫粥のトレンドをまとめてみた
Takefumi MIYOSHI
?

Cq off 20190718