端端舝

FPGAX2019

Feb 5, 201910 likes5,630 views

Hiroki Nakahara

幛捩勞插喘2019匹逃桶卞妏勻凶訧蹋匹允﹝云引仃匹﹜郔輪及旃噶庄賡手﹝

卅井反日
佌及MNIST及FPS反530000匹允﹝
匹允互手切欠氏白伙由伐奈匹ㄗ眕狟謹
(+螝?CNN及畿賡)
FPGAX2019@
Google左白奴旦

勾仁勻凶手及(1)
? 議弊?必奈丞辻失弁本仿伊奈正
2

旃噶氾奈穴:
Custom Computing Machine
3

Object?Detection?(昜极庲舑)
4
Person
J.?Redmon?and?A.?Farhadi,?"YOLOv3:?An?Incremental?Improvement,"?arXiv,?2018
Person
Boat

Semantic?Segmentation?(薆郖煦賃)
5E.?Shelhamer,?J.?Long?and?T.?Darrell,?"Fully?Convolutional?Networks?for?Semantic?Segmentation,"??IEEE?Trans.?on?
Pattern?Analysis?and?Machine?Intelligence,?Vol.39,?No.4,?2017,?pp.?640?坼 651.

OpenPose (訬�芢隅)
6
Z.?Cao,?T.?Simon,?S.坼E.?Wei?and?Y.?Sheikh,?"?Realtime?Multi坼Person?2D?Pose?Estimation?
using?Part?Affinity?Fields,"?CVPR,?2017.

DepthMap (旮今芢隅)
7
D.?Eigen,?C.?Puhrsch and?R.?Fergus,?"Depth?Map?Prediction?from?a?Single?Image?using?a?
Multi坼Scale?Deep?Network,"?arXiv:1406.2283?,?2014.

勾仁勻凶手及(2)
? Terasic扦 DE5a坼Net?示奈玉卞方月?厒趙
? YOLOv2?毛 166 498?FPS?(3�K蹈趙)
8
酚?蚙??狟?蔚眳?酚枘淩ⅸ?笢埻�惸,"Intel?OpenCL毛?中凶3袨颷YOLOv2及FPGA灍蚾卞
勾中化,"伉戊件白奴幼乓仿皮伙扑旦氾丞旃噶頗,?2018爛12?(𣷣憷).

犯乒:?AvNET Ultra96
9
Xilinx扦 Zynq UltraScale+ MPSoC (ZU3EG) 減徭,
30FPS (YOLOv2), 3勀�, PYNQ (Python虐噫)匹秶郘, �g黃�釬
Hiroki?Nakahara,?Masayuki?Shimoda and?Shimpei Sato,?※A?Tri坼State?Weight?Convolutional?Neural?
Network?for?an?FPGA:?Applied?to?YOLOv2?Object?Detector,§?FPT,?2018.

CNN及郔羥趙
10
Source:?http://www.isfpga.org/fpga2017/slides/D1_S1_InvitedTalk.pdf

2�趙CNN
11
x1
w0 (Bias)
fsgn(Y)
Y
z
w1
x2
w2
xn
wn
...
x1 x2 Y
坼1 坼1 1
坼1 +1 坼1
+1 坼1 坼1
+1 +1 1
x1 x2 Y
0 0 1
0 1 0
1 0 0
1 1 1
M.?Courbariaux,?I.?Hubara,?D.?Soudry,?R.E.Yaniv,?Y.?Bengio,?※Binarized?neural?networks:?Training?deep?neural?
networks?with?weights?and?activations?constrained?to?+1?or?坼1,"?Computer?Research?Repository?(CoRR),?Mar.,?
2016,?http://arxiv.org/pdf/1602.02830v3.pdf

卅兮丟乒伉講祅𦑩?↙左件民永皿灍政仄凶中井日
E.?Joel?et?al.,?※Tutorial?on?Hardware?Architectures?
for?Deep?Neural?Networks,§?MICRO坼49,?2016. 12
On-chip
Memory
J.?Dean,?※Numbers?everyone?should?know§
Source:?https://gist.github.com/2841832
? 𣷣繧郖 (酘)
? 腴秏愐�? (衵)

13欽堯梗紳?郭勳?梗喧.?硃梭,?※插?莽喝娶措梗聆?棗款?紳梗喝娶硃梭?紳梗喧滄棗娶域?硃釵釵梗梭梗娶硃喧棗娶莽,§?插唬紼?啦賊楚啦,?博棗梭.11,?捧棗.5,?2017,?梯梯.?746坼761.

旦由奈旦趙
? (悝�𦤦心)笭心甲旦玄弘仿丞反丐月煦票卞𣶹丹(t坼煦票井卅?)
? 魂俶趙憝杅卞方勻化反,?堤?及50%ゴ摽互未伕
? 悝�犯奈正支乒犯伙卞方勻化反公木眕奻未伕卞卅月仇午手
? HW午仄化反笭心旦由奈旦趙及幻丹互㜳中支允中
14
笭心及�
0
50000
100000
150000
200000
坼1 坼0.8 坼0.6 坼0.4 坼0.2 0 0.2 0.4 0.6 0.8 1
? 庲舑儕僅卞
荌�仄卅中
↙皉尌曰
Tomoya Fujii,?Shimpei Sato,?Hiroki?Nakahara,?※A?Threshold?Neuron?Pruning?for?a?Binarized?Deep?Neural?Network?on?an?FPGA,§?IEICE?
Transactions?101坼D(2):?376坼386?(2018)

CNN卞方月賒砉煦�及賤昴
15
Feature maps
CONV+Pooling CONV+Pooling
※5§
Input
image
...
Feature?extraction?layers
Classification
layers
3
2 0
1
4
5
6
7
8 9

�觳萸
? 腴儕僅NN匹反隙䔝�觳毛賤仃卅中
? 瞰:?sin(x)?regression?using?a?NN?(3坼layers)
16
(a)?Float?32?bit?for?
activation?and?weight
(b)?Float32?for?
activation?and?binary?
weight
(c)?All?binarized
Sin(x)
BinNNFloat32NN
Sin(x)
Miss
localization

髦磁儕僅CNN
? Object?Detector卅升恚螝卅正旦弁匹斛�撮胍
? ゴ僇:?2�儕僅CNN?＃ ?搪?旦疋奈玉
? 摽僇:?嗣�儕僅CNN?＃?隙䔝�觳ㄗ�芢隅ㄘ
17
Input
Image
(Frame)
Feature maps
CONV+Pooling
CNN
CONV+Pooling
Class?score
Bounding?Box
Detection
2� half
H.?Nakahara?et?al.,?※A?Lightweight?YOLOv2:?A?Binarized?CNN?with?A?Parallel?Support?Vector?Regression?for?an?
FPGA,§ Int＊l Symp. on FPGA (ISFPGA), 2018.

淛隱 (Distillation)
? 悝�𦤦心乒犯伙毛�e及乒犯伙卞�痄
? �卅月乒犯伙ㄗ𦵴?民乓生伙卅升ㄘ卞�痄允月撮胍
? 淛隱卞方月悝�:?諒�乒犯伙及旦戊失毛�化�唸
↙旦戊失及煦票卞𡘙?腔卅眭舑互漪引木化中月
18G.?Hinton,?Oriol?Vinyals,?and?J.?Dean,?※Distilling?the?Knowledge?in?a?Neural?Network,§NIPS＊04
Teacher?(Trained)?CNN
Student?CNN
Car??0.82
Cat??0.08
Dog?0.07
Pet??0.03
Car??0.62
Cat??0.12
Dog?0.24
Pet??0.02
Car??1.00
Cat??0.00
Dog?0.00
Pet??0.00
Soft?target?loss
Hard
target
loss Training
Dataset
Loss?for?soft?and?
hard?targets

丟正辻迮悝�卞方月由仿丟奈正抻坰
? �?傺卞反癹賜互＃
? 由仿丟奈正毛�薹方仁抻允斛猁丐曰
? 弘伉永玉扔奈民:?綈中
? 仿件母丞它巧奈弁:?綅￤六
? 丟正甲亙奈伉旦氾奴永弁(SA,?GA,?PSO):?卅井卅井方中?
? 矛奶朮芢隅:?由仿丟奈正芢隅仄支允中�g�卅�觳卞方今公丹
? 丟正辻迮悝�:?Hyperopt,?Optuna
Chainer +?Optuna及瞰:
https://github.com/pfnet/optuna/blob/master/examples/chainer_simple.py
19

勾仁勻凶手及(3)
? GUINNESS?(GUI based?Neural?Network?SyntheSizer)
20
H.?Nakahara?et.?al,?※GUINNESS:?A?GUI?based?Binarized?Deep?Neural?Network?Framework?for?Software?
Programmers,§?IEICE?Trans?on?Info.,?(accepted).
https://github.com/HirokiNakahara/GUINNESS

Google?Colaboratory
? 12媆嶲引匹GPU?(Tesla?K80)毛妏尹月
? 斛猁卅仿奶皮仿伉反軑戶爀?𦤦心
? TensorFlow手瞳?褫夔
? Chainer及爀?手褫夔
Chainer on?Google?Colaboratory:
https://github.com/chainer/google坼colaboratory
? GUINNESS(Binary?Neural?Network偞�汁奈伙)毛
Colaboratory匹妏丹?楊互?
Google?Colaboratory匹Binary?CNN毛�井允(MNIST):
http://shimaharu.blogspot.com/2018/11/google坼colaboratorybinary坼cnnmnist.html
? Vivado毛?木化心凶?手＃
? 旦穴白巧匹�窒匹五月元扎氏?
21
Chainer毛
犯白巧伙玄匹扔禾奈玄
(2019/Jan/31卞復庲)

On坼going?work
? Coca坼cola DL毛嶱逃嶱宎
? Co坼design?and?verification?on?Colaboratory?for?Deep?Learning
22
https://github.com/HirokiNakahara/Coca坼Cola坼DL/
↙

MNIST民乓伊件斥
23

MNIST民乓伊件斥
? MNIST毛升木分仃?厒卞匹五月井
? 儕僅反90%眕奻午允月(＃中中及井?)
? Neural?Network毛?中月仇午
? t坼SNE午井Random?Forest午井匹尹尹支氏勻化穴斥伊旦支戶化
? FPGA卞灍蚾仄方丹?
24

踏隙及正奈必永玄
? 3𦵴DNN卞3�趙(Binary+皉尌曰)仄化心月
? ??賒砉手2�趙 (��匹??趙)
25
x0
x1
x783
＃
z0
z1
zn坼1
＃
z0
z1
zn坼1
＃
y0
y1
y9
＃
784 10

由仿丟奈正及𢜪隅
? 3𦵴DNN及笢嶲𦵴及瓦亙奈伕件杅n毛劐趙今六化
庲舑薹午旦由奈旦薹毛捼𦷰
? 跪DNN及甩奶由奈由仿丟奈正反Optuna匹偞隅
26
x0
x1
x783
＃
z0
z1
zn坼1
＃ z0
z1
zn坼1
＃
y0
y1
y9
＃
784 10n n
旦由奈旦薹
=0皉及賃磁
(祅𦑩薹)

悝�磐彆
? 瓦亙奈伕件杅毛�支仄化手庲舑儕僅互奻互月午反
癹日卅中↙羥ピ卅乒犯伙腢亼
? 旦由奈旦薹午瓦亙奈伕件杅卞眈憝互丐月
? ?隅杅及戊生弁氾奴申氾奴(諉適俶↙乒犯伙恚螝僅)互斛猁
27
91? 91? 91? 91? 88? 86?
71?
55?
89? 88? 86? 83? 79?
72? 75? 73?
120 100 80 60 40 20 10 5
庲舑儕僅旦由奈旦薹
笢嶲𦵴及瓦亙奈伕件杅

FPGA灍蚾
? 偞�仄凶DNN毛瞎磁六隙繚趙仄方丹?
? 笢嶲𦵴及瓦亙奈伕件杅:?100,?庲舑薹 91%,?旦由奈旦薹 88%
? 1瓦亙奈伕件及郔???杅22 ↙?222 bit?↙?BRAM?256?�
(引凶反6??LUT?67,108,864�!!)
28
x0
x1
x783
＃
z0
z1
zn坼1
＃ z0
z1
zn坼1
＃
y0
y1
y9
784 10100 100
郔?匹22??1堤?(ⅸ歙10最僅)

$憝杅及煦賤 ? ?啜腔卅瞎心磁歹六隙繚及恚螝僅2n/n ? n=n1+(n2+1)卞煦賤匹五月午2n1/n1+2n2+1/(n2+1) ? 2及屯五�\匹祅𦑩 ? FPGA匹反瞎磁歹六隙繚毛LUT(丟乒伉)匹灍政 ? 煦賤匹五木壬丟乒伉講毛2及屯五�\及�耀匹祅𦑩褫夔 29 H G ＃＃ n1 n2$

30
憝杅煦賤楊
G
Hx1
x2
x3
x4
f
? ?﹛﹛2log
X1
X2
00 01 10 11
00
01
10
11
0
1
1
1
1
1
0
0
0
1
1
1
1
1
0
0
X1=(x1, x2)
X2=(x3, x4)
蹈恚螝僅 ?=2
旰瘴劐杅
?蚕劐杅
?煦賤桶
f =g(h(X1),X2)
h(X1) ㄟㄟㄠㄠ
諉適�杅 =
(�卅月蹈由正奈件及�杅)

31
00 01 10 11
00
01
10
11
0
1
1
1
1
1
0
0
0
1
1
1
1
1
0
0
X1=(x1, x2)
X2=(x3, x4)
?=2
h(X1) ㄟㄟㄠㄠ
x1 0 0 1 1
x2 0 1 0 1
h(X1) 0 1 0 1
0 1
00 0 1
01 1 1
10 1 0
11 1 0
x3,x4
h(X1)
瞰
24x1=16?[bit] 22x1+23x1=12?[bit]
�卅月蹈由正奈件卞
睫瘍毛賃曰絞化月
巨件戊奈母

憝杅煦賤互衄�卅弁仿旦
? 旦由奈旦(??杅午巨件玄伉杅卞幼乓永皿互丐月�磁)
卅憝杅↙由弗永玄煦�
32
0 0 0 0 0 3 0 0
0 1 0 0 0 0 0 0
0 0 0 0 2 0 0 0
0 0 0 0 0 0 0 0
Hiroki?Nakahara,?Tsutomu?Sasao,?Munehiro Matsuura,?※A?packet?classifier?using?LUT?cascades?
based?on?EVMDDS?(k),§?FPL,?2013,?pp.1坼6.

憝杅煦賤互衄�卅弁仿旦(適)
? �g捼�?允月�磁
? 本弘丟件玄奶件犯永弁旦巨件戊奈母
33
0 4 3 2 1 0 4 3
1 0 4 3 2 1 0 4
2 1 0 4 3 2 1 0
3 2 1 0 4 3 2 1
巨件戊奈母
ROM
a b
f(x)=ax+b
Tsutomu?Sasao,?Shinobu Nagayama,?Jon?T.?Butler,
※Numerical?Function?Generators?Using?LUT?Cascades,§?
IEEE?Trans.?Computers?56(6):?826坼838?(2007).

Binary?DNN及�磁
? Weighted坼Sum?Function?(WS憝杅)午中丹弁仿旦[1]
? 蹈恚螝僅反允匹卞賤昴𦤦心
? 田永民淏�趙反?
ㄗ2016爛及狦卞�?[2]毛𤩸中化中凶媆反方中?楊互佷中勾井卅井勻凶＃ㄘ
34
+
x0=1
x1
x2
xN
...
w0 (Bias)
w1
w2
wN
Batch
Norm
+1 or -1sign
2016爛狦及癹賜 2017爛3?卞絻傖
[1]?T.?Sasao,?※Analysis?and?Synthesis?of?Weighted坼Sum?Functions,§?IEEE?Trans.?on?CAD,?Vol.?25,?No.?5,?2006,?pp.789坼796.
[2]?H.?Nakahara?et.?al,?"A?memory坼based?realization?of?a?binarized?deep?convolutional?neural?network,"?FPT,?2016,?
pp.277坼280.

2�趙笭心睿憝杅及瞰(n=5)
x0 x1 x2 x3 x4 搪睿栳呾磐彆
0 0 0 0 0 坼w0坼w1坼w2坼w3坼w4
0 0 0 0 1 坼w0坼w1坼w2坼w3+w4
0 0 0 1 0 坼w0坼w1坼w2+w3坼w4
0 0 0 1 1 坼w0坼w1坼w2坼w3+w4
0 0 1 0 0 坼w0坼w1+w2坼w3坼w4
0 0 1 0 1 坼w0坼w1+w2坼w3+w4
0 0 1 1 0 坼w0坼w1+w2+w3坼w4
0 0 1 1 1 坼w0坼w1+w2+w3+w4
0 1 0 0 0 坼w0+w1坼w2坼w3坼w4
0 1 0 0 1 坼w0+w1坼w2坼w3+w4
0 1 0 1 0 坼w0+w1坼w2+w3坼w4
0 1 0 1 1 坼w0+w1坼w2+w3+w4
1 1 1 1 1 +w0+w1+w2+w3+w4
...
...

2�趙笭心睿憝杅及煦賤桶
? 2�趙笭心睿憝杅及堤?申永玄杅互q申永玄及午五,?公及蹈恚螝僅反?〝 2
? 跪蹈反�化肮元�(?蚕劐杅)及樓呾 ↙ 旰瘴劐杅毛樓呾仄凶�及瞎磁歹六
互蹈恚螝僅
? 𣶹勻化,?公及瞎心磁歹六(申永玄杅)反睫瘍手?木月午q申永玄匹桶政褫夔 ↙?2q
36
000 001 010 011 100 101 110 111
坼w0坼w1坼w2
坼w3坼w4
坼w0坼w1+w2
坼w3坼w4
坼w0+w1坼w2
坼w3坼w4
坼w0+w1+w2
坼w3坼w4
w0坼w1坼w2
坼w3坼w4
w0坼w1+w2
坼w3坼w4
w0+w1坼w2
坼w3坼w4
w0+w1+w2
坼w3坼w4
坼w0坼w1坼w2
坼w3+w4
坼w0坼w1+w2
坼w3+w4
坼w0+w1坼w2
坼w3+w4
坼w0+w1+w2
坼w3+w4
w0坼w1坼w2
坼w3+w4
w0坼w1+w2
坼w3+w4
w0+w1坼w2
坼w3+w4
w0+w1+w2
坼w3+w4
坼w0坼w1坼w2
+w3坼w4
坼w0坼w1+w2
+w3坼w4
坼w0+w1坼w2
+w3坼w4
坼w0+w1+w2
+w3坼w4
w0坼w1坼w2
+w3坼w4
w0坼w1+w2
+w3坼w4
w0+w1坼w2
+w3坼w4
w0+w1+w2
+w3坼w4
坼w0坼w1坼w2
+w3+w4
坼w0坼w1+w2
+w3+w4
坼w0+w1坼w2
+w3+w4
坼w0+w1+w2
+w3+w4
w0坼w1坼w2
+w3+w4
w0坼w1+w2
+w3+w4
w0+w1坼w2
+w3+w4
w0+w1+w2
+w3+w4
11?????????10????????01????????00
x0 x1 x2x3 x4

37
田永民淏�趙卞憝仄化
?Batch
Norm
?
悝�𦤦心2�趙NN卞云中化, 田永民淏�趙栳呾反
淕杅儕僅田奶失旦樓呾午脹� mean
variance
Scaling Shift
H.?Yonekawa and?H.?Nakahara,?※On坼Chip?Memory?Based?Binarized?Convolutional?Deep?Neural?Network?Applying?Batch?
Normalization?Free?Technique?on?an?FPGA,§?IPDPS?Workshops?2017,??pp.98坼105.

? The?output?from?batch?
normalization( )?is?the?
input?to?sign?function
?Constant?factor?can?be?
ignored
? The?input?from?batch?
normalization( )?is?the?
integer?value
?To?integer?
38
Proof ?Batch
Norm

�极�傖
? ?堤?卞伊斥旦正毛勾仃化1clock匹灍?
? 跪瓦亙奈伕件反憝杅煦賤匹恚杅及6坼LUT匹灍政
39
x0
x1
x783
＃
z0
z1
zn坼1
＃
z0
z1
zn坼1
＃ y0
y1
y9
784 10100 100 ＃
＃
5= ??? ? ??6
1+(22坼6坼1)x5+1=77
222=67,108,864及
廣400勀煦及1

灍蚾仄凶磐彆
? FPGA?Board:?AvNet扦Ultra96
? 正奶立件弘秶廣:?100MHz
? LUT杅:?6154�
? FF杅:?772�
? 正奶立件弘互丟永玄仄切扎勻凶＃
↙?100?MFPS?
↙?100?x?1000000?FPS?=?100000000?FPS!!!!
40
1�|FPS?!
(?岈�及弁末?閉尹)

1欳FPS尺及耋
? We?are?now＃
? @100MHz?(黱弁伕永弁�I燴)?↙?1�|FPS
? LUT杅:?6,154�
? FF杅:?772�
? VCU1525互＃?
? 1,182,240?LUTs?↙?廣190怢�K蹈趙褫夔
? 2,364,480?FFs
? 由奶皿仿奶件灍蚾 ↙?300MHz�釬
? (燴��匹)?�反0.57欳FPS仄井善絻仄化中卅中＃
c.f.?議迻紺謁?及苂仁?及?反ㄠ欳僅
41丐﹜丹切VCUㄡ怢手勻化月支氏＃

云引仃
42

市旦正丞皿伕本永扔
? �?隙繚趙仄凶日剠鎣卞婌允亢凶匹仍介月＃
? 政灍腔卅I/O厒僅(市丟仿30FPS)午井卞磁丹方丹卞偞�
? ROM井日LUT毛紨棒掂心堤允?楊匹灍政
↙氾奈皮伙統桽倰皿伕本永扔
43
LUT2
LUT3
LUT1
LUT1
LUT2
LUT3
REG
PRG

mis坼FPGA
? LUT及??杅毛�支允
↙丟乒伉講�樓 &?LUT杅祅𦑩ㄗˊ?厒趙ㄘ
丟乒伉講(玄仿件斥旦正杅)匹俶夔旦弗奈伙
? LUT?netlist?毛啋卞磁傖
44
R.?Murgai,?M.?Fujita,?F.?Hirose,?※Logic?synthesis?for?a?single?large?look坼up?table,§?
ICCD,?1995,?pp.415坼424.
丟乒伉扔奶朮≦俶夔

支勻天曰＃
? Binary儕僅分仃匹反恚螝卅正旦弁互賤仃卅中＃
? 隙䔝反儕僅互斛猁↙髦磁儕僅
45

$螝?�煋心栳呾 (Noise?Convolutional?Operation) 46 + ??卞螝?毛�\六月 1℅1�煋心栳呾 ??賒砉堤? 杻釾穴永皿螝? �心煋心𦵴$

Point坼wise?Convolution
? 1x1�心煋心毛?丹,?�呾講?丟乒伉講毛祅𦑩
47
＃
k
k
M
M
C
C
N
1
1
M
M
C
C
N
Andrew?G.?Howard?et.?al?"MobileNets:?Efficient?Convolutional?Neural?Networks?for?Mobile?
Vision?Applications,?arXiv:1704.04861

緙�腔卅脹�俶
? ヽ渾�?
? 煦汃 ?
午卅月螝? 毛?中月午
﹜
反緙�腔卞脹�
48
螝?�煋心暫湔�煋心

暫湔PNN及蜊囡↙NCNN(k)
(Noise?CNN:?NCNN)
? CVPR2018匹PNN?(��NN)[1]互逃桶今木凶互＃
↙�𦵴互螝?�心煋心
↙(杻卞)??賒砉互 �隅( ﹜ )
毛㦤凶今卅中(=脹�俶互傖?仄卅中,庲舑儕僅腴狟)
49
[1] F. Juefei-Xu, V. N. Boddeti, and M. Savvides, "Perturbative Neural Networks," CVPR, 2018, Vol. 1.
[2] A. Munakata, S. Sato, H. Nakahara, ※A Noise Convolutional Neural Network,§ ISMVL, 2019 (accepted).
螝
?
�
煋
心
𦵴
�
磐
磁
𦵴
暫
湔
3℅
3
�
煋
心
𦵴
k n-k
NCNN(k) [2]
暫湔�煋心𦵴午
螝?�煋心𦵴及
甩奶皮伉永玉
�隅毛㦤凶允引匹
暫湔�煋心毛?丹

? �𦵴毛螝?�煋心𦵴午允月午儕僅輾趙
? 菴1𦵴毛暫湔�煋心𦵴午仄凶NCNN(1)反儕僅輾趙毛0.4禾奶件玄
匹眚秶仄勾勾,?由仿丟奈正毛88%祅𦑩
暫湔CNN,?PNN午及?廌
50
弁仿旦煦�正旦弁及?廌 (乒犯伙?AlexNet﹜犯奈正本永玄?CIFAR-100)
PNN
[CVPR2018]
NCNN(1)
(Ours)
暫湔CNN
庲舑儕僅(%) 29.1 49.4 49.8
�𦵴及笭心(MB) 1.1 1.2 10.0
笭心及祅𦑩薹 0.89 0.88 坼

螝?�煋心隙繚
51
Off坼Chip
DDR
Memory
RND
BN
Unit
Act
Unit
+
Point坼wise
Conv?Unit
Buffer
Point坼wise?
Conv?Unit
Buffer
Point坼wise?
Conv?Unit
Buffer
W.Mem
W.Mem
W.Mem
＃
Point坼wise
�煋心栳呾け
Weight
Mem.
Bias
Mem.
BN
Unit
Act
UnitInput Reg+
用奶朮
?傖け
DDR?Controller

? NCNN反CNN午?屯化悝�媆嶲毛30坼40%祅𦑩
1epoch黱及悝�媆嶲午芢�媆嶲
52
乒犯伙?ResNet-18﹜犯奈正本永玄?CIFAR-100
GPU: Nvidia GTX 1080Ti
NCNN卞云仃月
CNN及𦵴杅
1 3 7 11 15 CNN
悝�媆嶲(s) 50.3 48.8 45.1 46.4 59.1 75.2

暫湔及灍蚾磐彆午及?廌
Implementation
(Year)
Zhao?et?al.
(2017)?[1]
FINN
(2017)?[2]
Boucle?et?al.
(2017)?[3]
Ours
(2019)
CNN Binary Binary Ternary Noise
Clock?(MHz) 143 166 250 199
#LUTs
#18Kb?BRAMs
#DSP?48Es
46900
94
3
42823
270
32
67300
667
0
40911
228
192
Accuracy?(%) 87.73% 80.10% 86.71% 92.35%
Time?[msec]
(FPS?[s坼1])
5.94
(168)
2.24
(445)
2.36
(423)
1.80
(557)
Power 4.7 2.5 6.8 3.5
53
Binary, Ternary方曰手?厒井勾?庲舑儕僅, 凶分仄DSP皮伕永弁斛猁
VGG9毛矛奈旦卞仄凶CNN匹啐�, 犯奈正本永玄反CIFAR10
[1] R. Zhao, W. Song, W. Zhang, T. Xing, J.坼H. Lin, M. Srivastava, R. Gupta and Z. Zhang, ※Accelerating
Binarized Convolutional Neural Networks with Software坼Programmable FPGAs,§ ISFPGA, 2017, pp.15坼24.
[2] Y. Umuroglu, N. J. Fraser, G. Gambardella, M. Blott, P. Leong, M. Jahre, and K. Vissers,
※FINN: A Framework for Fast, Scalable Binarized Neural Network Inference,§ ISFPGA, 2017.
[3] A. P坼. Boucle, A. Bourge, F. Ptrot, H. Alemdar, N. Caldwell, and V. Leroy, ※Scalable high坼performance
architecture for convolutional ternary neural networks on FPGA,§ FPL, 2017, pp.1每7.

引午戶
? 螝?�心煋心 (NCNN)
? 用奶朮及俶斮毛瞳?仄化庲舑儕僅輾趙毛眚秶
? FPGA灍蚾毛?中暫湔?楊午及?廌
? DSP互斛猁匹丐月手及及,?Binary,?Ternary?午?廌仄化
庲舑儕僅毛砃奻仄勾勾?厒趙絻傖
? 弁仿旦煦�方曰手?僅卅正旦弁卞羥?褫夔
? 踏摽及掝觳
? 灍?腔卅失皿伉弗奈扑亦件尺及羥?↙YOLOv2匹五凶方?
54

Recommended

ㄡ�趙CNN on FPGA匹GPU午布民件戊田玄伙ㄗ鼠嶱唳ㄘ

ㄡ�趙CNN on FPGA匹GPU午布民件戊田玄伙ㄗ鼠嶱唳ㄘ

ㄡ�趙CNN on FPGA匹GPU午布民件戊田玄伙ㄗ鼠嶱唳ㄘHiroki Nakahara

?

穴伙民戊失毛蚚中凶賒砉�I燴Norishige Fukushima

?

2014爛6堎卞嶱殼今木凶SSII2014ㄗhttp://www.ssii.jp/ㄘ及民亙奈玄伉失伙琌栳蚚揃蹋匹允ㄝ妏蚚仄凶戊奈玉脹反仇切日ㄝ https://github.com/norishigefukushima/SSII2014 失皮旦玄仿弁玄 ☆CPU及弁伕永弁杅互爛堎午午手卞�樓允月媆測反皺歹曰﹜皿伕弘仿丞及詢厒趙毛CPU及俶夔砃奻卞￤六月仇午及匹五月白伉奈仿件民及媆測反皺歹曰毛茩尹化中引允﹝仄井仄丞奈失及楊�t反中引分卞適中化云曰﹜CPU反穴伙民戊失趙﹜SIMD趙午中丹倛匹詢俶夔趙互適中化中引允﹝掛民亙奈玄伉失伙匹反﹜�呾戊旦玄及詢中賒砉�I燴毛詢厒趙允月凶戶卞﹜CPU及夔薯毛丐引允仇午卅仁竘五堤允﹜穴伙民戊失皿伕弘仿立件弘﹜SIMD皿伕弘仿立件弘毛賤掊仄引允﹝★

郪心煋心憝杅ㄗ勳紳喧娶勳紳莽勳釵ㄘ卞方月釦梆紼嗨⻌藷

郪心煋心憝杅ㄗ勳紳喧娶勳紳莽勳釵ㄘ卞方月釦梆紼嗨⻌藷

郪心煋心憝杅ㄗ勳紳喧娶勳紳莽勳釵ㄘ卞方月釦梆紼嗨⻌藷Norishige Fukushima

?

喘莉聆硃域及庄賡午公及笚煘MITSUNARI Shigeo

?

中引今日恓仃卅中ㄐ唬惚嗨插詢厒趙⻌藷

中引今日恓仃卅中ㄐ唬惚嗨插詢厒趙⻌藷

中引今日恓仃卅中ㄐ唬惚嗨插詢厒趙⻌藷Fixstars Corporation

?

Vivado hls辭�頗3ㄗaxi4 lite slaveㄘ

Vivado hls辭�頗3ㄗaxi4 lite slaveㄘ

Vivado hls辭�頗3ㄗaxi4 lite slaveㄘmarsee101

?

Vivado HLS 辭�頗揃蹋及3楓醴匹允﹝ Vivado HLS 2015.4 毛妏蚚仄化﹜踏引匹支勻化五凶𨩆仃呾隙繚毛AXI4 Lite Slave奶件正奈白尼奈旦匹灍蚾仄引允﹝ Vivado HLS匹IP趙毛俴勻化﹜Vivado 2015.4及IPI毛妏蚚仄化ZYBO卞灍蚾仄引允﹝ Vivado HLS匹赻�腔卞釬庨今木凶玉仿奶田毛妏蚚仄化﹜失皿伉弗奈扑亦件毛釬庨仄﹜𨩆仃呾隙繚毛秶郘仄引允﹝ ZYBO灍辻匹𨩆仃呾隙繚毛�釬今六引允﹝扑伉失伙?正奈立瓜伙匹𨩆仃呾毛俴中引允﹝

[DL�掂頗]Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Ima...

[DL�掂頗]Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Ima...

[DL�掂頗]Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Ima...Deep Learning JP

?

▽DL�掂頗▼Flamingo: a Visual Language Model for Few-Shot Learning 賒砉℅晟惤及湮�耀價屜乒...

▽DL�掂頗▼Flamingo: a Visual Language Model for Few-Shot Learning 賒砉℅晟惤及湮�耀價屜乒...

▽DL�掂頗▼Flamingo: a Visual Language Model for Few-Shot Learning 賒砉℅晟惤及湮�耀價屜乒...Deep Learning JP

?

插唬賊勳它尼申瓜奈ㄩ苤珧�仍蔡栳訧蹋

插唬賊勳它尼申瓜奈ㄩ苤珧�仍蔡栳訧蹋

插唬賊勳它尼申瓜奈ㄩ苤珧�仍蔡栳訧蹋眻壅蛂捶

?

Vivado hls辭�頗2ㄗ伊斥旦正及浲⻌午pipeline犯奴伊弁氾奴皮ㄘ

Vivado hls辭�頗2ㄗ伊斥旦正及浲⻌午pipeline犯奴伊弁氾奴皮ㄘ

Vivado hls辭�頗2ㄗ伊斥旦正及浲⻌午pipeline犯奴伊弁氾奴皮ㄘmarsee101

?

Vivado HLS辭�頗揃蹋及2楓醴匹﹜郔場卞1楓醴及揃蹋井日郘笊狟今中﹝ 踏隙反﹜犯奴伊弁氾奴皮毛妏勻化﹜⻌薯﹜公仄化堤薯卞伊斥旦正毛浲⻌仄化﹜PIPELINE犯奴伊弁氾奴皮毛⻌木化由奶皿仿奶件趙仄引允﹝ 棒卞PIPELINE犯奴伊弁氾奴皮及𡛟蚚午仄化﹜rewind 左皿扑亦件毛妏勻化犯奴旦皿伊奶?戊件玄伕奈仿毛灍蚾仄化心引允﹝

Vivado hls辭�頗1ㄗ價渙�ㄘ

Vivado hls辭�頗1ㄗ價渙�ㄘ

Vivado hls辭�頗1ㄗ價渙�ㄘmarsee101

?

Halide 卞方月賒砉�I燴皿伕弘仿立件弘⻌嬡

Halide 卞方月賒砉�I燴皿伕弘仿立件弘⻌嬡

Halide 卞方月賒砉�I燴皿伕弘仿立件弘⻌嬡Fixstars Corporation

?

左奈皿件末奈旦戊件由奶仿捧捧眶梗紳匹勾仁月巨永斥?犯奴奈皿仿奈瓦件弘扑旦氾丞

左奈皿件末奈旦戊件由奶仿捧捧眶梗紳匹勾仁月巨永斥?犯奴奈皿仿奈瓦件弘扑旦氾丞

左奈皿件末奈旦戊件由奶仿捧捧眶梗紳匹勾仁月巨永斥?犯奴奈皿仿奈瓦件弘扑旦氾丞Shinya Takamaeda-Y

?

▽丟正扔奈矛奶▼價屜乒犯伙 / Foundation Models

▽丟正扔奈矛奶▼價屜乒犯伙 / Foundation Models

▽丟正扔奈矛奶▼價屜乒犯伙 / Foundation Modelscvpaper. challenge

?

☆踏゜井日妏中ピ月★凶戶及 GNU Parallel卞方月�K蹈�I燴⻌嬡

☆踏゜井日妏中ピ月★凶戶及 GNU Parallel卞方月�K蹈�I燴⻌嬡

☆踏゜井日妏中ピ月★凶戶及 GNU Parallel卞方月�K蹈�I燴⻌嬡Koji Matsuda

?

SSII2020SS: 弘仿白犯奈正匹手旮𦵴悝� ? Graph Neural Networks ⻌嬡 ?

SSII2020SS: 弘仿白犯奈正匹手旮𦵴悝� ? Graph Neural Networks ⻌嬡 ?

SSII2020SS: 弘仿白犯奈正匹手旮𦵴悝� ? Graph Neural Networks ⻌嬡 ?SSII

?

SSII2020 撮胍�砃賤掊本永扑亦件 SS1 6/11 (躂) 14:00‵14:30﹛丟奶件頗� (vimeo + sli.do) 弘仿白�婖毛手勾犯奈正卞�允月 DNN﹜允卅歹切 Graph Neural Networks (GNNs) 及旃噶反仇及ㄡ﹜ㄢ爛匹統樓允月旃噶氪互摹�仄化中月﹝政袨﹜�〝卅失奈平氾弁民乓及 GNN 互�〝卅玉丟奶件支�〝卅正旦弁匹��e卞枑偶今木﹜衙紝毛袙尹月及手��g匹反卅中袨颷卞卅勻化中月﹝掛民亙奈玄伉失伙反﹜𣷣�卞汃日壬勻凶 GNN 旃噶及政袨卞勾中化及衙紝午價屜撮胍毛畿賡允月午午手卞﹜媆嶲互偝允��匹戊件疋亙奈正申斥亦件薆郖卞云仃月𡛟蚚瞰及畿賡卞手龰曰瞎心凶中﹝

[DL�掂頗]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...

[DL�掂頗]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...

[DL�掂頗]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...Deep Learning JP

?

[DL�掂頗]A Simple Unified Framework for Detecting Out-of-Distribution Samples a...

[DL�掂頗]A Simple Unified Framework for Detecting Out-of-Distribution Samples a...

[DL�掂頗]A Simple Unified Framework for Detecting Out-of-Distribution Samples a...Deep Learning JP

?

乒犯伙詢厒趙啃恁Yusuke Uchida

?

賒砉本件扑件弘扑件禾斥它丞 (SSII 2019) 及き賒本永扑亦件☆旮𦵴悝�及詢厒趙 ? 詢厒民永皿﹜煦汃悝�﹜幏講乒犯伙 ??★及琌栳揃蹋匹允﹝ 旮𦵴悝�乒犯伙毛詢厒趙允月狟�6意�及忒楊及賤掊匹允﹝ - �心煋心及煦賤 (Factorization) - 皉尌曰 (Pruning) - 失奈平氾弁民乓抻坰 (Neural Architecture Search; NAS) - 婌ヽ皺賸﹜�腔�呾弘仿白?(Early Termination, Dynamic Computation Graph) - 淛隱 (Distillation) - 講赽趙 (Quantization)

▽DL�掂頗▼NeRF-VAE: A Geometry Aware 3D Scene Generative Model

▽DL�掂頗▼NeRF-VAE: A Geometry Aware 3D Scene Generative Model

▽DL�掂頗▼NeRF-VAE: A Geometry Aware 3D Scene Generative ModelDeep Learning JP

?

NeRF-VAE is a 3D scene generative model that combines Neural Radiance Fields (NeRF) and Generative Query Networks (GQN) with a variational autoencoder (VAE). It uses a NeRF decoder to generate novel views conditioned on a latent code. An encoder extracts latent codes from input views. During training, it maximizes the evidence lower bound to learn the latent space of scenes and allow for novel view synthesis. NeRF-VAE aims to generate photorealistic novel views of scenes by leveraging NeRF's view synthesis abilities within a generative model framework.

2�犯奴奈皿瓦亙奈仿伙生永玄伐奈弁午瞎煋心辻け尺及𡛟蚚: 嶱逃笢及汁奈伙畿賡

2�犯奴奈皿瓦亙奈仿伙生永玄伐奈弁午瞎煋心辻け尺及𡛟蚚: 嶱逃笢及汁奈伙畿賡

2�犯奴奈皿瓦亙奈仿伙生永玄伐奈弁午瞎煋心辻け尺及𡛟蚚: 嶱逃笢及汁奈伙畿賡Hiroki Nakahara

?

Point netFujimoto Keisuke

?

PyData.Tokyo Meetup #21 琌栳揃蹋☆Optuna 甩奶由奈由仿丟奈正郔羥趙白伊奈丞伐奈弁★怮泬翩

PyData.Tokyo Meetup #21 琌栳揃蹋☆Optuna 甩奶由奈由仿丟奈正郔羥趙白伊奈丞伐奈弁★怮泬翩

PyData.Tokyo Meetup #21 琌栳揃蹋☆Optuna 甩奶由奈由仿丟奈正郔羥趙白伊奈丞伐奈弁★怮泬翩Preferred Networks

?

ARM CPU卞云仃月SIMD毛蚚中凶詢厒�呾⻌嬡

ARM CPU卞云仃月SIMD毛蚚中凶詢厒�呾⻌嬡

ARM CPU卞云仃月SIMD毛蚚中凶詢厒�呾⻌嬡Fixstars Corporation

?

賒砉�I燴及詢俶夔數呾Norishige Fukushima

?

捩娶棗鳥梗喧堯梗喝莽⻌藷井日堍蚚引匹章菁賤掊

捩娶棗鳥梗喧堯梗喝莽⻌藷井日堍蚚引匹章菁賤掊

捩娶棗鳥梗喧堯梗喝莽⻌藷井日堍蚚引匹章菁賤掊惸� 湮睿挌

?

▽DL�掂頗▼"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"

▽DL�掂頗▼"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"

▽DL�掂頗▼"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"Deep Learning JP

?

SSII2022 [OS3-02] Federated Learning及價渙午𡛟蚚

SSII2022 [OS3-02] Federated Learning及價渙午𡛟蚚

SSII2022 [OS3-02] Federated Learning及價渙午𡛟蚚SSII

?

SSII2022 [OS3-02] Federated Learning及價渙午𡛟蚚 6堎10゜ (踢) 11:00 - 12:30 丟奶件頗� 腎�氪ㄩ昹帣燴祩庌ㄗ𡌂儔馱𦲀湮悝ㄘ衙猁ㄩFederated Learning (FL)午反﹜煦汃仄化悵厥今木凶犯奈正毛�摩?摩廣允月仇午卅仁辻迮悝�乒犯伙及��卞蚚中月源楊匹丐月﹝賒砉支秞汒﹜目伙旦弗失ロ�卅升��ロ�支辻躇ロ�及悵荾及紝萸井日摩廣互褣仄中犯奈正毛辻迮悝�尺魂蚚匹五月午中丹ヽ渾井日﹜悝胍云方太宴𦲀及�I醱井日蛁醴毛摩戶化中月﹝掛琌栳匹反﹜FL及埻燴午𡛟蚚瞰﹜FL及掝觳賤𢜪卞砃仃凶輪爛及龰曰瞎心卞勾中化賤掊允月﹝

嗣杅及弘仿白井日及緙�腔辻迮悝� (2014.7.24 �馱眭夔悝頗菴94隙�馱眭夔價掛�觳旃噶頗桸渾琌栳)

嗣杅及弘仿白井日及緙�腔辻迮悝� (2014.7.24 �馱眭夔悝頗菴94隙�馱眭夔價掛�觳旃噶頗桸渾琌栳)

嗣杅及弘仿白井日及緙�腔辻迮悝� (2014.7.24 �馱眭夔悝頗菴94隙�馱眭夔價掛�觳旃噶頗桸渾琌栳)Ichigaku Takigawa

?

汜韜褪悝匹及抻坰腔卅蚚芴毛癩芛卞﹜煦赽弘仿白卅升跺〝及�砓互弘仿白凳婖匹桶珋今木凶犯奈正互嗣杅匎儅今木化中月﹝掛蔡栳匹反﹜仇丹仄凶犯奈正卞�仄化﹜跪〝及弘仿白眶卞睡井憝蟀�聆互葆迵今木化中月部磁卞﹜(眶,聆)及嗣杅岈瞰卞價勿仁�𡛟眶↙聆及諒呇葆五悝炾毛俴丹忒楊毛衙掊允月﹝仇及方丹卅恀枙及瞰午仄化反﹜丐月趙悝凳婖及趙磁昜互芼�劐祑袀逃俶毛厥勾井毛軑聆允月恀枙卅升互丐曰﹜弘仿白市奈生伙楊毛反元戶午仄化弘仿白摩磁奻及苀數腔儂迮悝炾卞方曰謎中賦彆互腕日木化中月﹝引凶﹜蔡栳氪互輪爛龰曰郪氏匹五凶�化及褫夔卅窒煦弘仿白杻釾井日浩悝炾卞價勿五杻釾摩磁午盄倛乒犯伙及肮奀悝炾毛俴丹�躇楊午憝蟀忒楊手�六化庄賡允月﹝

紼硃梯賊梗餃喝釵梗卞方月湮寞耀犯奈正毛瞳蚚仄凶儂迮悝炾

紼硃梯賊梗餃喝釵梗卞方月湮寞耀犯奈正毛瞳蚚仄凶儂迮悝炾

紼硃梯賊梗餃喝釵梗卞方月湮寞耀犯奈正毛瞳蚚仄凶儂迮悝炾Preferred Networks

?

More Related Content

What's hot (20)

插唬賊勳它尼申瓜奈ㄩ苤珧�仍蔡栳訧蹋

插唬賊勳它尼申瓜奈ㄩ苤珧�仍蔡栳訧蹋

插唬賊勳它尼申瓜奈ㄩ苤珧�仍蔡栳訧蹋眻壅蛂捶

?

Vivado hls辭�頗2ㄗ伊斥旦正及浲⻌午pipeline犯奴伊弁氾奴皮ㄘ

Vivado hls辭�頗2ㄗ伊斥旦正及浲⻌午pipeline犯奴伊弁氾奴皮ㄘ

Vivado hls辭�頗2ㄗ伊斥旦正及浲⻌午pipeline犯奴伊弁氾奴皮ㄘmarsee101

?

Vivado HLS辭�頗揃蹋及2楓醴匹﹜郔場卞1楓醴及揃蹋井日郘笊狟今中﹝ 踏隙反﹜犯奴伊弁氾奴皮毛妏勻化﹜⻌薯﹜公仄化堤薯卞伊斥旦正毛浲⻌仄化﹜PIPELINE犯奴伊弁氾奴皮毛⻌木化由奶皿仿奶件趙仄引允﹝ 棒卞PIPELINE犯奴伊弁氾奴皮及𡛟蚚午仄化﹜rewind 左皿扑亦件毛妏勻化犯奴旦皿伊奶?戊件玄伕奈仿毛灍蚾仄化心引允﹝

Vivado hls辭�頗1ㄗ價渙�ㄘ

Vivado hls辭�頗1ㄗ價渙�ㄘ

Vivado hls辭�頗1ㄗ價渙�ㄘmarsee101

?

Halide 卞方月賒砉�I燴皿伕弘仿立件弘⻌嬡

Halide 卞方月賒砉�I燴皿伕弘仿立件弘⻌嬡

Halide 卞方月賒砉�I燴皿伕弘仿立件弘⻌嬡Fixstars Corporation

?

左奈皿件末奈旦戊件由奶仿捧捧眶梗紳匹勾仁月巨永斥?犯奴奈皿仿奈瓦件弘扑旦氾丞

左奈皿件末奈旦戊件由奶仿捧捧眶梗紳匹勾仁月巨永斥?犯奴奈皿仿奈瓦件弘扑旦氾丞

左奈皿件末奈旦戊件由奶仿捧捧眶梗紳匹勾仁月巨永斥?犯奴奈皿仿奈瓦件弘扑旦氾丞Shinya Takamaeda-Y

?

▽丟正扔奈矛奶▼價屜乒犯伙 / Foundation Models

▽丟正扔奈矛奶▼價屜乒犯伙 / Foundation Models

▽丟正扔奈矛奶▼價屜乒犯伙 / Foundation Modelscvpaper. challenge

?

☆踏゜井日妏中ピ月★凶戶及 GNU Parallel卞方月�K蹈�I燴⻌嬡

☆踏゜井日妏中ピ月★凶戶及 GNU Parallel卞方月�K蹈�I燴⻌嬡

☆踏゜井日妏中ピ月★凶戶及 GNU Parallel卞方月�K蹈�I燴⻌嬡Koji Matsuda

?

SSII2020SS: 弘仿白犯奈正匹手旮𦵴悝� ? Graph Neural Networks ⻌嬡 ?

SSII2020SS: 弘仿白犯奈正匹手旮𦵴悝� ? Graph Neural Networks ⻌嬡 ?

SSII2020SS: 弘仿白犯奈正匹手旮𦵴悝� ? Graph Neural Networks ⻌嬡 ?SSII

?

SSII2020 撮胍�砃賤掊本永扑亦件 SS1 6/11 (躂) 14:00‵14:30﹛丟奶件頗� (vimeo + sli.do) 弘仿白�婖毛手勾犯奈正卞�允月 DNN﹜允卅歹切 Graph Neural Networks (GNNs) 及旃噶反仇及ㄡ﹜ㄢ爛匹統樓允月旃噶氪互摹�仄化中月﹝政袨﹜�〝卅失奈平氾弁民乓及 GNN 互�〝卅玉丟奶件支�〝卅正旦弁匹��e卞枑偶今木﹜衙紝毛袙尹月及手��g匹反卅中袨颷卞卅勻化中月﹝掛民亙奈玄伉失伙反﹜𣷣�卞汃日壬勻凶 GNN 旃噶及政袨卞勾中化及衙紝午價屜撮胍毛畿賡允月午午手卞﹜媆嶲互偝允��匹戊件疋亙奈正申斥亦件薆郖卞云仃月𡛟蚚瞰及畿賡卞手龰曰瞎心凶中﹝

[DL�掂頗]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...

[DL�掂頗]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...

[DL�掂頗]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...Deep Learning JP

?

[DL�掂頗]A Simple Unified Framework for Detecting Out-of-Distribution Samples a...

[DL�掂頗]A Simple Unified Framework for Detecting Out-of-Distribution Samples a...

[DL�掂頗]A Simple Unified Framework for Detecting Out-of-Distribution Samples a...Deep Learning JP

?

乒犯伙詢厒趙啃恁Yusuke Uchida

?

賒砉本件扑件弘扑件禾斥它丞 (SSII 2019) 及き賒本永扑亦件☆旮𦵴悝�及詢厒趙 ? 詢厒民永皿﹜煦汃悝�﹜幏講乒犯伙 ??★及琌栳揃蹋匹允﹝ 旮𦵴悝�乒犯伙毛詢厒趙允月狟�6意�及忒楊及賤掊匹允﹝ - �心煋心及煦賤 (Factorization) - 皉尌曰 (Pruning) - 失奈平氾弁民乓抻坰 (Neural Architecture Search; NAS) - 婌ヽ皺賸﹜�腔�呾弘仿白?(Early Termination, Dynamic Computation Graph) - 淛隱 (Distillation) - 講赽趙 (Quantization)

▽DL�掂頗▼NeRF-VAE: A Geometry Aware 3D Scene Generative Model

▽DL�掂頗▼NeRF-VAE: A Geometry Aware 3D Scene Generative Model

▽DL�掂頗▼NeRF-VAE: A Geometry Aware 3D Scene Generative ModelDeep Learning JP

?

NeRF-VAE is a 3D scene generative model that combines Neural Radiance Fields (NeRF) and Generative Query Networks (GQN) with a variational autoencoder (VAE). It uses a NeRF decoder to generate novel views conditioned on a latent code. An encoder extracts latent codes from input views. During training, it maximizes the evidence lower bound to learn the latent space of scenes and allow for novel view synthesis. NeRF-VAE aims to generate photorealistic novel views of scenes by leveraging NeRF's view synthesis abilities within a generative model framework.

2�犯奴奈皿瓦亙奈仿伙生永玄伐奈弁午瞎煋心辻け尺及𡛟蚚: 嶱逃笢及汁奈伙畿賡

2�犯奴奈皿瓦亙奈仿伙生永玄伐奈弁午瞎煋心辻け尺及𡛟蚚: 嶱逃笢及汁奈伙畿賡

2�犯奴奈皿瓦亙奈仿伙生永玄伐奈弁午瞎煋心辻け尺及𡛟蚚: 嶱逃笢及汁奈伙畿賡Hiroki Nakahara

?

Point netFujimoto Keisuke

?

PyData.Tokyo Meetup #21 琌栳揃蹋☆Optuna 甩奶由奈由仿丟奈正郔羥趙白伊奈丞伐奈弁★怮泬翩

PyData.Tokyo Meetup #21 琌栳揃蹋☆Optuna 甩奶由奈由仿丟奈正郔羥趙白伊奈丞伐奈弁★怮泬翩

PyData.Tokyo Meetup #21 琌栳揃蹋☆Optuna 甩奶由奈由仿丟奈正郔羥趙白伊奈丞伐奈弁★怮泬翩Preferred Networks

?

ARM CPU卞云仃月SIMD毛蚚中凶詢厒�呾⻌嬡

ARM CPU卞云仃月SIMD毛蚚中凶詢厒�呾⻌嬡

ARM CPU卞云仃月SIMD毛蚚中凶詢厒�呾⻌嬡Fixstars Corporation

?

賒砉�I燴及詢俶夔數呾Norishige Fukushima

?

捩娶棗鳥梗喧堯梗喝莽⻌藷井日堍蚚引匹章菁賤掊

捩娶棗鳥梗喧堯梗喝莽⻌藷井日堍蚚引匹章菁賤掊

捩娶棗鳥梗喧堯梗喝莽⻌藷井日堍蚚引匹章菁賤掊惸� 湮睿挌

?

▽DL�掂頗▼"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"

▽DL�掂頗▼"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"

▽DL�掂頗▼"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"Deep Learning JP

?

SSII2022 [OS3-02] Federated Learning及價渙午𡛟蚚

SSII2022 [OS3-02] Federated Learning及價渙午𡛟蚚

SSII2022 [OS3-02] Federated Learning及價渙午𡛟蚚SSII

?

SSII2022 [OS3-02] Federated Learning及價渙午𡛟蚚 6堎10゜ (踢) 11:00 - 12:30 丟奶件頗� 腎�氪ㄩ昹帣燴祩庌ㄗ𡌂儔馱𦲀湮悝ㄘ衙猁ㄩFederated Learning (FL)午反﹜煦汃仄化悵厥今木凶犯奈正毛�摩?摩廣允月仇午卅仁辻迮悝�乒犯伙及��卞蚚中月源楊匹丐月﹝賒砉支秞汒﹜目伙旦弗失ロ�卅升��ロ�支辻躇ロ�及悵荾及紝萸井日摩廣互褣仄中犯奈正毛辻迮悝�尺魂蚚匹五月午中丹ヽ渾井日﹜悝胍云方太宴𦲀及�I醱井日蛁醴毛摩戶化中月﹝掛琌栳匹反﹜FL及埻燴午𡛟蚚瞰﹜FL及掝觳賤𢜪卞砃仃凶輪爛及龰曰瞎心卞勾中化賤掊允月﹝

插唬賊勳它尼申瓜奈ㄩ苤珧�仍蔡栳訧蹋

插唬賊勳它尼申瓜奈ㄩ苤珧�仍蔡栳訧蹋

插唬賊勳它尼申瓜奈ㄩ苤珧�仍蔡栳訧蹋眻壅蛂捶

?

Vivado hls辭�頗2ㄗ伊斥旦正及浲⻌午pipeline犯奴伊弁氾奴皮ㄘ

Vivado hls辭�頗2ㄗ伊斥旦正及浲⻌午pipeline犯奴伊弁氾奴皮ㄘ

Vivado hls辭�頗2ㄗ伊斥旦正及浲⻌午pipeline犯奴伊弁氾奴皮ㄘmarsee101

?

Vivado hls辭�頗1ㄗ價渙�ㄘ

Vivado hls辭�頗1ㄗ價渙�ㄘ

Vivado hls辭�頗1ㄗ價渙�ㄘmarsee101

?

Halide 卞方月賒砉�I燴皿伕弘仿立件弘⻌嬡

Halide 卞方月賒砉�I燴皿伕弘仿立件弘⻌嬡

Halide 卞方月賒砉�I燴皿伕弘仿立件弘⻌嬡Fixstars Corporation

?

左奈皿件末奈旦戊件由奶仿捧捧眶梗紳匹勾仁月巨永斥?犯奴奈皿仿奈瓦件弘扑旦氾丞

左奈皿件末奈旦戊件由奶仿捧捧眶梗紳匹勾仁月巨永斥?犯奴奈皿仿奈瓦件弘扑旦氾丞

左奈皿件末奈旦戊件由奶仿捧捧眶梗紳匹勾仁月巨永斥?犯奴奈皿仿奈瓦件弘扑旦氾丞Shinya Takamaeda-Y

?

▽丟正扔奈矛奶▼價屜乒犯伙 / Foundation Models

▽丟正扔奈矛奶▼價屜乒犯伙 / Foundation Models

▽丟正扔奈矛奶▼價屜乒犯伙 / Foundation Modelscvpaper. challenge

?

☆踏゜井日妏中ピ月★凶戶及 GNU Parallel卞方月�K蹈�I燴⻌嬡

☆踏゜井日妏中ピ月★凶戶及 GNU Parallel卞方月�K蹈�I燴⻌嬡

☆踏゜井日妏中ピ月★凶戶及 GNU Parallel卞方月�K蹈�I燴⻌嬡Koji Matsuda

?

SSII2020SS: 弘仿白犯奈正匹手旮𦵴悝� ? Graph Neural Networks ⻌嬡 ?

SSII2020SS: 弘仿白犯奈正匹手旮𦵴悝� ? Graph Neural Networks ⻌嬡 ?

SSII2020SS: 弘仿白犯奈正匹手旮𦵴悝� ? Graph Neural Networks ⻌嬡 ?SSII

?

[DL�掂頗]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...

[DL�掂頗]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...

[DL�掂頗]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...Deep Learning JP

?

[DL�掂頗]A Simple Unified Framework for Detecting Out-of-Distribution Samples a...

[DL�掂頗]A Simple Unified Framework for Detecting Out-of-Distribution Samples a...

[DL�掂頗]A Simple Unified Framework for Detecting Out-of-Distribution Samples a...Deep Learning JP

?

乒犯伙詢厒趙啃恁Yusuke Uchida

?

▽DL�掂頗▼NeRF-VAE: A Geometry Aware 3D Scene Generative Model

▽DL�掂頗▼NeRF-VAE: A Geometry Aware 3D Scene Generative Model

▽DL�掂頗▼NeRF-VAE: A Geometry Aware 3D Scene Generative ModelDeep Learning JP

?

2�犯奴奈皿瓦亙奈仿伙生永玄伐奈弁午瞎煋心辻け尺及𡛟蚚: 嶱逃笢及汁奈伙畿賡

2�犯奴奈皿瓦亙奈仿伙生永玄伐奈弁午瞎煋心辻け尺及𡛟蚚: 嶱逃笢及汁奈伙畿賡

2�犯奴奈皿瓦亙奈仿伙生永玄伐奈弁午瞎煋心辻け尺及𡛟蚚: 嶱逃笢及汁奈伙畿賡Hiroki Nakahara

?

Point netFujimoto Keisuke

?

PyData.Tokyo Meetup #21 琌栳揃蹋☆Optuna 甩奶由奈由仿丟奈正郔羥趙白伊奈丞伐奈弁★怮泬翩

PyData.Tokyo Meetup #21 琌栳揃蹋☆Optuna 甩奶由奈由仿丟奈正郔羥趙白伊奈丞伐奈弁★怮泬翩

PyData.Tokyo Meetup #21 琌栳揃蹋☆Optuna 甩奶由奈由仿丟奈正郔羥趙白伊奈丞伐奈弁★怮泬翩Preferred Networks

?

ARM CPU卞云仃月SIMD毛蚚中凶詢厒�呾⻌嬡

ARM CPU卞云仃月SIMD毛蚚中凶詢厒�呾⻌嬡

ARM CPU卞云仃月SIMD毛蚚中凶詢厒�呾⻌嬡Fixstars Corporation

?

賒砉�I燴及詢俶夔數呾Norishige Fukushima

?

捩娶棗鳥梗喧堯梗喝莽⻌藷井日堍蚚引匹章菁賤掊

捩娶棗鳥梗喧堯梗喝莽⻌藷井日堍蚚引匹章菁賤掊

捩娶棗鳥梗喧堯梗喝莽⻌藷井日堍蚚引匹章菁賤掊惸� 湮睿挌

?

▽DL�掂頗▼"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"

▽DL�掂頗▼"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"

▽DL�掂頗▼"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"Deep Learning JP

?

SSII2022 [OS3-02] Federated Learning及價渙午𡛟蚚

SSII2022 [OS3-02] Federated Learning及價渙午𡛟蚚

SSII2022 [OS3-02] Federated Learning及價渙午𡛟蚚SSII

?

Similar to FPGAX2019 (20)

嗣杅及弘仿白井日及緙�腔辻迮悝� (2014.7.24 �馱眭夔悝頗菴94隙�馱眭夔價掛�觳旃噶頗桸渾琌栳)

嗣杅及弘仿白井日及緙�腔辻迮悝� (2014.7.24 �馱眭夔悝頗菴94隙�馱眭夔價掛�觳旃噶頗桸渾琌栳)

嗣杅及弘仿白井日及緙�腔辻迮悝� (2014.7.24 �馱眭夔悝頗菴94隙�馱眭夔價掛�觳旃噶頗桸渾琌栳)Ichigaku Takigawa

?

汜韜褪悝匹及抻坰腔卅蚚芴毛癩芛卞﹜煦赽弘仿白卅升跺〝及�砓互弘仿白凳婖匹桶珋今木凶犯奈正互嗣杅匎儅今木化中月﹝掛蔡栳匹反﹜仇丹仄凶犯奈正卞�仄化﹜跪〝及弘仿白眶卞睡井憝蟀�聆互葆迵今木化中月部磁卞﹜(眶,聆)及嗣杅岈瞰卞價勿仁�𡛟眶↙聆及諒呇葆五悝炾毛俴丹忒楊毛衙掊允月﹝仇及方丹卅恀枙及瞰午仄化反﹜丐月趙悝凳婖及趙磁昜互芼�劐祑袀逃俶毛厥勾井毛軑聆允月恀枙卅升互丐曰﹜弘仿白市奈生伙楊毛反元戶午仄化弘仿白摩磁奻及苀數腔儂迮悝炾卞方曰謎中賦彆互腕日木化中月﹝引凶﹜蔡栳氪互輪爛龰曰郪氏匹五凶�化及褫夔卅窒煦弘仿白杻釾井日浩悝炾卞價勿五杻釾摩磁午盄倛乒犯伙及肮奀悝炾毛俴丹�躇楊午憝蟀忒楊手�六化庄賡允月﹝

紼硃梯賊梗餃喝釵梗卞方月湮寞耀犯奈正毛瞳蚚仄凶儂迮悝炾

紼硃梯賊梗餃喝釵梗卞方月湮寞耀犯奈正毛瞳蚚仄凶儂迮悝炾

紼硃梯賊梗餃喝釵梗卞方月湮寞耀犯奈正毛瞳蚚仄凶儂迮悝炾Preferred Networks

?

Nds meetup8 ltushiboy

?

菴64隙ロ�褪悝��頗(𠈹爤眻紝袧諒忨)

菴64隙ロ�褪悝��頗(𠈹爤眻紝袧諒忨)

菴64隙ロ�褪悝��頗(𠈹爤眻紝袧諒忨) gsis gsis

?

𡌂控湮悝ロ�褪悝旃噶褪菴64隙ロ�褪悝��頗(2016爛6堎9゜嶱殼) 扑旦氾丞ロ�褪悝�馴眭夔ロ�褪悝琌釱ロ��絻悝煦珧𠈹爤眻紝袧諒忨☆晟惤�I燴卞云仃月旮𦵴瓦亙奈仿伙生永玄★ 旮𦵴瓦亙奈仿伙生永玄伐奈弁反﹜賒砉�I燴支秞汒�I燴匹湮傖髡毛�戶﹜踏及�馱眭夔皮奈丞及鳶葆仃砢午卅曰引仄凶﹝珨源﹜晟惤�I燴匹反�瘍ㄗ瞰尹壬�g惤支恅趼ㄘ卞方月杻釾�扴互丐月最僅傖髡仄化中凶凶戶﹜旮𦵴瓦亙奈仿伙生永玄伐奈弁及勹𠧧薯反癹隅腔匹仄凶﹝公氏卅笢﹜晟惤�I燴匹手煦汃桶政﹜巨件戊奈母奈?犯戊奈母奈﹜失氾件扑亦件卅升﹜旃噶傖彆及匎搪互筳心﹜幻廿�化及正旦弁匹旮𦵴瓦亙奈仿伙生永玄伐奈弁互傖彆毛汜心堤允方丹卞卅曰引仄凶﹝掛逃桶匹反﹜晟惤�I燴卞云仃月旮𦵴瓦亙奈仿伙生永玄伐奈弁及羥蚚卞勾中化﹜公及郔陔�砃毛畿賡仄凶中午佷中引允﹝

菴126隙伕示永玄馱悝本立瓜奈 ʊ棒啋萸�午旮𦵴悝�

菴126隙伕示永玄馱悝本立瓜奈 ʊ棒啋萸�午旮𦵴悝�

菴126隙伕示永玄馱悝本立瓜奈 ʊ棒啋萸�午旮𦵴悝�Naoya Chiba

?

FPGAX2016 玉平亙件卅FPGA

FPGAX2016 玉平亙件卅FPGA

FPGAX2016 玉平亙件卅FPGAHiroki Nakahara

?

Python化?极歠允月旮𦵴悝� 5梒

Python化?极歠允月旮𦵴悝� 5梒

Python化?极歠允月旮𦵴悝� 5梒苠疑 �动

?

▽釦釦梆梆2015▼�毛紝月撮扲及珂傷腔旃噶

▽釦釦梆梆2015▼�毛紝月撮扲及珂傷腔旃噶

▽釦釦梆梆2015▼�毛紝月撮扲及珂傷腔旃噶Hirokatsu Kataoka

?

Deformable Part Model午公及逃桯

Deformable Part Model午公及逃桯

Deformable Part Model午公及逃桯Takao Yamanaka

?

Mesh tensorflow

Mesh tensorflow

Mesh tensorflowkuroko

?

斑喝莉硃喧喝莽及伉失伙正奶丞煦汃伊戊丟件犯奈扑亦件高啦棗域聆棗捧郭捩#9

斑喝莉硃喧喝莽及伉失伙正奶丞煦汃伊戊丟件犯奈扑亦件高啦棗域聆棗捧郭捩#9

斑喝莉硃喧喝莽及伉失伙正奶丞煦汃伊戊丟件犯奈扑亦件高啦棗域聆棗捧郭捩#9Yuya Unno

?

旮𦵴悝�及杅燴ㄩ市奈生伙楊, 旦由奈旦芢隅午及諉萸

旮𦵴悝�及杅燴ㄩ市奈生伙楊, 旦由奈旦芢隅午及諉萸

旮𦵴悝�及杅燴ㄩ市奈生伙楊, 旦由奈旦芢隅午及諉萸Taiji Suzuki

?

Combinatorial optimization with graph convolutional networks and guided

Combinatorial optimization with graph convolutional networks and guided

Combinatorial optimization with graph convolutional networks and guidedShuntaro Ohno

?

Combinatorial optimization with graph convolutional networks and guided ver20...

Combinatorial optimization with graph convolutional networks and guided ver20...

Combinatorial optimization with graph convolutional networks and guided ver20...Shuntaro Ohno

?

斑喝莉硃喧喝莽及伉失伙正奶丞煦汃伊戊丟件犯奈扑亦件高啦棗域聆棗兜梗莉鳥勳紳勳紳眶#17

斑喝莉硃喧喝莽及伉失伙正奶丞煦汃伊戊丟件犯奈扑亦件高啦棗域聆棗兜梗莉鳥勳紳勳紳眶#17

斑喝莉硃喧喝莽及伉失伙正奶丞煦汃伊戊丟件犯奈扑亦件高啦棗域聆棗兜梗莉鳥勳紳勳紳眶#17Yuya Unno

?

TokyoWebmingRyoji Yanashima

?

TokyoWebminingRyoji Yanashima

?

Thinking in Cats

Thinking in Cats

Thinking in CatsEugene Yokota

?

嗨釦幛2018蔡栳旦仿奶玉Hiroki Nakahara

?

鍔睿啋爛僅灍犛本立瓜奈 - Deep Learning 衙� -

鍔睿啋爛僅灍犛本立瓜奈 - Deep Learning 衙� -

鍔睿啋爛僅灍犛本立瓜奈 - Deep Learning 衙� -Yutaka KATAYAMA

?

嗣杅及弘仿白井日及緙�腔辻迮悝� (2014.7.24 �馱眭夔悝頗菴94隙�馱眭夔價掛�觳旃噶頗桸渾琌栳)

嗣杅及弘仿白井日及緙�腔辻迮悝� (2014.7.24 �馱眭夔悝頗菴94隙�馱眭夔價掛�觳旃噶頗桸渾琌栳)

嗣杅及弘仿白井日及緙�腔辻迮悝� (2014.7.24 �馱眭夔悝頗菴94隙�馱眭夔價掛�觳旃噶頗桸渾琌栳)Ichigaku Takigawa

?

紼硃梯賊梗餃喝釵梗卞方月湮寞耀犯奈正毛瞳蚚仄凶儂迮悝炾

紼硃梯賊梗餃喝釵梗卞方月湮寞耀犯奈正毛瞳蚚仄凶儂迮悝炾

紼硃梯賊梗餃喝釵梗卞方月湮寞耀犯奈正毛瞳蚚仄凶儂迮悝炾Preferred Networks

?

Nds meetup8 ltushiboy

?

菴64隙ロ�褪悝��頗(𠈹爤眻紝袧諒忨)

菴64隙ロ�褪悝��頗(𠈹爤眻紝袧諒忨)

菴64隙ロ�褪悝��頗(𠈹爤眻紝袧諒忨) gsis gsis

?

菴126隙伕示永玄馱悝本立瓜奈 ʊ棒啋萸�午旮𦵴悝�

菴126隙伕示永玄馱悝本立瓜奈 ʊ棒啋萸�午旮𦵴悝�

菴126隙伕示永玄馱悝本立瓜奈 ʊ棒啋萸�午旮𦵴悝�Naoya Chiba

?

FPGAX2016 玉平亙件卅FPGA

FPGAX2016 玉平亙件卅FPGA

FPGAX2016 玉平亙件卅FPGAHiroki Nakahara

?

Python化?极歠允月旮𦵴悝� 5梒

Python化?极歠允月旮𦵴悝� 5梒

Python化?极歠允月旮𦵴悝� 5梒苠疑 �动

?

▽釦釦梆梆2015▼�毛紝月撮扲及珂傷腔旃噶

▽釦釦梆梆2015▼�毛紝月撮扲及珂傷腔旃噶

▽釦釦梆梆2015▼�毛紝月撮扲及珂傷腔旃噶Hirokatsu Kataoka

?

Deformable Part Model午公及逃桯

Deformable Part Model午公及逃桯

Deformable Part Model午公及逃桯Takao Yamanaka

?

Mesh tensorflow

Mesh tensorflow

Mesh tensorflowkuroko

?

斑喝莉硃喧喝莽及伉失伙正奶丞煦汃伊戊丟件犯奈扑亦件高啦棗域聆棗捧郭捩#9

斑喝莉硃喧喝莽及伉失伙正奶丞煦汃伊戊丟件犯奈扑亦件高啦棗域聆棗捧郭捩#9

斑喝莉硃喧喝莽及伉失伙正奶丞煦汃伊戊丟件犯奈扑亦件高啦棗域聆棗捧郭捩#9Yuya Unno

?

旮𦵴悝�及杅燴ㄩ市奈生伙楊, 旦由奈旦芢隅午及諉萸

旮𦵴悝�及杅燴ㄩ市奈生伙楊, 旦由奈旦芢隅午及諉萸

旮𦵴悝�及杅燴ㄩ市奈生伙楊, 旦由奈旦芢隅午及諉萸Taiji Suzuki

?

Combinatorial optimization with graph convolutional networks and guided

Combinatorial optimization with graph convolutional networks and guided

Combinatorial optimization with graph convolutional networks and guidedShuntaro Ohno

?

Combinatorial optimization with graph convolutional networks and guided ver20...

Combinatorial optimization with graph convolutional networks and guided ver20...

Combinatorial optimization with graph convolutional networks and guided ver20...Shuntaro Ohno

?

斑喝莉硃喧喝莽及伉失伙正奶丞煦汃伊戊丟件犯奈扑亦件高啦棗域聆棗兜梗莉鳥勳紳勳紳眶#17

斑喝莉硃喧喝莽及伉失伙正奶丞煦汃伊戊丟件犯奈扑亦件高啦棗域聆棗兜梗莉鳥勳紳勳紳眶#17

斑喝莉硃喧喝莽及伉失伙正奶丞煦汃伊戊丟件犯奈扑亦件高啦棗域聆棗兜梗莉鳥勳紳勳紳眶#17Yuya Unno

?

TokyoWebmingRyoji Yanashima

?

TokyoWebminingRyoji Yanashima

?

Thinking in Cats

Thinking in Cats

Thinking in CatsEugene Yokota

?

嗨釦幛2018蔡栳旦仿奶玉Hiroki Nakahara

?

鍔睿啋爛僅灍犛本立瓜奈 - Deep Learning 衙� -

鍔睿啋爛僅灍犛本立瓜奈 - Deep Learning 衙� -

鍔睿啋爛僅灍犛本立瓜奈 - Deep Learning 衙� -Yutaka KATAYAMA

?

More from Hiroki Nakahara (20)

FCCM2020: High-Throughput Convolutional Neural Network on an FPGA by Customiz...

FCCM2020: High-Throughput Convolutional Neural Network on an FPGA by Customiz...

FCCM2020: High-Throughput Convolutional Neural Network on an FPGA by Customiz...Hiroki Nakahara

?

This document presents a method for high-throughput convolutional neural network (CNN) inference on an FPGA using customized JPEG compression. It decomposes convolutions using channel shift and pointwise operations, employs binary weight quantization, and uses a fully pipelined architecture. Experimental results show the proposed JPEG compression achieves an 82x speedup with 0.3% accuracy drop. When implemented on an FPGA, the CNN achieves 3,321 frames per second at 75 watts, providing over 100x and 10x speedups over CPU and GPU respectively.

ROS User Group Meeting #28 穴伙民旮𦵴悝�午ROS

ROS User Group Meeting #28 穴伙民旮𦵴悝�午ROS

ROS User Group Meeting #28 穴伙民旮𦵴悝�午ROSHiroki Nakahara

?

釦詁賊插2018蔡栳訧蹋Hiroki Nakahara

?

ISCAS'18: A Deep Neural Network on the Nested RNS (NRNS) on an FPGA: Applied ...

ISCAS'18: A Deep Neural Network on the Nested RNS (NRNS) on an FPGA: Applied ...

ISCAS'18: A Deep Neural Network on the Nested RNS (NRNS) on an FPGA: Applied ...Hiroki Nakahara

?

The document discusses implementing a deep neural network object detector called YOLOv2 on an FPGA using a technique called Nested Residue Number System (NRNS). Key points: 1. YOLOv2 is used for real-time object detection but requires high performance and low power. 2. NRNS decomposes large integer operations into smaller ones using a nested set of prime number moduli, enabling parallelization on FPGA. 3. The authors implemented a Tiny YOLOv2 model using NRNS on a NetFPGA-SUME board, achieving 3.84 FPS at 3.5W power and 1.097 FPS/W efficiency.

ISMVL2018: A Ternary Weight Binary Input Convolutional Neural Network

ISMVL2018: A Ternary Weight Binary Input Convolutional Neural Network

ISMVL2018: A Ternary Weight Binary Input Convolutional Neural NetworkHiroki Nakahara

?

This document summarizes a research paper that proposes a ternary weight binary input convolutional neural network (CNN). The paper proposes using ternary (-1, 0, +1) weights instead of binary weights to improve recognition accuracy over binary CNNs. By setting many weights to zero, computations can be skipped, reducing operations. Experimental results show the ternary CNN model reduced non-zero weights to 5.3% while maintaining accuracy comparable to binary CNNs. Implementation on an ARM processor demonstrated the ternary CNN was 8 times faster than a binary CNN.

FPGA2018: A Lightweight YOLOv2: A binarized CNN with a parallel support vecto...

FPGA2018: A Lightweight YOLOv2: A binarized CNN with a parallel support vecto...

FPGA2018: A Lightweight YOLOv2: A binarized CNN with a parallel support vecto...Hiroki Nakahara

?

This document presents a mixed-precision convolutional neural network (CNN) called a Lightweight YOLOv2 for real-time object detection on an FPGA. The network uses binary precision for the feature extraction layers and half precision for the localization and classification layers. An FPGA implementation of the network achieves 40.81 FPS for object detection, outperforming an embedded GPU and CPU. Future work will apply this approach to other CNN-based applications such as semantic segmentation and pose estimation.

FPT17: An object detector based on multiscale sliding window search using a f...

FPT17: An object detector based on multiscale sliding window search using a f...

FPT17: An object detector based on multiscale sliding window search using a f...Hiroki Nakahara

?

1) The document describes an object detection system that uses a multiscale sliding window approach with fully pipelined binarized convolutional neural networks (BCNNs) implemented on an FPGA. 2) The system detects and classifies multiple objects in images by applying BCNNs to windows at different scales and locations, and suppresses overlapping detections. 3) Experimental results on a Zynq UltraScale+ MPSoC FPGA demonstrate that the proposed pipelined BCNN architecture can achieve higher accuracy than GPU-based detectors while using less than 5W of power.

(鼠羲唳)賊梗釵棗紳款旃2017勞惚梆捧捧楚釦釦

(鼠羲唳)賊梗釵棗紳款旃2017勞惚梆捧捧楚釦釦

(鼠羲唳)賊梗釵棗紳款旃2017勞惚梆捧捧楚釦釦Hiroki Nakahara

?

(鼠羲唳)幛捩勞插巨弁旦玄伉奈丞戊件疋亙奈氾奴件弘2017

(鼠羲唳)幛捩勞插巨弁旦玄伉奈丞戊件疋亙奈氾奴件弘2017

(鼠羲唳)幛捩勞插巨弁旦玄伉奈丞戊件疋亙奈氾奴件弘2017 Hiroki Nakahara

?

A Random Forest using a Multi-valued Decision Diagram on an FPGa

A Random Forest using a Multi-valued Decision Diagram on an FPGa

A Random Forest using a Multi-valued Decision Diagram on an FPGaHiroki Nakahara

?

Tensor flow usergroup 2016 (鼠嶱唳)

Tensor flow usergroup 2016 (鼠嶱唳)

Tensor flow usergroup 2016 (鼠嶱唳)Hiroki Nakahara

?

�疏咡罫蔉蚚及煦嫖け毛Altera SDK for OpenCL妏勻化扔弁永午釬勻化心凶

�疏咡罫蔉蚚及煦嫖け毛Altera SDK for OpenCL妏勻化扔弁永午釬勻化心凶

�疏咡罫蔉蚚及煦嫖け毛Altera SDK for OpenCL妏勻化扔弁永午釬勻化心凶Hiroki Nakahara

?

Altera sdk for open cl 失件弗奈玄摩�磐彆(鼠嶱唳)

Altera sdk for open cl 失件弗奈玄摩�磐彆(鼠嶱唳)

Altera sdk for open cl 失件弗奈玄摩�磐彆(鼠嶱唳)Hiroki Nakahara

?

Naist2015 dec ver1

Naist2015 dec ver1

Naist2015 dec ver1Hiroki Nakahara

?

A digital spectrometer using an FPGA is proposed for use on a radio telescope. The spectrometer would provide high-resolution spectral analysis of wideband radio frequency signals received by the telescope. To achieve high throughput on the FPGA, a nested residue number system is used to implement the fast Fourier transforms in the spectrometer. This decomposes large moduli into smaller nested ones, allowing uniform circuit sizes and enabling fully parallel implementation of the arithmetic.

Nested RNS毛蚚中凶犯奴奈皿瓦亙奈仿伙生永玄伐奈弁及FPGA灍蚾

Nested RNS毛蚚中凶犯奴奈皿瓦亙奈仿伙生永玄伐奈弁及FPGA灍蚾

Nested RNS毛蚚中凶犯奴奈皿瓦亙奈仿伙生永玄伐奈弁及FPGA灍蚾Hiroki Nakahara

?

FPL15 talk: Deep Convolutional Neural Network on FPGA

FPL15 talk: Deep Convolutional Neural Network on FPGA

FPL15 talk: Deep Convolutional Neural Network on FPGAHiroki Nakahara

?

佌及白央立戊件及款梯莽反530000匹允﹝手切欠氏白伙由伐奈匹ㄗ眕狟謹

佌及白央立戊件及款梯莽反530000匹允﹝手切欠氏白伙由伐奈匹ㄗ眕狟謹

佌及白央立戊件及款梯莽反530000匹允﹝手切欠氏白伙由伐奈匹ㄗ眕狟謹Hiroki Nakahara

?

Verilog-HDL Tutorial (15) software

Verilog-HDL Tutorial (15) software

Verilog-HDL Tutorial (15) softwareHiroki Nakahara

?

Verilog-HDL Tutorial (15) hardware

Verilog-HDL Tutorial (15) hardware

Verilog-HDL Tutorial (15) hardwareHiroki Nakahara

?

Verilog-HDL Tutorial (14)

Verilog-HDL Tutorial (14)

Verilog-HDL Tutorial (14)Hiroki Nakahara

?

FCCM2020: High-Throughput Convolutional Neural Network on an FPGA by Customiz...

FCCM2020: High-Throughput Convolutional Neural Network on an FPGA by Customiz...

FCCM2020: High-Throughput Convolutional Neural Network on an FPGA by Customiz...Hiroki Nakahara

?

ROS User Group Meeting #28 穴伙民旮𦵴悝�午ROS

ROS User Group Meeting #28 穴伙民旮𦵴悝�午ROS

ROS User Group Meeting #28 穴伙民旮𦵴悝�午ROSHiroki Nakahara

?

釦詁賊插2018蔡栳訧蹋Hiroki Nakahara

?

ISCAS'18: A Deep Neural Network on the Nested RNS (NRNS) on an FPGA: Applied ...

ISCAS'18: A Deep Neural Network on the Nested RNS (NRNS) on an FPGA: Applied ...

ISCAS'18: A Deep Neural Network on the Nested RNS (NRNS) on an FPGA: Applied ...Hiroki Nakahara

?

ISMVL2018: A Ternary Weight Binary Input Convolutional Neural Network

ISMVL2018: A Ternary Weight Binary Input Convolutional Neural Network

ISMVL2018: A Ternary Weight Binary Input Convolutional Neural NetworkHiroki Nakahara

?

FPGA2018: A Lightweight YOLOv2: A binarized CNN with a parallel support vecto...

FPGA2018: A Lightweight YOLOv2: A binarized CNN with a parallel support vecto...

FPGA2018: A Lightweight YOLOv2: A binarized CNN with a parallel support vecto...Hiroki Nakahara

?

FPT17: An object detector based on multiscale sliding window search using a f...

FPT17: An object detector based on multiscale sliding window search using a f...

FPT17: An object detector based on multiscale sliding window search using a f...Hiroki Nakahara

?

(鼠羲唳)賊梗釵棗紳款旃2017勞惚梆捧捧楚釦釦

(鼠羲唳)賊梗釵棗紳款旃2017勞惚梆捧捧楚釦釦

(鼠羲唳)賊梗釵棗紳款旃2017勞惚梆捧捧楚釦釦Hiroki Nakahara

?

(鼠羲唳)幛捩勞插巨弁旦玄伉奈丞戊件疋亙奈氾奴件弘2017

(鼠羲唳)幛捩勞插巨弁旦玄伉奈丞戊件疋亙奈氾奴件弘2017

(鼠羲唳)幛捩勞插巨弁旦玄伉奈丞戊件疋亙奈氾奴件弘2017 Hiroki Nakahara

?

A Random Forest using a Multi-valued Decision Diagram on an FPGa

A Random Forest using a Multi-valued Decision Diagram on an FPGa

A Random Forest using a Multi-valued Decision Diagram on an FPGaHiroki Nakahara

?

Tensor flow usergroup 2016 (鼠嶱唳)

Tensor flow usergroup 2016 (鼠嶱唳)

Tensor flow usergroup 2016 (鼠嶱唳)Hiroki Nakahara

?

�疏咡罫蔉蚚及煦嫖け毛Altera SDK for OpenCL妏勻化扔弁永午釬勻化心凶

�疏咡罫蔉蚚及煦嫖け毛Altera SDK for OpenCL妏勻化扔弁永午釬勻化心凶

�疏咡罫蔉蚚及煦嫖け毛Altera SDK for OpenCL妏勻化扔弁永午釬勻化心凶Hiroki Nakahara

?

Altera sdk for open cl 失件弗奈玄摩�磐彆(鼠嶱唳)

Altera sdk for open cl 失件弗奈玄摩�磐彆(鼠嶱唳)

Altera sdk for open cl 失件弗奈玄摩�磐彆(鼠嶱唳)Hiroki Nakahara

?

Naist2015 dec ver1

Naist2015 dec ver1

Naist2015 dec ver1Hiroki Nakahara

?

Nested RNS毛蚚中凶犯奴奈皿瓦亙奈仿伙生永玄伐奈弁及FPGA灍蚾

Nested RNS毛蚚中凶犯奴奈皿瓦亙奈仿伙生永玄伐奈弁及FPGA灍蚾

Nested RNS毛蚚中凶犯奴奈皿瓦亙奈仿伙生永玄伐奈弁及FPGA灍蚾Hiroki Nakahara

?

FPL15 talk: Deep Convolutional Neural Network on FPGA

FPL15 talk: Deep Convolutional Neural Network on FPGA

FPL15 talk: Deep Convolutional Neural Network on FPGAHiroki Nakahara

?

佌及白央立戊件及款梯莽反530000匹允﹝手切欠氏白伙由伐奈匹ㄗ眕狟謹

佌及白央立戊件及款梯莽反530000匹允﹝手切欠氏白伙由伐奈匹ㄗ眕狟謹

佌及白央立戊件及款梯莽反530000匹允﹝手切欠氏白伙由伐奈匹ㄗ眕狟謹Hiroki Nakahara

?

Verilog-HDL Tutorial (15) software

Verilog-HDL Tutorial (15) software

Verilog-HDL Tutorial (15) softwareHiroki Nakahara

?

Verilog-HDL Tutorial (15) hardware

Verilog-HDL Tutorial (15) hardware

Verilog-HDL Tutorial (15) hardwareHiroki Nakahara

?

Verilog-HDL Tutorial (14)

Verilog-HDL Tutorial (14)

Verilog-HDL Tutorial (14)Hiroki Nakahara

?

FPGAX2019

1. 卅井反日佌及MNIST及FPS反530000匹允﹝ 匹允互手切欠氏白伙由伐奈匹ㄗ眕狟謹 (+螝?CNN及畿賡) FPGAX2019@ Google左白奴旦

2. 勾仁勻凶手及(1) ? 議弊?必奈丞辻失弁本仿伊奈正 2

3. 旃噶氾奈穴: Custom Computing Machine 3

4. Object?Detection?(昜极庲舑) 4 Person J.?Redmon?and?A.?Farhadi,?"YOLOv3:?An?Incremental?Improvement,"?arXiv,?2018 Person Boat

5. Semantic?Segmentation?(薆郖煦賃) 5E.?Shelhamer,?J.?Long?and?T.?Darrell,?"Fully?Convolutional?Networks?for?Semantic?Segmentation,"??IEEE?Trans.?on? Pattern?Analysis?and?Machine?Intelligence,?Vol.39,?No.4,?2017,?pp.?640?坼 651.

6. OpenPose (訬�芢隅) 6 Z.?Cao,?T.?Simon,?S.坼E.?Wei?and?Y.?Sheikh,?"?Realtime?Multi坼Person?2D?Pose?Estimation? using?Part?Affinity?Fields,"?CVPR,?2017.

7. DepthMap (旮今芢隅) 7 D.?Eigen,?C.?Puhrsch and?R.?Fergus,?"Depth?Map?Prediction?from?a?Single?Image?using?a? Multi坼Scale?Deep?Network,"?arXiv:1406.2283?,?2014.

8. 勾仁勻凶手及(2) ? Terasic扦 DE5a坼Net?示奈玉卞方月?厒趙 ? YOLOv2?毛 166 498?FPS?(3�K蹈趙) 8 酚?蚙??狟?蔚眳?酚枘淩ⅸ?笢埻�惸,"Intel?OpenCL毛?中凶3袨颷YOLOv2及FPGA灍蚾卞勾中化,"伉戊件白奴幼乓仿皮伙扑旦氾丞旃噶頗,?2018爛12?(𣷣憷).

9. 犯乒:?AvNET Ultra96 9 Xilinx扦 Zynq UltraScale+ MPSoC (ZU3EG) 減徭, 30FPS (YOLOv2), 3勀�, PYNQ (Python虐噫)匹秶郘, �g黃�釬 Hiroki?Nakahara,?Masayuki?Shimoda and?Shimpei Sato,?※A?Tri坼State?Weight?Convolutional?Neural? Network?for?an?FPGA:?Applied?to?YOLOv2?Object?Detector,§?FPT,?2018.

10. CNN及郔羥趙 10 Source:?http://www.isfpga.org/fpga2017/slides/D1_S1_InvitedTalk.pdf

11. 2�趙CNN 11 x1 w0 (Bias) fsgn(Y) Y z w1 x2 w2 xn wn ... x1 x2 Y 坼1 坼1 1 坼1 +1 坼1 +1 坼1 坼1 +1 +1 1 x1 x2 Y 0 0 1 0 1 0 1 0 0 1 1 1 M.?Courbariaux,?I.?Hubara,?D.?Soudry,?R.E.Yaniv,?Y.?Bengio,?※Binarized?neural?networks:?Training?deep?neural? networks?with?weights?and?activations?constrained?to?+1?or?坼1,"?Computer?Research?Repository?(CoRR),?Mar.,? 2016,?http://arxiv.org/pdf/1602.02830v3.pdf

12. 卅兮丟乒伉講祅𦑩?↙左件民永皿灍政仄凶中井日 E.?Joel?et?al.,?※Tutorial?on?Hardware?Architectures? for?Deep?Neural?Networks,§?MICRO坼49,?2016. 12 On-chip Memory J.?Dean,?※Numbers?everyone?should?know§ Source:?https://gist.github.com/2841832 ? 𣷣繧郖 (酘) ? 腴秏愐�? (衵)

13. 13欽堯梗紳?郭勳?梗喧.?硃梭,?※插?莽喝娶措梗聆?棗款?紳梗喝娶硃梭?紳梗喧滄棗娶域?硃釵釵梗梭梗娶硃喧棗娶莽,§?插唬紼?啦賊楚啦,?博棗梭.11,?捧棗.5,?2017,?梯梯.?746坼761.

14. 旦由奈旦趙 ? (悝�𦤦心)笭心甲旦玄弘仿丞反丐月煦票卞𣶹丹(t坼煦票井卅?) ? 魂俶趙憝杅卞方勻化反,?堤?及50%ゴ摽互未伕 ? 悝�犯奈正支乒犯伙卞方勻化反公木眕奻未伕卞卅月仇午手 ? HW午仄化反笭心旦由奈旦趙及幻丹互㜳中支允中 14 笭心及� 0 50000 100000 150000 200000 坼1 坼0.8 坼0.6 坼0.4 坼0.2 0 0.2 0.4 0.6 0.8 1 ? 庲舑儕僅卞荌�仄卅中 ↙皉尌曰 Tomoya Fujii,?Shimpei Sato,?Hiroki?Nakahara,?※A?Threshold?Neuron?Pruning?for?a?Binarized?Deep?Neural?Network?on?an?FPGA,§?IEICE? Transactions?101坼D(2):?376坼386?(2018)

15. CNN卞方月賒砉煦�及賤昴 15 Feature maps CONV+Pooling CONV+Pooling ※5§ Input image ... Feature?extraction?layers Classification layers 3 2 0 1 4 5 6 7 8 9

16. �觳萸 ? 腴儕僅NN匹反隙䔝�觳毛賤仃卅中 ? 瞰:?sin(x)?regression?using?a?NN?(3坼layers) 16 (a)?Float?32?bit?for? activation?and?weight (b)?Float32?for? activation?and?binary? weight (c)?All?binarized Sin(x) BinNNFloat32NN Sin(x) Miss localization

17. 髦磁儕僅CNN ? Object?Detector卅升恚螝卅正旦弁匹斛�撮胍 ? ゴ僇:?2�儕僅CNN?＃ ?搪?旦疋奈玉 ? 摽僇:?嗣�儕僅CNN?＃?隙䔝�觳ㄗ�芢隅ㄘ 17 Input Image (Frame) Feature maps CONV+Pooling CNN CONV+Pooling Class?score Bounding?Box Detection 2� half H.?Nakahara?et?al.,?※A?Lightweight?YOLOv2:?A?Binarized?CNN?with?A?Parallel?Support?Vector?Regression?for?an? FPGA,§ Int＊l Symp. on FPGA (ISFPGA), 2018.

18. 淛隱 (Distillation) ? 悝�𦤦心乒犯伙毛�e及乒犯伙卞�痄 ? �卅月乒犯伙ㄗ𦵴?民乓生伙卅升ㄘ卞�痄允月撮胍 ? 淛隱卞方月悝�:?諒�乒犯伙及旦戊失毛�化�唸 ↙旦戊失及煦票卞𡘙?腔卅眭舑互漪引木化中月 18G.?Hinton,?Oriol?Vinyals,?and?J.?Dean,?※Distilling?the?Knowledge?in?a?Neural?Network,§NIPS＊04 Teacher?(Trained)?CNN Student?CNN Car??0.82 Cat??0.08 Dog?0.07 Pet??0.03 Car??0.62 Cat??0.12 Dog?0.24 Pet??0.02 Car??1.00 Cat??0.00 Dog?0.00 Pet??0.00 Soft?target?loss Hard target loss Training Dataset Loss?for?soft?and? hard?targets

19. 丟正辻迮悝�卞方月由仿丟奈正抻坰 ? �?傺卞反癹賜互＃ ? 由仿丟奈正毛�薹方仁抻允斛猁丐曰 ? 弘伉永玉扔奈民:?綈中 ? 仿件母丞它巧奈弁:?綅￤六 ? 丟正甲亙奈伉旦氾奴永弁(SA,?GA,?PSO):?卅井卅井方中? ? 矛奶朮芢隅:?由仿丟奈正芢隅仄支允中�g�卅�觳卞方今公丹 ? 丟正辻迮悝�:?Hyperopt,?Optuna Chainer +?Optuna及瞰: https://github.com/pfnet/optuna/blob/master/examples/chainer_simple.py 19

20. 勾仁勻凶手及(3) ? GUINNESS?(GUI based?Neural?Network?SyntheSizer) 20 H.?Nakahara?et.?al,?※GUINNESS:?A?GUI?based?Binarized?Deep?Neural?Network?Framework?for?Software? Programmers,§?IEICE?Trans?on?Info.,?(accepted). https://github.com/HirokiNakahara/GUINNESS

21. Google?Colaboratory ? 12媆嶲引匹GPU?(Tesla?K80)毛妏尹月 ? 斛猁卅仿奶皮仿伉反軑戶爀?𦤦心 ? TensorFlow手瞳?褫夔 ? Chainer及爀?手褫夔 Chainer on?Google?Colaboratory: https://github.com/chainer/google坼colaboratory ? GUINNESS(Binary?Neural?Network偞�汁奈伙)毛 Colaboratory匹妏丹?楊互? Google?Colaboratory匹Binary?CNN毛�井允(MNIST): http://shimaharu.blogspot.com/2018/11/google坼colaboratorybinary坼cnnmnist.html ? Vivado毛?木化心凶?手＃ ? 旦穴白巧匹�窒匹五月元扎氏? 21 Chainer毛犯白巧伙玄匹扔禾奈玄 (2019/Jan/31卞復庲)

22. On坼going?work ? Coca坼cola DL毛嶱逃嶱宎 ? Co坼design?and?verification?on?Colaboratory?for?Deep?Learning 22 https://github.com/HirokiNakahara/Coca坼Cola坼DL/ ↙

23. MNIST民乓伊件斥 23

24. MNIST民乓伊件斥 ? MNIST毛升木分仃?厒卞匹五月井 ? 儕僅反90%眕奻午允月(＃中中及井?) ? Neural?Network毛?中月仇午 ? t坼SNE午井Random?Forest午井匹尹尹支氏勻化穴斥伊旦支戶化 ? FPGA卞灍蚾仄方丹? 24

25. 踏隙及正奈必永玄 ? 3𦵴DNN卞3�趙(Binary+皉尌曰)仄化心月 ? ??賒砉手2�趙 (��匹??趙) 25 x0 x1 x783 ＃ z0 z1 zn坼1 ＃ z0 z1 zn坼1 ＃ y0 y1 y9 ＃ 784 10

26. 由仿丟奈正及𢜪隅 ? 3𦵴DNN及笢嶲𦵴及瓦亙奈伕件杅n毛劐趙今六化庲舑薹午旦由奈旦薹毛捼𦷰 ? 跪DNN及甩奶由奈由仿丟奈正反Optuna匹偞隅 26 x0 x1 x783 ＃ z0 z1 zn坼1 ＃ z0 z1 zn坼1 ＃ y0 y1 y9 ＃ 784 10n n 旦由奈旦薹 =0皉及賃磁 (祅𦑩薹)

27. 悝�磐彆 ? 瓦亙奈伕件杅毛�支仄化手庲舑儕僅互奻互月午反癹日卅中↙羥ピ卅乒犯伙腢亼 ? 旦由奈旦薹午瓦亙奈伕件杅卞眈憝互丐月 ? ?隅杅及戊生弁氾奴申氾奴(諉適俶↙乒犯伙恚螝僅)互斛猁 27 91? 91? 91? 91? 88? 86? 71? 55? 89? 88? 86? 83? 79? 72? 75? 73? 120 100 80 60 40 20 10 5 庲舑儕僅旦由奈旦薹笢嶲𦵴及瓦亙奈伕件杅

28. FPGA灍蚾 ? 偞�仄凶DNN毛瞎磁六隙繚趙仄方丹? ? 笢嶲𦵴及瓦亙奈伕件杅:?100,?庲舑薹 91%,?旦由奈旦薹 88% ? 1瓦亙奈伕件及郔???杅22 ↙?222 bit?↙?BRAM?256?� (引凶反6??LUT?67,108,864�!!) 28 x0 x1 x783 ＃ z0 z1 zn坼1 ＃ z0 z1 zn坼1 ＃ y0 y1 y9 784 10100 100 郔?匹22??1堤?(ⅸ歙10最僅)

29. 憝杅及煦賤 ? ?啜腔卅瞎心磁歹六隙繚及恚螝僅2n/n ? n=n1+(n2+1)卞煦賤匹五月午2n1/n1+2n2+1/(n2+1) ? 2及屯五�\匹祅𦑩 ? FPGA匹反瞎磁歹六隙繚毛LUT(丟乒伉)匹灍政 ? 煦賤匹五木壬丟乒伉講毛2及屯五�\及�耀匹祅𦑩褫夔 29 H G ＃＃ n1 n2

30. 30 憝杅煦賤楊 G Hx1 x2 x3 x4 f ? ?﹛﹛2log X1 X2 00 01 10 11 00 01 10 11 0 1 1 1 1 1 0 0 0 1 1 1 1 1 0 0 X1=(x1, x2) X2=(x3, x4) 蹈恚螝僅 ?=2 旰瘴劐杅 ?蚕劐杅 ?煦賤桶 f =g(h(X1),X2) h(X1) ㄟㄟㄠㄠ諉適�杅 = (�卅月蹈由正奈件及�杅)

31. 31 00 01 10 11 00 01 10 11 0 1 1 1 1 1 0 0 0 1 1 1 1 1 0 0 X1=(x1, x2) X2=(x3, x4) ?=2 h(X1) ㄟㄟㄠㄠ x1 0 0 1 1 x2 0 1 0 1 h(X1) 0 1 0 1 0 1 00 0 1 01 1 1 10 1 0 11 1 0 x3,x4 h(X1) 瞰 24x1=16?[bit] 22x1+23x1=12?[bit] �卅月蹈由正奈件卞睫瘍毛賃曰絞化月巨件戊奈母

32. 憝杅煦賤互衄�卅弁仿旦 ? 旦由奈旦(??杅午巨件玄伉杅卞幼乓永皿互丐月�磁) 卅憝杅↙由弗永玄煦� 32 0 0 0 0 0 3 0 0 0 1 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 Hiroki?Nakahara,?Tsutomu?Sasao,?Munehiro Matsuura,?※A?packet?classifier?using?LUT?cascades? based?on?EVMDDS?(k),§?FPL,?2013,?pp.1坼6.

33. 憝杅煦賤互衄�卅弁仿旦(適) ? �g捼�?允月�磁 ? 本弘丟件玄奶件犯永弁旦巨件戊奈母 33 0 4 3 2 1 0 4 3 1 0 4 3 2 1 0 4 2 1 0 4 3 2 1 0 3 2 1 0 4 3 2 1 巨件戊奈母 ROM a b f(x)=ax+b Tsutomu?Sasao,?Shinobu Nagayama,?Jon?T.?Butler, ※Numerical?Function?Generators?Using?LUT?Cascades,§? IEEE?Trans.?Computers?56(6):?826坼838?(2007).

34. Binary?DNN及�磁 ? Weighted坼Sum?Function?(WS憝杅)午中丹弁仿旦[1] ? 蹈恚螝僅反允匹卞賤昴𦤦心 ? 田永民淏�趙反? ㄗ2016爛及狦卞�?[2]毛𤩸中化中凶媆反方中?楊互佷中勾井卅井勻凶＃ㄘ 34 + x0=1 x1 x2 xN ... w0 (Bias) w1 w2 wN Batch Norm +1 or -1sign 2016爛狦及癹賜 2017爛3?卞絻傖 [1]?T.?Sasao,?※Analysis?and?Synthesis?of?Weighted坼Sum?Functions,§?IEEE?Trans.?on?CAD,?Vol.?25,?No.?5,?2006,?pp.789坼796. [2]?H.?Nakahara?et.?al,?"A?memory坼based?realization?of?a?binarized?deep?convolutional?neural?network,"?FPT,?2016,? pp.277坼280.

35. 2�趙笭心睿憝杅及瞰(n=5) x0 x1 x2 x3 x4 搪睿栳呾磐彆 0 0 0 0 0 坼w0坼w1坼w2坼w3坼w4 0 0 0 0 1 坼w0坼w1坼w2坼w3+w4 0 0 0 1 0 坼w0坼w1坼w2+w3坼w4 0 0 0 1 1 坼w0坼w1坼w2坼w3+w4 0 0 1 0 0 坼w0坼w1+w2坼w3坼w4 0 0 1 0 1 坼w0坼w1+w2坼w3+w4 0 0 1 1 0 坼w0坼w1+w2+w3坼w4 0 0 1 1 1 坼w0坼w1+w2+w3+w4 0 1 0 0 0 坼w0+w1坼w2坼w3坼w4 0 1 0 0 1 坼w0+w1坼w2坼w3+w4 0 1 0 1 0 坼w0+w1坼w2+w3坼w4 0 1 0 1 1 坼w0+w1坼w2+w3+w4 1 1 1 1 1 +w0+w1+w2+w3+w4 ... ...

36. 2�趙笭心睿憝杅及煦賤桶 ? 2�趙笭心睿憝杅及堤?申永玄杅互q申永玄及午五,?公及蹈恚螝僅反?〝 2 ? 跪蹈反�化肮元�(?蚕劐杅)及樓呾 ↙ 旰瘴劐杅毛樓呾仄凶�及瞎磁歹六互蹈恚螝僅 ? 𣶹勻化,?公及瞎心磁歹六(申永玄杅)反睫瘍手?木月午q申永玄匹桶政褫夔 ↙?2q 36 000 001 010 011 100 101 110 111 坼w0坼w1坼w2 坼w3坼w4 坼w0坼w1+w2 坼w3坼w4 坼w0+w1坼w2 坼w3坼w4 坼w0+w1+w2 坼w3坼w4 w0坼w1坼w2 坼w3坼w4 w0坼w1+w2 坼w3坼w4 w0+w1坼w2 坼w3坼w4 w0+w1+w2 坼w3坼w4 坼w0坼w1坼w2 坼w3+w4 坼w0坼w1+w2 坼w3+w4 坼w0+w1坼w2 坼w3+w4 坼w0+w1+w2 坼w3+w4 w0坼w1坼w2 坼w3+w4 w0坼w1+w2 坼w3+w4 w0+w1坼w2 坼w3+w4 w0+w1+w2 坼w3+w4 坼w0坼w1坼w2 +w3坼w4 坼w0坼w1+w2 +w3坼w4 坼w0+w1坼w2 +w3坼w4 坼w0+w1+w2 +w3坼w4 w0坼w1坼w2 +w3坼w4 w0坼w1+w2 +w3坼w4 w0+w1坼w2 +w3坼w4 w0+w1+w2 +w3坼w4 坼w0坼w1坼w2 +w3+w4 坼w0坼w1+w2 +w3+w4 坼w0+w1坼w2 +w3+w4 坼w0+w1+w2 +w3+w4 w0坼w1坼w2 +w3+w4 w0坼w1+w2 +w3+w4 w0+w1坼w2 +w3+w4 w0+w1+w2 +w3+w4 11?????????10????????01????????00 x0 x1 x2x3 x4

37. 37 田永民淏�趙卞憝仄化 ?Batch Norm ? 悝�𦤦心2�趙NN卞云中化, 田永民淏�趙栳呾反淕杅儕僅田奶失旦樓呾午脹� mean variance Scaling Shift H.?Yonekawa and?H.?Nakahara,?※On坼Chip?Memory?Based?Binarized?Convolutional?Deep?Neural?Network?Applying?Batch? Normalization?Free?Technique?on?an?FPGA,§?IPDPS?Workshops?2017,??pp.98坼105.

38. ? The?output?from?batch? normalization( )?is?the? input?to?sign?function ?Constant?factor?can?be? ignored ? The?input?from?batch? normalization( )?is?the? integer?value ?To?integer? 38 Proof ?Batch Norm

39. �极�傖 ? ?堤?卞伊斥旦正毛勾仃化1clock匹灍? ? 跪瓦亙奈伕件反憝杅煦賤匹恚杅及6坼LUT匹灍政 39 x0 x1 x783 ＃ z0 z1 zn坼1 ＃ z0 z1 zn坼1 ＃ y0 y1 y9 784 10100 100 ＃＃ 5= ??? ? ??6 1+(22坼6坼1)x5+1=77 222=67,108,864及廣400勀煦及1

40. 灍蚾仄凶磐彆 ? FPGA?Board:?AvNet扦Ultra96 ? 正奶立件弘秶廣:?100MHz ? LUT杅:?6154� ? FF杅:?772� ? 正奶立件弘互丟永玄仄切扎勻凶＃ ↙?100?MFPS? ↙?100?x?1000000?FPS?=?100000000?FPS!!!! 40 1�|FPS?! (?岈�及弁末?閉尹)

41. 1欳FPS尺及耋 ? We?are?now＃ ? @100MHz?(黱弁伕永弁�I燴)?↙?1�|FPS ? LUT杅:?6,154� ? FF杅:?772� ? VCU1525互＃? ? 1,182,240?LUTs?↙?廣190怢�K蹈趙褫夔 ? 2,364,480?FFs ? 由奶皿仿奶件灍蚾 ↙?300MHz�釬 ? (燴��匹)?�反0.57欳FPS仄井善絻仄化中卅中＃ c.f.?議迻紺謁?及苂仁?及?反ㄠ欳僅 41丐﹜丹切VCUㄡ怢手勻化月支氏＃

42. 云引仃 42

43. 市旦正丞皿伕本永扔 ? �?隙繚趙仄凶日剠鎣卞婌允亢凶匹仍介月＃ ? 政灍腔卅I/O厒僅(市丟仿30FPS)午井卞磁丹方丹卞偞� ? ROM井日LUT毛紨棒掂心堤允?楊匹灍政 ↙氾奈皮伙統桽倰皿伕本永扔 43 LUT2 LUT3 LUT1 LUT1 LUT2 LUT3 REG PRG

44. mis坼FPGA ? LUT及??杅毛�支允 ↙丟乒伉講�樓 &?LUT杅祅𦑩ㄗˊ?厒趙ㄘ丟乒伉講(玄仿件斥旦正杅)匹俶夔旦弗奈伙 ? LUT?netlist?毛啋卞磁傖 44 R.?Murgai,?M.?Fujita,?F.?Hirose,?※Logic?synthesis?for?a?single?large?look坼up?table,§? ICCD,?1995,?pp.415坼424. 丟乒伉扔奶朮≦俶夔

45. 支勻天曰＃ ? Binary儕僅分仃匹反恚螝卅正旦弁互賤仃卅中＃ ? 隙䔝反儕僅互斛猁↙髦磁儕僅 45

46. 螝?�煋心栳呾 (Noise?Convolutional?Operation) 46 + ??卞螝?毛�\六月 1℅1�煋心栳呾 ??賒砉堤? 杻釾穴永皿螝? �心煋心𦵴

47. Point坼wise?Convolution ? 1x1�心煋心毛?丹,?�呾講?丟乒伉講毛祅𦑩 47 ＃ k k M M C C N 1 1 M M C C N Andrew?G.?Howard?et.?al?"MobileNets:?Efficient?Convolutional?Neural?Networks?for?Mobile? Vision?Applications,?arXiv:1704.04861

48. 緙�腔卅脹�俶 ? ヽ渾�? ? 煦汃 ? 午卅月螝? 毛?中月午 ﹜ 反緙�腔卞脹� 48 螝?�煋心暫湔�煋心

49. 暫湔PNN及蜊囡↙NCNN(k) (Noise?CNN:?NCNN) ? CVPR2018匹PNN?(��NN)[1]互逃桶今木凶互＃ ↙�𦵴互螝?�心煋心 ↙(杻卞)??賒砉互 �隅( ﹜ ) 毛㦤凶今卅中(=脹�俶互傖?仄卅中,庲舑儕僅腴狟) 49 [1] F. Juefei-Xu, V. N. Boddeti, and M. Savvides, "Perturbative Neural Networks," CVPR, 2018, Vol. 1. [2] A. Munakata, S. Sato, H. Nakahara, ※A Noise Convolutional Neural Network,§ ISMVL, 2019 (accepted). 螝 ? � 煋心𦵴 � 磐磁𦵴暫湔 3℅ 3 � 煋心𦵴 k n-k NCNN(k) [2] 暫湔�煋心𦵴午螝?�煋心𦵴及甩奶皮伉永玉 �隅毛㦤凶允引匹暫湔�煋心毛?丹

50. ? �𦵴毛螝?�煋心𦵴午允月午儕僅輾趙 ? 菴1𦵴毛暫湔�煋心𦵴午仄凶NCNN(1)反儕僅輾趙毛0.4禾奶件玄匹眚秶仄勾勾,?由仿丟奈正毛88%祅𦑩暫湔CNN,?PNN午及?廌 50 弁仿旦煦�正旦弁及?廌 (乒犯伙?AlexNet﹜犯奈正本永玄?CIFAR-100) PNN [CVPR2018] NCNN(1) (Ours) 暫湔CNN 庲舑儕僅(%) 29.1 49.4 49.8 �𦵴及笭心(MB) 1.1 1.2 10.0 笭心及祅𦑩薹 0.89 0.88 坼

51. 螝?�煋心隙繚 51 Off坼Chip DDR Memory RND BN Unit Act Unit + Point坼wise Conv?Unit Buffer Point坼wise? Conv?Unit Buffer Point坼wise? Conv?Unit Buffer W.Mem W.Mem W.Mem ＃ Point坼wise �煋心栳呾け Weight Mem. Bias Mem. BN Unit Act UnitInput Reg+ 用奶朮 ?傖け DDR?Controller

52. ? NCNN反CNN午?屯化悝�媆嶲毛30坼40%祅𦑩 1epoch黱及悝�媆嶲午芢�媆嶲 52 乒犯伙?ResNet-18﹜犯奈正本永玄?CIFAR-100 GPU: Nvidia GTX 1080Ti NCNN卞云仃月 CNN及𦵴杅 1 3 7 11 15 CNN 悝�媆嶲(s) 50.3 48.8 45.1 46.4 59.1 75.2

53. 暫湔及灍蚾磐彆午及?廌 Implementation (Year) Zhao?et?al. (2017)?[1] FINN (2017)?[2] Boucle?et?al. (2017)?[3] Ours (2019) CNN Binary Binary Ternary Noise Clock?(MHz) 143 166 250 199 #LUTs #18Kb?BRAMs #DSP?48Es 46900 94 3 42823 270 32 67300 667 0 40911 228 192 Accuracy?(%) 87.73% 80.10% 86.71% 92.35% Time?[msec] (FPS?[s坼1]) 5.94 (168) 2.24 (445) 2.36 (423) 1.80 (557) Power 4.7 2.5 6.8 3.5 53 Binary, Ternary方曰手?厒井勾?庲舑儕僅, 凶分仄DSP皮伕永弁斛猁 VGG9毛矛奈旦卞仄凶CNN匹啐�, 犯奈正本永玄反CIFAR10 [1] R. Zhao, W. Song, W. Zhang, T. Xing, J.坼H. Lin, M. Srivastava, R. Gupta and Z. Zhang, ※Accelerating Binarized Convolutional Neural Networks with Software坼Programmable FPGAs,§ ISFPGA, 2017, pp.15坼24. [2] Y. Umuroglu, N. J. Fraser, G. Gambardella, M. Blott, P. Leong, M. Jahre, and K. Vissers, ※FINN: A Framework for Fast, Scalable Binarized Neural Network Inference,§ ISFPGA, 2017. [3] A. P坼. Boucle, A. Bourge, F. Ptrot, H. Alemdar, N. Caldwell, and V. Leroy, ※Scalable high坼performance architecture for convolutional ternary neural networks on FPGA,§ FPL, 2017, pp.1每7.

54. 引午戶 ? 螝?�心煋心 (NCNN) ? 用奶朮及俶斮毛瞳?仄化庲舑儕僅輾趙毛眚秶 ? FPGA灍蚾毛?中暫湔?楊午及?廌 ? DSP互斛猁匹丐月手及及,?Binary,?Ternary?午?廌仄化庲舑儕僅毛砃奻仄勾勾?厒趙絻傖 ? 弁仿旦煦�方曰手?僅卅正旦弁卞羥?褫夔 ? 踏摽及掝觳 ? 灍?腔卅失皿伉弗奈扑亦件尺及羥?↙YOLOv2匹五凶方? 54