端端舝

Nested RNS毛蚚中凶旮𦵴�煋心
瓦亙奈仿伙生永玄伐奈弁卞憝仄化
笢埻 �惸1 逼帣マ2
1霛磏湮悝湮悝埏燴馱悝旃噶褪 �赽ロ�馱悝�馴
2隴笥湮悝燴馱悝窒ロ�馱悝褪
1
H. Nakahara and T. Sasao, ※A deep convolutional neural network using nested
residue number system,§ FPL2015 , 2015, pp.1-6.
奻�及゜掛惤唳匹允﹝旦仿奶玉赻极反FPL2015匹逃桶仄凶幻丹互陔仄中匹允﹝

逃桶囀⺍
? 掖劓
? 旮𦵴�煋心瓦亙奈仿伙生永玄伐奈弁
(DCNN: Deep Convolutional Neural Network)
? �豻杅炵(RNS: Residue Number System)
? Nested RNS毛蚚中凶DCNN
? 灍歠磐彆
? 引午戶
2

掖劓
? Neural Network毛嗣𦵴卞仄凶Deep Neural Network
(DNN)
每 FPGA灍蚾[LeCun2009]
每賒ヽ腔卅悝�源楊[Hilton2012]
? 暫湔及�觳(綎悝�脹)毛賤𢜪
? 旃噶互魂逃趙
每 GPU反秏愐�薯互湮五中凶戶FPGA及妸蚚互筳戈
(Microsoft及犯奈正本件正(Catapult)脹)
? 醱搪俶夔�薹卞�木凶失奈平氾弁民乓
3

Deep Q-learning Network(DQN)
? �趙悝�午DNN及瞎磁六
? Atari及必奈丞匹�嶲及巨平旦由奈玄卞㇌�
? TRAX匹反�嶲互�切引仄凶ㄗㄢ堎奻悎ㄘ
4

旮𦵴�煋心瓦亙奈仿伙生永玄伐奈弁
(Deep Convolutional Neural Network:
DCNN)
5

瓦亙奈伕件乒犯伙
+
x0=1x0=1
x1
x2
xN
... w0
w1
w2
wN
f(u)
u y
田奶失旦
xi: ⻌薯陓瘍
wi: 磐磁笭心 (0及�磁, ピ剿)
u: 囀窒袨颷
f(u): 魂俶趙憝杅
(Sigmoid支ReLU脹)
y: 堤薯陓瘍
6
y ? f (u)
u ? wi xi
i?0
N
?

瓦亙奈仿伙生永玄伐奈弁
(NN: Neural Network)
x1
x2
xL
y1
y2
yN
⻌薯𦵴笢嶲𦵴堤薯𦵴
悝�反Back propagation
軑䛐反Forward propagation
7

旮𦵴�煋心瓦亙奈仿伙生永玄伐奈弁
(DCNN: Deep Convolutional Neural Network)
? �心煋心𦵴?母它件扔件皿伉件弘𦵴?�磐磁𦵴
每 �心煋心𦵴: 珨窒及瓦亙奈伕件及心磐磁今六月
每母它件扔件皿伉件弘𦵴: 杻釾講毛廿支井允 (用奶朮卞�中)
8

踏隙及�隅
9
∣
汁奈伙毛蚚中化
GPU奻匹DCNN毛
偞�仄, HDL毛堤薯 HDL
汜傖今木凶HDL毛
磁傖仄化FPGA奻匹灍蚾
諒�犯奈正
甩奶由奈由仿丟奈正
∣

價掛栳呾
? 2棒啋�心煋心互�呾媆嶲及90%眕奻毛梩戶月
每掛�恅匹反Pooling支魂俶趙憝杅反帤灍蚾
每灍蚾反菴5伊奶乩奈引匹
10
zij ? yij ? xi?m, j?nwmn
n?0
K?1
?
m?0
K?1
?
xij: ⻌薯�
yij : 田奶失旦
wmn: 笭心�S杅
K: 市奈生伙扔奶朮
zij: 堤薯�
K
K

DCNN及2棒啋�心煋心隙繚
(市奈生伙扔奶朮: K=3)
11
+
R
+
R
+
R
+
R
+
R
+
R
+
R
+
R
+
RR R
R R
input
output
...
...
W-K registers
(W反賒砉及盟)
w00
w10 w20
w01
w02
w11 w21
w22w12
0
MAC?(Multiply?Accumulation)?Unit
DSP48E皮伕永弁匹灍政褫夔
W

�豻杅炵
(RNS: Residue Number System)
12

�豻杅炵
(Residue Number System: RNS)
? 淕杅X毛L�及誑中卞匼卅淕杅 {m1,m2,...,mL} 卞
方月�豻卞煦賤 X={x1,x2,...,xL}仄化桶政
仇仇匹,
母奶瓜立永弁伊件斥:
14
Xi ? X mi
X mi
? X modmi
M ? mi
i?1
L
?
(X-|X|mi互mi (mi>1)及捷杅)勾引曰郔苤準��豻

RNS卞云仃月栳呾
? 樓𦑩�\呾(壺呾壺仁)毛跪�豻黱卞黃蕾匹俴尹月
仇仇匹, 反樓𦑩�\呾(+,-,*)毛桶允栳呾赽
? 瞰:
每楊 {3,4,5}, X=8, Y=2
每 Z=X℅Y=16={1,0,1}
每 X={2,0,3}, Y={2,2,2}卅及匹﹜
Z={4 mod 3,0 mod 4,6 mod 5}={1,0,1}
15

16
00 01 10 11
00
01
10
11
0
1
1
1
1
1
0
0
0
1
1
1
1
1
0
0
X1=(x1, x2)
X2=(x3, x4)
?=2
h(X1) ㄟㄟㄠㄠ
x1 0 0 1 1
x2 0 1 0 1
h(X1) 0 1 0 1
0 1
00 0 1
01 1 1
10 1 0
11 1 0
x3,x4
h(X1)
憝杅煦賤
24x1=16?[bit] 22x1+23x1=12?[bit]

Binary2RNS戊件田奈正
17
X mod?2 mod?3 mod4
0 0 0 0
1 1 1 1
2 0 2 2
3 1 0 3
4 0 1 0
5 1 2 1
6 0 0 2
7 1 1 3
8 0 2 0
9 1 0 1
10 0 1 2
000 001 010 011
00
01
10
11
0
1
2
0
1
2
0
1
2
0
1
2
0
1
2
0
X2=(x3, x4, x5)
X1=(x1,x2)
X mod 3 及煦賤桶
100 101 110 111
1
2
0
1
2
0
1
2
0
1
2
0
1
2
0
1

LUT市旦弗奈玉毛蚚中凶
Binary2RNS戊件田奈正
18
LUT?cascade?for?X?mod?m1
LUT?cascade?for?X?mod?m2
BRAM
BRAM
BRAM

乒斥亙伕樓呾け毛蚚中凶
RNS2Binary劐𡥼隙繚
19
m1 y1
0 0
1 15
m2 y2
0 0
1 10
2 20
m3 y3
0 0
1 6
2 12
3 18
4 24
乒斥亙伕 m1m2m3
樓呾け
乒斥亙伕 m1m2m3
樓呾け
? ?322log mm
? ?312log mm
? ?212log mm
? ?12log m
? ?22log m
? ?32log m

𣶹懂RNS及�觳萸
? 楊互湮五仁卅月, 勾引曰(苤今卅)肮元楊毛妏尹卅中
每祥歙珨卅隙繚卞煦賃仄化仄引丹
? 瞰: <7,11,13> (母奶瓜立永弁伊件斥=1001)
20
3申永玄
4申永玄
4申永玄
6坼input
LUT
8坼input
LUT
8坼input
LUT
3
4
4
4
4
3
3
4
4
Binary2RNS
戊件田奈正
(BRAM匹灍政)
RNS2Binary
戊件田奈正
(BRAM午
DSP皮伕永弁匹
灍政)

Nested RNS
? RNS及跪�豻毛載卞RNS匹桶政
每肮元楊毛妏中隙允仇午互匹五月
? 瞰: <7,11,13>℅<7,11,13>
<7,<5,6,7>11,<5,6,7>13>℅<7,<5,6,7>11,<5,6,7>13>
22
11℅11=121卅及匹,
母奶瓜立永弁伊件斥5℅6℅7=210毛手勾
RNS<5,6,7>匹桶政
桶�ㄩ
生旦玄眕ゴ及楊毛尨允

Nested RNS及瞰
? 瞰: <7,<5,6,7>11,<5,6,7>13> 奻匹及 19x22(=418)
19℅22
=<5,8,6>℅<1,0,9>
=<5,<3,2,1>11,<1,0,6>13>℅<1,<0,0,0>11,<4,3,2>13>
=<5,<0,0,0>11,<4,0,5>13>
=<5,0,2>
=418
23
跪鳻黱卞乒斥亙伕�\呾
跪RNS毛田奶瓜伉卞劐𡥼
RNS毛田奶瓜伉卞劐𡥼

Nested RNS及灍政瞰
? 樓𦑩�\呾毛�煦
每 FPGA奻及LUT(苤�耀ROM)匹灍政褫夔
24
<5,6,7>
2Bin
Bin2
<7,11,13>
3
<7,11,13>
2Bin
<5,6,7>
2Bin
Bin2
<5,6,7>
Bin2
<5,6,7>
6坼input
LUT
6坼input
LUT
6坼input
LUT
6坼input
LUT
6坼input
LUT
6坼input
LUT
6坼input
LUT
Bin2
<7,11,13>
Bin2
<5,6,7>
Bin2
<5,6,7>
4
4
3
4
4
3
3
3
3
3
3

Nested RNS蚚
Binary2RNS戊件田奈正及�傖
25
Bin2
<7,11,13>
Bin2
<5,6,7>
Bin2
<5,6,7>
ROM
(BRAM)
ROM
(BRAM)
ROM
(BRAM)
...
Bin2
<7>
Bin2
<11>
Bin2
<13>
Bin2
<5,6,7>
Bin2
<5,6,7>
跪鳻黱卞
煦賤
跪鳻黱卞
LUT市旦弗奈玉匹灍政
堤薯反跪楊及
RNS桶政
<5,6,7>

RNS及楊
? 2棒啋�心煋心隙繚毛�砓
每 48申永玄℅48申永玄及搪呾毛121(11℅11)隙樓呾
每母奶瓜立永弁伊件斥: 103申永玄
? 2毛壺仁郔苤及匼杅(午4)井日母奶瓜立永弁伊件斥毛閉尹月引匹
? 腢亼磐彆
<3,4,5,6,7,11,13,17,19,23,29,31,37,41,43,47,53,59,
61,67,71,73,79,83>
26

Nested RNS及楊
? 暫湔RNS
<3,4,5,7,11,13,17,19,23,29,31,37,41,43,47,53,59,
61,67,71,73,79,83>
? 121隙及搪睿栳呾毛�砓
? 5申永玄眕奻及楊(17眕奻)及心Nested RNS匹桶政
<3,4,5,7,11,13,
<3,4,5,7,11,13>17,
<3,4,5,7,11,13>19,
<3,4,5,7,11,13,<3,4,5,7,11,13>17>23,
<3,4,5,7,11,13,<3,4,5,7,11,13>17>29,
＃, <3,4,5,7,11,13,<3,4,5,7,11,13>17>83>
27
�化4申永玄眕狟及楊卞煦賤

市奈生伙扔奶朮毛婬�傖褫夔卅
2棒啋�心煋心隙繚
? MUX毛ピ曰杸尹化DCNN及跪𦵴黱卞市奈生伙扔奶朮毛褫劐
每 3x3�心煋心隙繚互矛奈旦
28
R R R
R R R
R R
...
W-K registers
w00
w10 w20
w01 w11 w21
0
* * *
+ + +
* * *
+ + +
R R R
R R
...
w02 w12 w22
* * *
+ + +
Input
Output
or
Neighbor
Neighbor
Neighbor

跪伊奶乩奈黱卞
市奈生伙扔奶朮毛婬�傖
? 2D�心煋心隙繚16�毛ㄠ交瓦永玄午仄化�傖
每伊奶乩奈1: 11x11
每伊奶乩奈2: 5x5 (4市奈生伙�K蹈)
每伊奶乩奈3‵5: 3x3 (16市奈生伙�K蹈)
29

�极�傖
30
...
16?parallel?modulo?mi
2D?convolutional?units
...
...
.?.?.
BRAM BRAM BRAM...
BRAM BRAM BRAM...
BRAM BRAM BRAM...
.?.?.
Parallel?Bin2Nested?RNS
Converters
Tree坼based?Nested?RNS2Bin
Converters
Sequencer?????????????
External?DDR3SODIMM
DDR3?Ctrl.DDR3?Ctrl.
On坼chip
Memory
RNS
2
Bin
RNS
2
Bin
RNS
2
Bin
RNS
2
Bin
RNS
2
Bin
.........
...

灍蚾虐噫
? FPGA示奈玉: Xilinx扦VC707示奈玉
? FPGA: Virtex7 VC485T
每 Slice杅: 75,900
每 18kb BRAM杅: 2,060
每 DSP48E杅: 2,160
每 1GB DDR3SODIMM
(田旦厒僅:800MHz, 犯奈正盟: 64申永玄)
? 磁傖汁奈伙: Vivado2014.1
每 �釬笚疏杅秶廣: 400MHz
32

坻及忒楊午及掀廌
33
苤杅萸
儕僅
�釬
笚疏杅
[MHz]
FPGA 俶夔
[GOPS]
栳呾躇僅
[GOPS/
Slice?x?10坼4]
ASAP2009 16bit?嘐隅 115 Viretex5 LX330T 6.7 1.3
PACT2010 坼坼坼 125 Viretex5 SX240T 7.0 1.9
FPL2009 48bit 嘐隅 125 Spartax3A DSP3400 5.3 2.2
ISCA2010 48bit 嘐隅 200 Virtex5 SX240T 16.0 4.3
ICCD2013 坼坼坼 150 Virtex6 LVX240T 17.0 4.5
FPGA2015 32bit 腹� 100 Virtex7 VX485T 61.6 8.1
枑偶忒楊 48bit 嘐隅 400 Virtex7 VX485T 132.2 25.2
坻及忒楊午掀廌仄化栳呾躇僅毛3.11‵19.38捷蜊囡

引午戶
? 旮𦵴�心煋心瓦亙奈仿伙生永玄伐奈弁毛
Nested RNS 毛蚚中化灍政
每 Bin2DeepRNS戊件田奈正毛LUT市旦弗奈玉匹灍政
每搪睿栳呾毛8⻌薯4堤薯LUT匹�K蹈灍俴
每醱搪祅𦑩�彆毛�K蹈僅砃奻卞瞳蚚
? 暫湔忒楊(肮珨FPGA奻卞云仃月灍蚾)午掀廌仄化
栳呾躇僅毛3.11捷蜊囡
34

端端舝

Nested RNS毛蚚中凶犯奴奈皿瓦亙奈仿伙生永玄伐奈弁及FPGA灍蚾

Recommended

More Related Content

What's hot (20)

Viewers also liked (14)

Similar to Nested RNS毛蚚中凶犯奴奈皿瓦亙奈仿伙生永玄伐奈弁及FPGA灍蚾 (20)

More from Hiroki Nakahara (8)

Nested RNS毛蚚中凶犯奴奈皿瓦亙奈仿伙生永玄伐奈弁及FPGA灍蚾