端端舝

雄腔數賒楊及甜蹈趙
五凶戈奈 (@Pro_ktmr)

赻撩畿賡
? 五凶戈奈 (@Pro_ktmr)
? 湮筅葬蕾湮忒ゴ詢苺 3爛
? ◇CUDA C 皿伕白尼永扑亦瓜伙皿伕弘仿立件弘◆ 啤
? 幻午氏升掂氏匹卅中???
? �爛及狦撫本立卞手中凶
2

1爛嶲及傖墿
狦撫本立瓜奈2018
? AtCoder 髮
? JOI 軑腢邈切
? 湮�耀嶱逃磊歠卅仄
? 旃噶逃桶匹苺囀1弇
? AtCoder 酴
? JOI景6弇 APIO緉丟母伙
? PCK乒田矛旦玄失奶犯失揗
? SSH及禾旦正奈揗
3

1爛嶲及傖墿
? AtCoder 髮
? JOI 軑腢邈切
? 湮�耀嶱逃磊歠卅仄
? 旃噶逃桶匹苺囀1弇
? AtCoder 酴
? APIO 緉丟母伙
? PCK乒田矛旦玄失奶犯失揗
? 旃噶逃桶匹�弊伊矛伙及揗
4
狦撫本立匹玄永皿𦵴午
蝠霜匹五凶井日

旦玄奈伉奈
菴1� GPU
? CPU及ゴ卞芼⺼政木凶GPU午反ˋ
菴2� 沭璃煦嶊
? min午max互峉卅中ㄐ
菴3� 瓜永皿扔永弁�觳
? 疋弁瓦永弁卞俴仇丹
菴4� 挐隙本奈伙旦穴件�觳
? bitDP午煾尹ㄐ
5

菴1� GPU
CPU及ゴ卞芼⺼政木凶GPU午反ˋ
6

7
CPU
GPU戊失 GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失

CPU午GPU
CPU
癶籵1戊失分仃
敪中
婌中
GPU
戊失凶仁今氏(3000午井)
敪仁卅中
綈中
8
CPU
GPU戊失 GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失

CPU午GPU
CPU
癶籵1戊失分仃
敪中
婌中
GPU
敪仁卅中
綈中
9
CPU
GPU戊失 GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
伐件左矢伊奈
扑亦件分疋正
田市手摩引木壬
恅忷及眭𨫆疋正

CPU午GPU
CPU
癶籵1戊失分仃
敪中
婌中
GPU
敪仁卅中
綈中
10
CPU
GPU戊失 GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
敪中井日睡匹手
匹五月疋正
��g卅仇午毛�K
蹈�I燴匹五月疋

CPU午GPU
CPU
癶籵1戊失分仃
敪中
婌中
GPU
敪仁卅中
綈中
11
CPU
GPU戊失 GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
敪中井日睡匹手
匹五月疋正
��g卅仇午毛�K
蹈�I燴匹五月疋
公及�I燴ㄛ�K蹈趙匹五月ˋˋ

�K蹈趙匹五月�I燴
int A[5000], B[5000], C[5000];
for(int i=0; i<5000; i++){
C[i] = A[i] + B[i];
}
12

�K蹈趙匹五月�I燴
int A[5000], B[5000], C[5000];
for(int i=0; i<5000; i++){
C[i] = A[i] + B[i];
}
13
GPU戊失
＃＃
C[0]=A[0]+B[0]
GPU戊失
C[1]=A[1]+B[1]
GPU戊失
C[2]=A[2]+B[2]
GPU戊失
C[3]=A[3]+B[3]

�K蹈趙匹五卅中�I燴
int A[5002] = {1,1};
for(int i=0; i<5000; i++){
A[i+2] = A[i] + A[i+1];
}
14

�K蹈趙匹五卅中�I燴
int A[5002] = {1,1};
for(int i=0; i<5000; i++){
A[i+2] = A[i] + A[i+1];
}
紨棒�I燴及斛猁丐曰 ↙ �K蹈趙褣仄中
15

�腔�賒楊午反 (Wikipedia)
狟�2沭璃毛㦤凶允失伙打伉朮丞及駙備匹丐月ㄝ
? 䔝慮腔卅憝�S及瞳蚚ㄩ方曰苤今卅�觳瞰及賤支�呾
磐彆毛䔝慮腔卅憝�S毛瞳蚚仄化方曰湮五卅�觳瞰毛
賤仁及卞妏蚚允月ㄝ
? �呾磐彆及�嶕ㄩ苤今卅�觳瞰ㄛ�呾磐彆井日�嶕
仄ㄛ肮元�呾毛睡僅手俴丹仇午毛旌仃月ㄝ䔝慮腔卅憝
�S匹及統桽毛�薹方仁俴丹凶戶卞ㄛ�呾磐彆反淕杅ㄛ
恅趼支公及瞎心卅升毛�堤仄卞仄化奪燴今木月ㄝ
16

�腔�賒楊午反 (Wikipedia)
狟�2沭璃毛㦤凶允失伙打伉朮丞及駙備匹丐月ㄝ
? 䔝慮腔卅憝�S及瞳蚚ㄩ方曰苤今卅�觳瞰及賤支�呾
磐彆毛䔝慮腔卅憝�S毛瞳蚚仄化方曰湮五卅�觳瞰毛
賤仁及卞妏蚚允月ㄝ
? �呾磐彆及�嶕ㄩ苤今卅�觳瞰ㄛ�呾磐彆井日�嶕
仄ㄛ肮元�呾毛睡僅手俴丹仇午毛旌仃月ㄝ䔝慮腔卅憝
�S匹及統桽毛�薹方仁俴丹凶戶卞ㄛ�呾磐彆反淕杅ㄛ
恅趼支公及瞎心卅升毛�堤仄卞仄化奪燴今木月ㄝ
17

�腔�賒楊
18
午化手
苤今卅
�觳
幻升幻升卞
苤今卅
�觳
屾仄
湮五卅
�觳
午化手
湮五卅
�觳
�楓卞�I燴仄卅仃木壬卅日卅中ㄐ

�腔�賒楊
19
午化手
苤今卅
�觳
幻升幻升卞
苤今卅
�觳
屾仄
湮五卅
�觳
午化手
湮五卅
�觳
�楓卞�I燴仄卅仃木壬卅日卅中ㄐ
DP毛�K蹈趙匹五凶日�中ㄐㄐ

旦玄奈伉奈
菴1� GPU
? bitDP午煾尹ㄐ
20

min午max互峉卅中ㄐ
21

22
GPU戊失 GPU戊失
10 < 5 井手
中支 10 = 5

23
isPitaro
true
false
GPU戊失
GPU戊失

GPU反綈中
GPU反田市卅及匹ㄛ沭璃煦嶊允月午綈中
仄井手ㄛ逋�K心毛公欠尹互切
沭璃煦嶊反屾卅中源互方中
24

午仇欠匹�腔�賒楊
瓜永皿扔永弁�觳及𪊓趙宒
? ?, ? = max ? ? ? 1, ? , ? ? ? 1, ? ? ?? + ??
25

? ?, ? = ??? ? ? ? 1, ? , ? ? ? 1, ? ? ?? + ??
DP及𪊓趙宒卞反 max 支 min 互嗣〝湔婓
26

? ?, ? = ??? ? ? ? 1, ? , ? ? ? 1, ? ? ?? + ??
DP及𪊓趙宒卞反 max 支 min 互嗣〝湔婓
27
max支min毛沭璃煦嶊卅仄匹
灍蚾堤懂凶日???

max午min毛申永玄栳呾匹灍蚾
int max(int a, int b){
if(a > b) return a;
else return b;
}
return ((-(a>b)) & a) + ((-(a<=b)) & b);
}
28

? ? > ? 及午五
return ((-(a>b)) & a) + ((-(a<=b)) & b);
}
? ? ≒ ? 及午五
return ((-(a>b)) & a) + ((-(a<=b)) & b);
}
29

? ? > ? 及午五
return ((-1) & a) + ((0) & b);
}
? ? ≒ ? 及午五
return ((0) & a) + ((-1) & b);
}
30

? ? > ? 及午五
return ((???1111) & a) + ((???0000) & b);
}
? ? ≒ ? 及午五
return ((???0000) & a) + ((???1111) & b);
}
31
2筳杅桶�

旦玄奈伉奈
菴1� GPU
? bitDP午煾尹ㄐ
32

疋弁瓦永弁卞俴仇丹ㄐ
33

(珨𡛟)�觳恅
��互 ?? 笭今互 ?? 匹丐月方丹卅 ? �及ⅲ昜午ㄛ⺍講
互 ? 及瓜永皿扒永弁互丐曰引允ㄝ棒及沭璃毛㦤凶允方
丹卞ㄛⅲ昜毛腢氏匹瓜永皿扒永弁卞⻌木引允ㄩ
? 腢氏分ⅲ昜及��及磁�毛匹五月分仃詢仁允月ㄝ
? 腢氏分ⅲ昜及笭今及駙睿反 ? 毛閉尹卅中ㄝ
��及磁�及郔湮�毛А戶化仁分今中ㄝ
(http://judge.u-aizu.ac.jp/onlinejudge/description.jsp?id=DPL_1_B&lang=jp)
34

�K蹈趙仄凶中
𪊓趙宒反
? ?, ? = max ? ? ? 1, ? , ? ? ? 1, ? ? ?? + ??
勾引曰
? ?, ? = max ? ? ? 1, ? , ? ? ? 1, ? + ??
35

�K蹈趙仄凶中
𪊓趙宒反
? ?, ? = max ? ? ? 1, ? , ? ? ? 1, ? ? ?? + ??
勾引曰
? ?, ? = max ? ? ? 1, ? , ? ? ? 1, ? + ??
? ?, ? 毛А戶月及卞 ? ? ? 1,0 ~? ? ? 1, ? 互斛猁
? ?, ? 毛А戶月及卞 ? ?, 0 ~? ?, ? 反斛猁卅中
36

�K蹈趙仄凶中
腛痄毛�匹手紝舷允月午
37

�K蹈趙仄凶中
38
夫
午
井
凶
引
曰
夫
午
井
凶
引
曰
夫
午
井
凶
引
曰
夫
午
井
凶
引
曰

�K蹈趙仄凶中
39
夫
午
井
凶
引
曰
夫
午
井
凶
引
曰
夫
午
井
凶
引
曰
夫
午
井
凶
引
曰
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失

�K蹈趙仄凶中
40
夫
午
井
凶
引
曰
夫
午
井
凶
引
曰
夫
午
井
凶
引
曰
夫
午
井
凶
引
曰
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
? 隙及伙奈皿毛CPU匹隙仄化
? �及�I燴毛GPU匹�K蹈趙

末奈旦戊奈玉 (㠙�)
#define BS 1000
__global__ void solve(int W, int *w, long long *v, long long *dp, int i){
int j = blockIdx.x*blockDim.x + threadIdx.x;
if(j >= W) return;
dp[(i&1)*(W+1)+j] = dmax(dp[((i-1)&1)*(W+1)+j],
-(j>=w[i]) & (dp[dmax(0,((i-1)&1)*(W+1)+j-w[i])]+v[i]));
}
int main(){
(⻌薯及忳仃龰曰ㄛ丟乒伉及戊疋奈卅升)
solve0<<<(W +BS-1)/BS,BS>>>(W, dw, dv, dp, 0);
for(int i=1; i<N; i++){
cudaDeviceSynchronize();
solve<<<(W +BS-1)/BS,BS>>>(W, dw, dv, dp, i);
}
(湘尹及堤薯卅升)
}
41
CUDA及賤掊反
棒眕蔥及�及逃桶毛�中化友ㄐ

�呾厒僅及掀廌
CPU
N
103
104
105
W
103
3.579 20.32 187.5
104
19.00 175.6 1746
105
178.7 1720 17064
GPU
N
103
104
105
W
103
219.1 319.4 1323
104
222.9 322.9 1299
105
237.5 326.1 1336
42
跪20意及氾旦玄弗奈旦匹�䛐仄凶ⅸ歙� [�g弇:ms]

43
CPU
GPU
N
103
104
105
W
103
0.016 0.06 0.142
104
0.085 0.544 1.345
105
0.753 5.275 12.77
GPU反CPU及 ? 捷詢厒

44
CPU
GPU
N
103
104
105
W
103
0.016 0.06 0.142
104
0.085 0.544 1.345
105
0.753 5.275 12.77
12捷詢厒趙

45
CPU
GPU
N
103
104
105
W
103
0.016 0.06 0.142
104
0.085 0.544 1.345
105
0.753 5.275 12.77
12捷詢厒趙

46
CPU
GPU
N
103
104
105
W
103
0.016 0.06 0.142
104
0.085 0.544 1.345
105
0.753 5.275 12.77
12捷詢厒趙

�呾厒僅及掀廌 (N=105)
47
0
5000
10000
15000
20000
1e3 1e4 1e5
W
GPU
CPU
[�g弇ㄩms]

48
0
5000
10000
15000
20000
1e3 1e4 1e5
W
GPU
CPU
[�g弇ㄩms]

49
0
5000
10000
15000
20000
1e3 1e4 1e5
W
GPU
CPU
[�g弇ㄩms]

50
0
5000
10000
15000
20000
1e3 1e4 1e5
W
GPU
CPU
[�g弇ㄩms]
GPU允仍中ㄐ

旦玄奈伉奈
菴1� GPU
? bitDP午煾尹ㄐ
51

bitDP午煾尹ㄐ
52

(珨𡛟)�觳恅
笭心葆五衄砃弘仿白 ?(?, ?) 卞勾中化ㄛ眕狟及沭璃毛㦤
凶允郔傻磊繚及擒褩毛А戶化狟今中ㄩ
? 丐月�萸井日堤逃仄ㄛ堤逃萸尺𥽋月寯繚匹丐月ㄝ
? 跪�萸毛切斤丹升 1 僅籵月ㄝ
(http://judge.u-aizu.ac.jp/onlinejudge/description.jsp?id=DPL_2_A&lang=jp)
53

(珨𡛟)賤楊
? �萸 0 井日挐隙毛宎戶月午仄化珨啜俶毛囮歹卅中
? 踏中月�萸及楓瘍 ? 籵曰ㄛ允匹卞俴勻凶仇午及丐月
�萸及ロ� 2 ?
籵曰毛厥勻化bitDP
? 跪腛痄反棒卞升及�萸卞俴仁井及 ? 籵曰
? ?(?2
2 ?
)
54

bitDP毛�K蹈趙仄凶中
手日丹DP毛蕉尹月
瞰) ?? 010101 毛�呾允月卞反
?? 0?0101 , ?? 010?01 , ?? 01010? 互斛猁
55

手日丹DP毛蕉尹月
瞰) ?? 010101 毛�呾允月卞反
?? 0?0101 , ?? 010?01 , ?? 01010? 互斛猁
▽珨啜趙▼
? bit 蕾勻化中月 ?? 毛А戶月卞反
? ? 1 bit 蕾勻化中月 ?? 互斛猁
56

�尨允月午
57
0000
0001
0010
0100
1000
0011
0101
0110
1001
1010
1100
0111
1011
1101
1110
1111

�尨允月午
58
0000
0001
0010
0100
1000
0011
0101
0110
1001
1010
1100
0111
1011
1101
1110
1111
申
永
玄
0
弘
伙
奈
皿
申
永
玄
1
弘
伙
奈
皿
申
永
玄
2
弘
伙
奈
皿
申
永
玄
3
弘
伙
奈
皿
申
永
玄
4
弘
伙
奈
皿
? + 1 弘伙奈皿

�尨允月午
59
0000
0001
0010
0100
1000
0011
0101
0110
1001
1010
1100
0111
1011
1101
1110
1111
申
永
玄
0
弘
伙
奈
皿
申
永
玄
1
弘
伙
奈
皿
申
永
玄
2
弘
伙
奈
皿
申
永
玄
3
弘
伙
奈
皿
申
永
玄
4
弘
伙
奈
皿
? + 1 弘伙奈皿
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失
GPU戊失

末奈旦戊奈玉 (㠙�)
__global__ void solve(int *d, int *state, int *num, int *dp, int V, int i){
int j = blockIdx.x*blockDim.x + threadIdx.x;
if(j >= num[i]*V) return;
int k = j % V; j /= V;
if(!((state[j*V+i]>>k)&1)) return;
for(int l=0; l<V; l++)
dp[state[j*V+i]*V+k] = dmin(dp[state[j*V+i]*V+k], dp[(state[j*V+i]^(1<<k))*V+l]+d[l*V+k]);
}
int main(){
(⻌薯及忳仃龰曰卅升)
for(int i=0; i<V+1; i++) num[i] = 0
for(int i=0; i<(1<<V); i++){
int c = 0;
for(int j=1; j<(1<<V); j<<=1)
if(i&j) c++;
state[num[c]*V+c] = i;
num[c]++;
}
(丟乒伉及戊疋奈卅升)
for(int i=0; i<=V; i++){
solve<<<(num[i]*V +BS-1)/BS,BS>>>(dd, dstate, dnum, dp, V, i);
cudaDeviceSynchronize();
}
(湘尹及堤薯卅升)
}
60
CUDA及賤掊反
棒眕蔥及�及逃桶毛�中化友ㄐ

CPU
V time V time V time
2 1.9 11 2.15 20 690.2
3 1.75 12 2.75 21 1563.6
4 1.85 13 4.05 22 3498.8
5 1.7 14 6.7 23 7826.6
6 1.55 15 13.4 24 17303
7 1.75 16 27.35 25 37929
8 1.85 17 58.4 26 81735
9 1.8 18 131
10 2.1 19 297.35
GPU
V time V time V time
2 150 11 151.5 20 221.4
3 152 12 151.3 21 297.5
4 150.35 13 153.3 22 405.05
5 151.65 14 153.2 23 691.55
6 150.2 15 155.5 24 1296.6
7 150.05 16 154.3 25 2597.6
8 152.2 17 158.55 26 5356.5
9 151.6 18 166.2
10 151.6 19 183.5
61
跪20意及氾旦玄弗奈旦匹�䛐仄凶ⅸ歙� [�g弇:ms]

�呾厒僅及掀廌 (V汨22)
62
0
1000
2000
3000
4000
2 4 6 8 10 12 14 16 18 20 22
CPU
GPU
[�g弇ㄩms]

63
0
1000
2000
3000
4000
2 4 6 8 10 12 14 16 18 20 22
CPU
GPU
GPU反お�卞
媆嶲互井井月
[�g弇ㄩms]

64
0
10000
20000
30000
40000
50000
60000
70000
80000
90000
2 4 6 8 10 12 14 16 18 20 22 24 26
CPU
GPU
[�g弇ㄩms]

65
0
10000
20000
30000
40000
50000
60000
70000
80000
90000
2 4 6 8 10 12 14 16 18 20 22 24 26
CPU
GPU
CPU82鏃
GPU5鏃
廣16捷詢厒ㄐ
[�g弇ㄩms]

66
0
10000
20000
30000
40000
50000
60000
70000
80000
90000
2 4 6 8 10 12 14 16 18 20 22 24 26
[�g弇ㄩms]
GPU
CPU
CPU82鏃
GPU5鏃
廣16捷詢厒ㄐ
https://umaibou.jp/product/

67
0
10000
20000
30000
40000
50000
60000
70000
80000
90000
2 4 6 8 10 12 14 16 18 20 22 24 26
[�g弇ㄩms]
GPU
CPU
CPU82鏃
GPU5鏃
廣16捷詢厒ㄐ
https://umaibou.jp/product/

引午戶
? 俶夔及�中戊失互凶仁今氏摩引勻凶及互GPU
? 沭璃煦嶊毛bit栳呾卞邈午仄煋戈午詢厒
? max支min手
? DP反☆夫午井凶引曰★毛砩舑仄化�K蹈趙
? bitDP反☆申永玄杅及弘伙奈皿★仍午卞�K蹈趙
? 郔湮匹廣16捷詢厒卞卅勻凶ㄐ
69

端端舝

雄腔數賒楊及甜蹈趙

Recommended

More Related Content

What's hot (20)

Similar to 雄腔數賒楊及甜蹈趙 (20)

雄腔數賒楊及甜蹈趙