NTTコミュニケーションズでは、Azure Stack Hub with GPUを先行で導入し検証を行っています。本資料では、実際に利用している立場からデモを交えつつAzure Stack Hub with GPUのユースケースをお話すると共に、GPUのベンチマークを含む他社クラウドとの性能比較結果について情報共有をいたします。
13. 12
? スピン間相互作用によりイジングモデルのエネルギーはランドスケープに沿って減少
? 局所解を避けるためランダムにスピン値を破壊
? 必ず最適解が求まるわけではない (工学的にはOK)
CMOSアニーリング
?Transition to lower energy
(interaction as in previous slide)
?Avoidance of local minimum
solution by randomness
Energyofsystem
H(KPI)
Spin status (2n patterns)
Solution
n: number of spins
17. 16
? 乱数列をジグザグの経路で入力
? 乱数列に含まれる”1”の数を調整することでSAの温度の効果を再現
1-bit PRNG
1-bitPRNG
PRNG: Pseudo Random Number
Generator
Zigzag paths
Spin inversion using random
pulse
? Output of the interaction
circuit will be inverted if both
of the random pulses are ‘1’
Majority
voterSpin unit
XORSpin
Random pulse 1
Randompulse2
M. Hayashi et al., "An Accelerator Chip for Ground-state Searches of the Ising Model with Asynchronous Random Pulse Distribution,"
6th International Workshop on Advances in Networking and Computing
乱数列入力によるランダム動作(1)
AND
18. 17
Mark ratio during ground-state search
?Decreasing mark ratio has similar
effect to cooling schedule in Simulated
Annealing
PRNG
Controlling mark ratio of 1bit PRNG
Comparator
Threshold
e.g. LFSR 0 (r < Threshold)
1 (Otherwise)
1bit PRNG output @High threshold (0.75)
1bit PRNG output @Low threshold (0.25)
r
1bit PRNG
0
1
0
1
0
0.2
0.4
0.6
0.8
1
Mark ratio
Expected spin flip rate Time
Aggressively escape
from local minima
Settle to nearby low
energy solution
Time
Time
乱数列入力によるランダム動作(2)
? スピン値がフリップする確率を調整
? 計算が進むにしたがってフリップ率を低下させる
20. 19
?多数決回路の前の段階での乱数の挙動は第1世代と同様
?グラウバーダイナミクスの確率的な挙動とは異なる
第2世代の動作アルゴリズム
◆Signals to inverters
n+ : number of signals with “1” at red dots
n? : number of signals with “0” at red dots
◆Glauber dynamics
P+ : probability that the spin state is +1
through spin update in accordance with
Glauber dynamics
N
H[1] Inverter
H[0] Inverter
J1[1] Inverter
J1[0]
N1 Inverter
JL-1[1] Inverter
JL-1[0]
NL-1 Inverter
……
Majorityvotercircuit
27. 26
? Map of annealing machine and algorithms
さらなる高性能化に向けて
Digital
Analog
Quantum(-inspired)Non-Quantum
Quantum
annealing
machine
New CMOS
annealing machine
with SQA
Coherent
Ising
machine
Software SQASoftware SA
Optoelectr
onic silicon
chip
CMOS
annealing
machine
30. 29
最適化問題計算時の速度比較
?従来方式(シミュレーテッドアニーリング: SA)と比較して40倍高速に最適化処
理を実行
Note:
? Total annealing time means a time to obtain 99.9% solution with a probability of 99%
? 200 different random Ising models on a king graph are used
? We run the optimized SA program on a state-of-the-art CPU (Intel Core i7-6700K, 8 threads)
x40 x15
42. 41
Original formulation
Ising formulation of NPP
wi : value of i-th element of the set S
σi : label of i-th element
数分割問題(Number Partitioning)
? Formulation of NPP mapped to Ising model formulation
43. 42
Ising formulation of constrained NPP
Original formulation
wi : value of i-th element of the set S
σi : label of i-th element
Same number of items for
each group
数分割問題(Number Partitioning)
? Formulation of NPP mapped to Ising model formulation