狠狠撸

狠狠撸Share a Scribd company logo
Benchmark during
different architecture cloud
IBM z Systems vs Intel Xeon
2016/5/1
Hirofumi Nakata
Copyright 2016 Hirofumi Nakata 1
Copyright 2016 Hirofumi Nakata 2
1 はじめに
昨今、メインフレームモダナイゼーションとして、旧来のCOBOL資産をjavaなどへ置き換えると
同時に、稼働プラットフォームをオープン系システムにダウンサイジングを行う事例が多い。
全日空などでの大規模トランザクションシステムをメインフレームからオープン系に移行し、java
で開発した上で稼働した場合に、オープンアーキテクチャの限界と思われる問題がまだ存在するの
は事実である。滞留した大量トランザクションを捌ききれずにシステムダウンしてしまった。
IBMメインフレームにおいては、Linuxの稼働やjavaのネイティブ稼働が可能であり、言語環境をjava
に近代化した上で、メインフレームアーキテクチャの優位性も享受したシステムの構築が可能であ
る。
メインフレームは従来より多重実行性能が優れているが、java/Cアプリケーション実行パフォーマ
ンスにおいて、オープン系システムにアドバンテージがあった。
メインフレームを用いた、java大規模トランザクションシステムが構築が可能なのかをベンチマー
クで比較して考察する。
クラウドコンピューティングで最も使われているアーキテクチャはIntelアーキテクチャである。
Intelアーキテクチャクラウド環境として、Amazon Web Serviceを利用する。IBM z Systems環境とし
て、LinuxOne Cloud (US Maristカレッジに設置)を用いて比較する。
Copyright 2016 Hirofumi Nakata 3Copyright 2016 Hirofumi Nakata 3
2 比較に用いたクラウド環境
Amazon Web Services
Instance :c4.large Memory:3.85GB vCPU:2 ECU:8
Intel(R) Xeon(R) CPU E5-2666 v3 @ 2.90GHz (5786.7 bogomips)
Hyper-Threading, x86-64, MMX, Physical Address Ext, SYSENTER/SYSEXIT, SYSCALL/SYSRET
LinuxOne Cloud
Instance : Memory:4GB vCPU:2
CPU:
vendor_id : IBM/S390
# processors : 2
bogomips per cpu: 20325.00
5GHz
On-premises
Instance: Memory:4GB vCPU:2 Vmware-workstation
Intel(R) Xeon(R) CPU X5650 @ 2.67GHz (5320.0 bogomips)
x86-64, MMX, Physical Address Ext, SYSENTER/SYSEXIT, SYSCALL/SYSRET
Copyright 2016 Hirofumi Nakata 4Copyright 2016 Hirofumi Nakata 4Copyright 2016 Hirofumi Nakata 4
3 ベンチマーク内容
1 UnixBench
総合的なベンチマーク測定。
https://github.com/kdlucas/byte-unixbench
2 FFTとAGMによる円周率計算プログラム 8,388.608桁計算実行
ELAPSを測定。演算性能測定。
http://www.kurims.kyoto-u.ac.jp/~ooura/pi_fft-j.html
3 システム多重性能測定
大量コンテキストスイッチ発生時における、ELAPS測定。
大量コンテキストスイッチ発生時における、円周率計算プログラムELAPS測定
ベンチマークプログラムをC言語で作成
384回fork()を行う、ラッパープログラム。以下(fileread.c)をexeccl (context.c)
262,144byteファイルを1byteずつReadする。1byteごとに10us sleep (fileread.c)
Copyright 2016 Hirofumi Nakata 5Copyright 2016 Hirofumi Nakata 5Copyright 2016 Hirofumi Nakata 5Copyright 2016 Hirofumi Nakata 5
ベンチマーク結果 比較
Copyright 2016 Hirofumi Nakata 6Copyright 2016 Hirofumi Nakata 6Copyright 2016 Hirofumi Nakata 6Copyright 2016 Hirofumi Nakata 6Copyright 2016 Hirofumi Nakata 6
処理演算性能比較
ベンチマーク結果 比較
1 整数演算性能比較
UnixBench Dhrystone 2 using register variables
2 浮動小数点演算性能比較
UnixBench Double-Precision Whetstone
3 浮動小数点演算性能比較
FFTとAGMによる円周率計算プログラム 8,388,608桁計算実行
Copyright 2016 Hirofumi Nakata 7Copyright 2016 Hirofumi Nakata 7Copyright 2016 Hirofumi Nakata 7Copyright 2016 Hirofumi Nakata 7Copyright 2016 Hirofumi Nakata 7Copyright 2016 Hirofumi Nakata 7
ベンチマーク結果 比較
1 整数演算性能比較 UnixBench Dhrystone 2 using register variables
28756834.1
40423150.3
37747222.2
0 5000000 10000000 15000000 20000000 25000000 30000000 35000000 40000000 45000000
1
UnixBench
aws.c4.large s390x ia_64
Dhrystone 2 using register variables (lps)
Copyright 2016 Hirofumi Nakata 8
2 浮動小数点演算性能比較 UnixBench Double-Precision Whetstone
3660.5
2937.5
4586.9
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
1
UnixBench
aws.c4.large s390x ia_64
Double-Precision Whetstone (MWIPS)
Copyright 2016 Hirofumi Nakata 9
3 浮動小数点演算性能比較 FFTとAGMによる円周率計算プログラム
93
88
71
0 50 100 150 200 250 300
1
Context Switch Bench
aws.c4.large s390x ia_64
pi 8388608 digits (sec)
Copyright 2016 Hirofumi Nakata 10
多重処理性能比較
1 コンテキストスイッチ性能比較
UnixBench Pipe-based Context Switching
2 コンテキストスイッチ性能比較
fileread 384 process MAX Context switch
3 多重処理性能比較
fileread 384 process AVG.Elaps
4 多重処理性能比較
pi 8388608 digits with fileread 384 process
Copyright 2016 Hirofumi Nakata 11
1 コンテキストスイッチ性能比較 UnixBench Pipe-based Context Switching
216318.4
504884
473149
0 100000 200000 300000 400000 500000 600000
1
UnixBench
aws.c4.large s390x ia_64
Pipe-based Context Switching (cswitch/sec)
Copyright 2016 Hirofumi Nakata 12
2 コンテキストスイッチ性能比較 fileread 384 process MAX Context switch
580085
1333624
656553
0 200000 400000 600000 800000 1000000 1200000 1400000 1600000
1
Context Switch Bench
aws.c4.large s390x ia_64
fileread 384 process MAX Context switch
Copyright 2016 Hirofumi Nakata 13
3 多重処理性能比較 fileread 384 process elaps Avg.
170.548739
76.123154
152.38854
0 50 100 150 200 250 300
1
Context Switch Bench
aws.c4.large s390x ia_64
fileread 384 process AVG.Elaps (sec)
Copyright 2016 Hirofumi Nakata 14
4 多重処理性能比較 pi 8388608 digits with fileread 384 process
245
144
223.93
0 50 100 150 200 250 300
1
Context Switch Bench
aws.c4.large s390x ia_64
pi 8388608 digits with fileread 384 process (sec)
Copyright 2016 Hirofumi Nakata 15
考察
Copyright 2016 Hirofumi Nakata 16Copyright 2016 Hirofumi Nakata 16
考察
異アークテクチャー間での比較であるが、測定結果からAWS c4.largeとLinuxOne cloudとの処理性能はほぼ同
等と推測される。
まずは処理性能においては浮動小数点演算項目(Double-Precision Whetstone)においてaws c4.large及びOn-
premises環境に対して、劣る結果となっているが、浮動小数点演算項目(FFTとAGMによる円周率計算プログ
ラム 8,388,608桁計算実行)においてはほぼ同等の性能である。
このことから、IBMメインフレームz Systems z13において、浮動小数点演算処理性能はAWS c4.largeレベルで
担保できると考察する。
多重処理性能においては、コンテキストスイッチ性能はAWS c4.largeに比べ、倍以上の性能を持つ。
このことが大量トランザクション処理を安定して実行できることを確認した。
AWS c4.largeでコンテキストスイッチ数が頭打ちとなってしまうと、他のプロセス処理が全て停止してしま
う現象を確認した。LinuxOneにおいてはそのような現象は確認されなかった。
以上の結果からメインフレームのメリットを生かしつつ、パフォーマンスも担保できるシステムを構築する
ことが可能であると考察する。

More Related Content

Benchmark during different architecture cloud IBM z Systems vs Intel Xeon

  • 1. Benchmark during different architecture cloud IBM z Systems vs Intel Xeon 2016/5/1 Hirofumi Nakata Copyright 2016 Hirofumi Nakata 1
  • 2. Copyright 2016 Hirofumi Nakata 2 1 はじめに 昨今、メインフレームモダナイゼーションとして、旧来のCOBOL資産をjavaなどへ置き換えると 同時に、稼働プラットフォームをオープン系システムにダウンサイジングを行う事例が多い。 全日空などでの大規模トランザクションシステムをメインフレームからオープン系に移行し、java で開発した上で稼働した場合に、オープンアーキテクチャの限界と思われる問題がまだ存在するの は事実である。滞留した大量トランザクションを捌ききれずにシステムダウンしてしまった。 IBMメインフレームにおいては、Linuxの稼働やjavaのネイティブ稼働が可能であり、言語環境をjava に近代化した上で、メインフレームアーキテクチャの優位性も享受したシステムの構築が可能であ る。 メインフレームは従来より多重実行性能が優れているが、java/Cアプリケーション実行パフォーマ ンスにおいて、オープン系システムにアドバンテージがあった。 メインフレームを用いた、java大規模トランザクションシステムが構築が可能なのかをベンチマー クで比較して考察する。 クラウドコンピューティングで最も使われているアーキテクチャはIntelアーキテクチャである。 Intelアーキテクチャクラウド環境として、Amazon Web Serviceを利用する。IBM z Systems環境とし て、LinuxOne Cloud (US Maristカレッジに設置)を用いて比較する。
  • 3. Copyright 2016 Hirofumi Nakata 3Copyright 2016 Hirofumi Nakata 3 2 比較に用いたクラウド環境 Amazon Web Services Instance :c4.large Memory:3.85GB vCPU:2 ECU:8 Intel(R) Xeon(R) CPU E5-2666 v3 @ 2.90GHz (5786.7 bogomips) Hyper-Threading, x86-64, MMX, Physical Address Ext, SYSENTER/SYSEXIT, SYSCALL/SYSRET LinuxOne Cloud Instance : Memory:4GB vCPU:2 CPU: vendor_id : IBM/S390 # processors : 2 bogomips per cpu: 20325.00 5GHz On-premises Instance: Memory:4GB vCPU:2 Vmware-workstation Intel(R) Xeon(R) CPU X5650 @ 2.67GHz (5320.0 bogomips) x86-64, MMX, Physical Address Ext, SYSENTER/SYSEXIT, SYSCALL/SYSRET
  • 4. Copyright 2016 Hirofumi Nakata 4Copyright 2016 Hirofumi Nakata 4Copyright 2016 Hirofumi Nakata 4 3 ベンチマーク内容 1 UnixBench 総合的なベンチマーク測定。 https://github.com/kdlucas/byte-unixbench 2 FFTとAGMによる円周率計算プログラム 8,388.608桁計算実行 ELAPSを測定。演算性能測定。 http://www.kurims.kyoto-u.ac.jp/~ooura/pi_fft-j.html 3 システム多重性能測定 大量コンテキストスイッチ発生時における、ELAPS測定。 大量コンテキストスイッチ発生時における、円周率計算プログラムELAPS測定 ベンチマークプログラムをC言語で作成 384回fork()を行う、ラッパープログラム。以下(fileread.c)をexeccl (context.c) 262,144byteファイルを1byteずつReadする。1byteごとに10us sleep (fileread.c)
  • 5. Copyright 2016 Hirofumi Nakata 5Copyright 2016 Hirofumi Nakata 5Copyright 2016 Hirofumi Nakata 5Copyright 2016 Hirofumi Nakata 5 ベンチマーク結果 比較
  • 6. Copyright 2016 Hirofumi Nakata 6Copyright 2016 Hirofumi Nakata 6Copyright 2016 Hirofumi Nakata 6Copyright 2016 Hirofumi Nakata 6Copyright 2016 Hirofumi Nakata 6 処理演算性能比較 ベンチマーク結果 比較 1 整数演算性能比較 UnixBench Dhrystone 2 using register variables 2 浮動小数点演算性能比較 UnixBench Double-Precision Whetstone 3 浮動小数点演算性能比較 FFTとAGMによる円周率計算プログラム 8,388,608桁計算実行
  • 7. Copyright 2016 Hirofumi Nakata 7Copyright 2016 Hirofumi Nakata 7Copyright 2016 Hirofumi Nakata 7Copyright 2016 Hirofumi Nakata 7Copyright 2016 Hirofumi Nakata 7Copyright 2016 Hirofumi Nakata 7 ベンチマーク結果 比較 1 整数演算性能比較 UnixBench Dhrystone 2 using register variables 28756834.1 40423150.3 37747222.2 0 5000000 10000000 15000000 20000000 25000000 30000000 35000000 40000000 45000000 1 UnixBench aws.c4.large s390x ia_64 Dhrystone 2 using register variables (lps)
  • 8. Copyright 2016 Hirofumi Nakata 8 2 浮動小数点演算性能比較 UnixBench Double-Precision Whetstone 3660.5 2937.5 4586.9 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 1 UnixBench aws.c4.large s390x ia_64 Double-Precision Whetstone (MWIPS)
  • 9. Copyright 2016 Hirofumi Nakata 9 3 浮動小数点演算性能比較 FFTとAGMによる円周率計算プログラム 93 88 71 0 50 100 150 200 250 300 1 Context Switch Bench aws.c4.large s390x ia_64 pi 8388608 digits (sec)
  • 10. Copyright 2016 Hirofumi Nakata 10 多重処理性能比較 1 コンテキストスイッチ性能比較 UnixBench Pipe-based Context Switching 2 コンテキストスイッチ性能比較 fileread 384 process MAX Context switch 3 多重処理性能比較 fileread 384 process AVG.Elaps 4 多重処理性能比較 pi 8388608 digits with fileread 384 process
  • 11. Copyright 2016 Hirofumi Nakata 11 1 コンテキストスイッチ性能比較 UnixBench Pipe-based Context Switching 216318.4 504884 473149 0 100000 200000 300000 400000 500000 600000 1 UnixBench aws.c4.large s390x ia_64 Pipe-based Context Switching (cswitch/sec)
  • 12. Copyright 2016 Hirofumi Nakata 12 2 コンテキストスイッチ性能比較 fileread 384 process MAX Context switch 580085 1333624 656553 0 200000 400000 600000 800000 1000000 1200000 1400000 1600000 1 Context Switch Bench aws.c4.large s390x ia_64 fileread 384 process MAX Context switch
  • 13. Copyright 2016 Hirofumi Nakata 13 3 多重処理性能比較 fileread 384 process elaps Avg. 170.548739 76.123154 152.38854 0 50 100 150 200 250 300 1 Context Switch Bench aws.c4.large s390x ia_64 fileread 384 process AVG.Elaps (sec)
  • 14. Copyright 2016 Hirofumi Nakata 14 4 多重処理性能比較 pi 8388608 digits with fileread 384 process 245 144 223.93 0 50 100 150 200 250 300 1 Context Switch Bench aws.c4.large s390x ia_64 pi 8388608 digits with fileread 384 process (sec)
  • 15. Copyright 2016 Hirofumi Nakata 15 考察
  • 16. Copyright 2016 Hirofumi Nakata 16Copyright 2016 Hirofumi Nakata 16 考察 異アークテクチャー間での比較であるが、測定結果からAWS c4.largeとLinuxOne cloudとの処理性能はほぼ同 等と推測される。 まずは処理性能においては浮動小数点演算項目(Double-Precision Whetstone)においてaws c4.large及びOn- premises環境に対して、劣る結果となっているが、浮動小数点演算項目(FFTとAGMによる円周率計算プログ ラム 8,388,608桁計算実行)においてはほぼ同等の性能である。 このことから、IBMメインフレームz Systems z13において、浮動小数点演算処理性能はAWS c4.largeレベルで 担保できると考察する。 多重処理性能においては、コンテキストスイッチ性能はAWS c4.largeに比べ、倍以上の性能を持つ。 このことが大量トランザクション処理を安定して実行できることを確認した。 AWS c4.largeでコンテキストスイッチ数が頭打ちとなってしまうと、他のプロセス処理が全て停止してしま う現象を確認した。LinuxOneにおいてはそのような現象は確認されなかった。 以上の結果からメインフレームのメリットを生かしつつ、パフォーマンスも担保できるシステムを構築する ことが可能であると考察する。