More Related Content What's hot (20)
PPTX
研究者のための Python による FPGA 入門
ryos36 ?
PDF
FPGAで作るOpenFlow Switch (FPGAエクストリーム?コンピューティング 第6回) FPGAX#6
Kentaro Ebisawa ?
PDF
贵笔骋础+厂辞颁+尝颈苍耻虫実践勉强会资料
一路 川染 ?
PDF
FPGAによるHDMI to LVDS変換器
I_HaL ?
Viewers also liked (15)
PPTX
Maker Faire 2016 - Microbit & Nano Satellite
Lilian Kasem ?
PDF
[Azure Council Experts (ACE) 第20回定例会] Microsoft Azureアップデート情報 (2016/10/14-201...
Naoki (Neo) SATO ?
Similar to Myoshimi extreme (20)
PDF
20220525_kobayashi.pdf
直久 住川 ?
PDF
Fully-Functional FPGA Prototype with Fine-Grain Programmable Body Biasing (FP...
Ryohei Kobayashi ?
PDF
第9回础颁搁颈ウェビナー冲日立/岛田様ご讲演资料
直久 住川 ?
PPTX
础苍诲谤辞颈诲と蹿辫驳补を高速蹿颈蹿辞通信させちゃう
ksk sue ?
Myoshimi extreme3. 生化学モデルとシミュレーション
解析モデル(ODE)
手法
確率モデル(SSA)
確率的な振る舞いを含めたモデル化
モンテカルロ?シミュレーション
? パラメータサーベイ的な性質
分子濃度を連続的な変量としてモデル
化
? モデルの構築,検証に膨大な
シミュレーションを要する
→高いスレッドレベル並列性
? パイプライン実行+並列モジュール
3
4. 贵笔骋础を用いた化学反応シミュレー
タ
? ReCSiP (Reconfigurable Cell Simulation Platform) [2003-]
? 細胞内で生じる化学反応をシミュレーションする専用計算機
? 長崎大学,JST-ERATO,Caltechとの共同研究(NIH)
? 並列アクセス可能なSRAMと差動シリアル通信を実装
? FPGA: Field-Programmable Gate Array
? 幸せな時代:1万~10万程度のLUTで任意の論理回路を構成するLSI
? 十分な数のFP演算が構成できるようになっていた
NoC型(16スレッド) SSA-FPGAの構造
FP- ヒープ+NoC (2007)
Multiplier D D
FPGA PRNG
A
B
FP- C D D C
Logarithm
E
入力 出力
ReCSiP-3 board (2006) LUT: LookUpTable 0000 1
Xilinx Virtex-4 XC4VLX100- 出力をカスタム可能 0001 0
C F C
11FF1136 ….. 4..
1111 1
5. CUBE: 512 FPGA Cluster
? 英国インペリアル?カレッジで海外研究(2009年2月~3月)
? FPGAが8x8実装されたボードを8枚重ねて運用? Verilog-HDLを用いたFP演算の実装
– IEEE754準拠の四則演算+対数
? 64ビット単方向信号で接続 ? 乱数生成モジュール
– LSFR,Merssenne-Twisterなど
? ストリームアプリケーション向け計算システム ? BlockRAMを利用したヒープ
? 文字列編集距離で性能をCell/B.E.,GPUと比較? NoC用ルータモジュール
このころ,CPUのマルチコア化と,GPUが人気になり,
「特定のアプリでも」何百倍も高速化する夢のデバイスと 5
してのFPGAはその歴史的役割を終えつつあった...(‘A`)
6. 注目:笔颁内通信速度のギャッ
プ
フォトンマッピングしたー
い!
MBPR15(Core i7)でキャッシュに載ら
なくなるとどうなるの?マージソー
7. (想定)並列ストレージ向けFPGA
PCIe Gen3 ボード
Max FPGA: Computing
32.0GB/s and
Parallel Storage Access
SATA each
0.6GB/s
Max
0.125GB/s
GbE
NIC
FPGA-
board
Parallel accessible SSDs
8. 実現したいこと
? 並列ディスクアクセス密度の向上
– (あたりまえ) RAIDを構築
– 設置体積あたり,消費電力あたりのIO速度の向上
– 分散処理の仕組みでノード数を削減
? OSS-DBRMSのプラグインとかHadoopまわりのライブラリ
等?
? 低遅延通信の実現
– FPGA内でプリプロセス
? FusionIOやらPCI-SSDをやっつけろ