狠狠撸

狠狠撸Share a Scribd company logo
USENIX NDSI 2017報告
&
Efficient Memory Disaggregation with
Infiniswap (University of Michigan)
須崎有康
独立行政法人 産業技術総合研究所
第2回 システム系輪講会
NSDI2017概要
? 14th USENIX Symposium on Networked Systems Design and
Implementation
? https://www.usenix.org/conference/nsdi17
? MARCH 27–29, 2017, BOSTON, MA
? 投稿数254本、採択46本、シングルセッション、キーノートなし。
? 主催者から発表された今年のNSDI論文で使われたキーワード
? Security、Data Center、Distributed Systems、Big Data
? Best Paper Award
? mOS: A Reusable Network stack for Flow Monitoring Middleboxes
(KAIST)
? Community Award
? Transparently Compress Hundreds of Petabytes of Image Files for a File-
Storage Service (Stanford)
個人的な感想
? ネットワークがメインでない発表が多くあり、なぜNSDIで発
表するのかと思われるものが幾つかあった。
? セキュリティは全13セッション中、2セッションあり、セキュ
リティの関心の高い。
? 韓国からは4本の論文(KAIST 3本、漢陽大学校1本)が採択され
ており、存在感があった。特にKAISTはコンスタントに論文を
出している。
? SDN: Software Designed Networkに関する発表が多くあった。
? 他の会議では話題となっているzmapなどを使ったInternet全体
を対象にした調査がNSDIでは一つもなかったことが不思議
Efficient Memory Disaggregation with
Infiniswap (University of Michigan)
? この論文に決めた理由
Infiniswap の概要
? Motivation
? Memory Intensiveなアプリが多い。
? データセンターでのメモリ利用の偏り。
? RDMAを活用したDisaggregation Memory
? Challenge
? No application modification, Scalability, Fault-tolerance
? Swapの二重化(RDMA or DISK)
? Control Plane (各マシンのdeamon)とData Plane (RDMA)の分離。
? 4KB物理ページに対して(1GB) slabによる管理。
? decentralized slab placements and evictions.
? power of two random choice.
Motivation 1
? Memory Intensive applicationが多いが、
Motivation 1
? Memory Intensive applicationが多いが、
Motivation 1
? アプリケーションによるMemory Over Estimationによる性能劣化
Motivation 2 Memory Imbalance
? 30%は割り当てて使われない。これを利用できないか?
Disaggregate Memoryのイメージ
関連研究
? nbdではリモートのRAM Disk上に退避するためにCPUオーバー
ヘッドも大きい。
System Overview
? Disk(非同期書き込み)とRDMA(同期書き込み)の併用
? Fault Tolerant の確保
? Control Plane(Daemon)とData Plane(RDMA)の分離
? Daemonが領域管理を行う。
System Overview
System Overview
? コンテナ単位?
厂濒补产构成
厂濒补产构成
送り先の选択
power of two random choices
? decentralized slab placements and evictionsの肝
? Michael Mitzenmacher, The Power of Two Choices in Randomized
Load Balancing, Ph.D Thesis, 2001.
? https://pdfs.semanticscholar.org/3885/812a092ff0aad3d45c0464660075e98d0231.pdf
? Michael Mitzenmacher, Andrea Richa, Ramesh Sitaraman,The Power
of Two Random Choices: A Survey of Techniques and Results, 1996.
? http://www.ic.unicamp.br/~celio/peer2peer/math/mitzenmacher-power-of-two.pdf
? Michael Mitzenmacher, The Power of Two Choices in Randomized
Load Balancing, IEEE Trans. Parallel and Distributed Systems, 2001.
? https://www.eecs.harvard.edu/~michaelm/postscripts/tpds2001.pdf
パラメータ
? SlabSize=1GB
? HeadRoom=8GB
? Free Spaceの下限。これを超えるとSwap outする。
? HotSlab=20
? 一秒間のI/O Request数。不必要なslab Mappingを避ける。
実装
? Linux 3.13.0 のSwapを改良。3,500 LOC。
? Loadable Moduleとして実装。
? ndbX for Mellanox https://github.com/accelio/NBDXを活用。
? Stackdb (Stacking a block device over another block device
https://github.com/OrenKishon/stackbd) を活用
性能评価
? CloudLabのマシンを使う。
? InfiniSwap、通常のSwap(Disk)、nbdX on Mellanoxと比較。
性能评価
性能评価
? Disk
? nbdX
? Infiniswap
Fault Tolerantのテスト
? VoltDB(75% memory)、SLABマシン6台のうち、1台を落とし
た場合の性能劣化。
Discussion
? Application-aware Design
? アプリがremote memoryを認識(頻繁に使うHot Tableと使わないCold
Table)してプログラムしたほうが早い。
? 個人的なコメント:Linuxのmadvise()が使えないか?
? OS-Aware Design
? SwapベースにしているためContext Switchのオーバーヘッドが馬鹿に
ならない。
個人的な疑問
? Remote-memoryを使うより、Memory IntensiveとCPU Intensive
のアプリを混在させるスケジューラを使ったほうが全体的に効率的
では?
? 1GB Slabにある4KB PageがランダムにSwap Inされたら効率的?
? 複数アプリの4KB Pageが1GB Slabに割り当てられるのか?
? この場合、swap inがアプリ毎に変わるが効率的?
Conclusion
? ソースコードは発表時にはComing Soon でしたが、公開されて
います。
? https://github.com/Infiniswap/infiniswap
? 質疑応答
? 質問:Infiniswap はLinuxのSWAPを改良しているが、Huge
Pageは対応できるのか。たしか、LinuxのSWAPでは扱えない
はずだが。
? 回答:現在のInfiniswapでもHuge Pageは扱えない。Future
workだ。
The Design, Implementation, and Deployment of a System to Transparently
Compress Hundreds of Petabytes of Image Files for a File-Storage Service (Dropbox,
Stanford University)
? Community Award Paper。JPEGファイルを保存するのにHuffman Codeから
parallelized arithmetic codeでスキャンし直して保存するファイルシステムの
Leptonの発表。圧縮率もCPU性能もよい。Lepton は2017年2月にDropBoxで
使われるようになっており、ソースコードも公開されている。
? PackJPG, MozJPG, JPEGreenなど類似に研究はあるが、JPEGの特徴を取り直
すためにHuffman Codeから別の圧縮方法でファイルシステムが対応するのは、
既存のフォーマットを残しつつシステム側で対応する新たな研究方向と思われ
る。
? また、Leptonの実装ではセキュリティを確保するのにLinuxのSECCOMを使っ
ている。また、C++のthreadで書かれているが、Deterministicを確保している
など、セキュリチィや再現性にまで言及しており、研究の質の高さを示してい
る。
APUNet: Revitalizing GPU as Packet
Processing Accelerator (KAIST)
? パケット処理にGPUを使う研究(G-Opt[NSDI15])ではメモリコ
ピーの負荷がある。CPUと同じダイにあるIntegrated
GPU(AMD Accelerated Processing Unit)を使うことでアドレ
ス空間を共有し、効率的に処理するAPUNetの提案である。
APUNetはNetwork IDSにもAho-Corasickパターンマッチの高
速化に使えるとのことであった。
? GPUは普及するハードウェアであるが、メモリのコピーの課題
をAMDのAPUを使ってパケット処理と言うターゲットを絞って
活用するのは目の付け所がよい。
One Key to Sign Them All Considered
Vulnerable: Evaluation of DNSSEC in the
Internet (Fraunhofer)
? 現在使われている210万個のDNSSECの鍵の脆弱性調査の発表。
190万個がRSA keyであり、このうち66%が1024bit以下。また、
共通のモジュラスや素数も見つかっている。
? モジュラスが共通だとCommon Modulus Attackが可能となる。
? この発表がインターネット全体を調査した唯一のものであった。
他の一流会議では2,3本あるのに対して、ネットワークが主眼な
会議にしては少ない。
Enhancing Security and Privacy of Tor's
Ecosystem by Using Trusted Execution
Environments (KAIST)
? Torではリレーノードが改ざんされてプライバシーが守れなく
なる脆弱性がある。Intel SGXを使い、TEE: Trusted Execution
Environmentによる安全なリレーノード検出し、それらのみを
使うSGX-Torの提案。Remote Attestationで検証し、承認され
たRelayのみを使う。SGX-Tor の実装ではEnclave中にSSL
Library(OpenSSL), zlib, libevnetが含まれる。
? 性能劣化は11.9%。
? SGX-Torのソースコード
? https://github.com/KAIST-INA/SGX-Tor
Opaque: An Oblivious and Encrypted
Distributed Analytics Platform, (UCB)
? SQLの処理に Hardware enclave(Intel SGX, AMD memory
encryption)を使ってもAccess pattern leakageがある。アクセ
スパターンを隠すoblivious relational operatorsを加えたSpark
SQLのOpaqueの提案である。
? OpaqueのHP。ソースコードあり
? https://github.com/ucbrise/opaque
Bringing IoT to Sports Analytics, (University
of Illinois at Urbana–Champaign)
? 現在のスポーツ解説はハイスピードカメラを使って軌跡を追う
ことができるが、機材が高い。この問題を解決するために、ク
リケットのボールの中に加速度計、ジャイロ、磁力計、WiFiを
入れて軌跡を追うiballの発表。位置検出は複数のWiFiインフラ
を使う。
? 位置検出にGPSではなく、WiFiによるものが興味深い。また、
フリーフォールでは加速度計は0になるので活用できなくなる
問題あり。
Clipper: A Low-Latency Online Prediction
Serving System (USB)
? 現在のMachine LearningはGoogle TensorFlowのように専用の
ハードウェアを使って性能向上を図っているが、このような専
用化は変更が難しい。汎用にする技術ためにLayered
Architectureを採用したClipperの提案。Spark, Tensor Flow,
Caffeのエンジンが抽象化されるModel Abstraction Layer とそ
れを活用するアプリを抽象化したModel selection layerで構成
される。Model Abstraction Layerは複数のエンジンを配下に置
くことができる。
? Clipperのソースは一か月後に公開されるそうだ。現在公開済み。
? https://github.com/ucbrise/clipper
Gaia: Geo-Distributed Machine Learning
Approaching LAN Speeds (CMU, ETH)
? 世界中に散らばったデータセンタをMachine Learningで使える
ようにするGeo-distributed ML systemのGaiaの提案。
Parameter serverで各データセンタを調整する。レイテンシを
隠すためにデータ転送、同期などの工夫し、LANに近い性能を
達成。
Ad

Recommended

DCK Server プロトタイプ
DCK Server プロトタイプ
Etsuji Nakai
?
クラウドアプリケーションの マルチプロセス?プログラミングモデル を実現する「Data Center Kernel」
クラウドアプリケーションの マルチプロセス?プログラミングモデル を実現する「Data Center Kernel」
Etsuji Nakai
?
GMOインターネットにおけるOpenStack Swiftのサービス化とその利用事例のご紹介 - OpenStack最新情報セミナー 2015年2月
GMOインターネットにおけるOpenStack Swiftのサービス化とその利用事例のご紹介 - OpenStack最新情報セミナー 2015年2月
VirtualTech Japan Inc.
?
Try andstudy cloud_20111108_tokyo
Try andstudy cloud_20111108_tokyo
Etsuji Nakai
?
ミドクラ様講演 OpenStack最新情報セミナー 2014年4月
ミドクラ様講演 OpenStack最新情報セミナー 2014年4月
VirtualTech Japan Inc.
?
openstack_neutron-ovs_osc2014tf_20141019
openstack_neutron-ovs_osc2014tf_20141019
Takehiro Kudou
?
サイバーエージェント様 導入事例:OpenStack Fast Track – 若葉マークStackerのStacker教習所 - OpenStack最新...
サイバーエージェント様 導入事例:OpenStack Fast Track – 若葉マークStackerのStacker教習所 - OpenStack最新...
VirtualTech Japan Inc.
?
自律连合型基盘システムの构筑
自律连合型基盘システムの构筑
Kazuhiko Kato
?
IaaSクラウドを支える基礎技術 v1_0
IaaSクラウドを支える基礎技術 v1_0
Etsuji Nakai
?
OpenStackをコマンドで攻める! 構築?運用とトラブル解決 - OpenStack最新情報セミナー 2014年6月
OpenStackをコマンドで攻める! 構築?運用とトラブル解決 - OpenStack最新情報セミナー 2014年6月
VirtualTech Japan Inc.
?
5分で分かるBig Switch Networks
5分で分かるBig Switch Networks
Big Switch Networks Japan
?
Neutron Icehouse Update (Japanese)
Neutron Icehouse Update (Japanese)
Akihiro Motoki
?
IaaSクラウドを支える基礎技術 演習編_v1_0
IaaSクラウドを支える基礎技術 演習編_v1_0
Etsuji Nakai
?
【ネットワーク仮想化 事例セミナー 2017/2/28】ネットワンシステムズが目指すネットワーク仮想化によるセルフサービスITの実現
【ネットワーク仮想化 事例セミナー 2017/2/28】ネットワンシステムズが目指すネットワーク仮想化によるセルフサービスITの実現
Juniper Networks (日本)
?
翱厂厂コミッタの生活とその必要性
翱厂厂コミッタの生活とその必要性
Hirofumi Ichihara
?
今さら聞けない人のためのDocker超入門 - KOF
今さら聞けない人のためのDocker超入門 - KOF
VirtualTech Japan Inc.
?
ネットワーク仮想化ソフトウェア惭颈诲辞狈别迟 ユースケースとユーサ?メリット
ネットワーク仮想化ソフトウェア惭颈诲辞狈别迟 ユースケースとユーサ?メリット
Midokura
?
翱辫别苍厂迟补肠办クラウド基盘构筑ハンズオンセミナー 第2日:讲义狈辞2
翱辫别苍厂迟补肠办クラウド基盘构筑ハンズオンセミナー 第2日:讲义狈辞2
Etsuji Nakai
?
ディペンダブルなクラウドコンピューティング基盘を目指して
ディペンダブルなクラウドコンピューティング基盘を目指して
Kazuhiko Kato
?
OpenShift v3 Technical Introduction
OpenShift v3 Technical Introduction
Etsuji Nakai
?
入門!Software Defined Network
入門!Software Defined Network
Etsuji Nakai
?
翱辫别苍厂迟补肠办と顿辞肠办别谤の未来像
翱辫别苍厂迟补肠办と顿辞肠办别谤の未来像
Etsuji Nakai
?
自宅スケーラブル?ファイルシステムのご绍介
自宅スケーラブル?ファイルシステムのご绍介
Kentaro Mitsuyasu
?
顿辫诲办环境の话
顿辫诲办环境の话
Masaru Oki
?
KubernetesのRBACを掘り下げてみる(Kubernetes Novice Tokyo #17 発表資料)
KubernetesのRBACを掘り下げてみる(Kubernetes Novice Tokyo #17 発表資料)
NTT DATA Technology & Innovation
?
限界性能試験を自動化するOperatorを作ってみた(Kubernetes Novice Tokyo #14 発表資料)
限界性能試験を自動化するOperatorを作ってみた(Kubernetes Novice Tokyo #14 発表資料)
NTT DATA Technology & Innovation
?
コンテナを突き破れ!! ~コンテナセキュリティ入門基礎の基礎~(Kubernetes Novice Tokyo #11 発表資料)
コンテナを突き破れ!! ~コンテナセキュリティ入門基礎の基礎~(Kubernetes Novice Tokyo #11 発表資料)
NTT DATA Technology & Innovation
?
OSSラボ様講演 OpenStack最新情報セミナー 2014年6月
OSSラボ様講演 OpenStack最新情報セミナー 2014年6月
VirtualTech Japan Inc.
?
データベース屋がHyperledger Fabricを検証してみた
データベース屋がHyperledger Fabricを検証してみた
LFDT Tokyo Meetup
?
厂补补厂/クラウドコンピューティングでのオープンソース活用とセキュリティ
厂补补厂/クラウドコンピューティングでのオープンソース活用とセキュリティ
Kuniyasu Suzaki
?

More Related Content

What's hot (20)

IaaSクラウドを支える基礎技術 v1_0
IaaSクラウドを支える基礎技術 v1_0
Etsuji Nakai
?
OpenStackをコマンドで攻める! 構築?運用とトラブル解決 - OpenStack最新情報セミナー 2014年6月
OpenStackをコマンドで攻める! 構築?運用とトラブル解決 - OpenStack最新情報セミナー 2014年6月
VirtualTech Japan Inc.
?
5分で分かるBig Switch Networks
5分で分かるBig Switch Networks
Big Switch Networks Japan
?
Neutron Icehouse Update (Japanese)
Neutron Icehouse Update (Japanese)
Akihiro Motoki
?
IaaSクラウドを支える基礎技術 演習編_v1_0
IaaSクラウドを支える基礎技術 演習編_v1_0
Etsuji Nakai
?
【ネットワーク仮想化 事例セミナー 2017/2/28】ネットワンシステムズが目指すネットワーク仮想化によるセルフサービスITの実現
【ネットワーク仮想化 事例セミナー 2017/2/28】ネットワンシステムズが目指すネットワーク仮想化によるセルフサービスITの実現
Juniper Networks (日本)
?
翱厂厂コミッタの生活とその必要性
翱厂厂コミッタの生活とその必要性
Hirofumi Ichihara
?
今さら聞けない人のためのDocker超入門 - KOF
今さら聞けない人のためのDocker超入門 - KOF
VirtualTech Japan Inc.
?
ネットワーク仮想化ソフトウェア惭颈诲辞狈别迟 ユースケースとユーサ?メリット
ネットワーク仮想化ソフトウェア惭颈诲辞狈别迟 ユースケースとユーサ?メリット
Midokura
?
翱辫别苍厂迟补肠办クラウド基盘构筑ハンズオンセミナー 第2日:讲义狈辞2
翱辫别苍厂迟补肠办クラウド基盘构筑ハンズオンセミナー 第2日:讲义狈辞2
Etsuji Nakai
?
ディペンダブルなクラウドコンピューティング基盘を目指して
ディペンダブルなクラウドコンピューティング基盘を目指して
Kazuhiko Kato
?
OpenShift v3 Technical Introduction
OpenShift v3 Technical Introduction
Etsuji Nakai
?
入門!Software Defined Network
入門!Software Defined Network
Etsuji Nakai
?
翱辫别苍厂迟补肠办と顿辞肠办别谤の未来像
翱辫别苍厂迟补肠办と顿辞肠办别谤の未来像
Etsuji Nakai
?
自宅スケーラブル?ファイルシステムのご绍介
自宅スケーラブル?ファイルシステムのご绍介
Kentaro Mitsuyasu
?
顿辫诲办环境の话
顿辫诲办环境の话
Masaru Oki
?
KubernetesのRBACを掘り下げてみる(Kubernetes Novice Tokyo #17 発表資料)
KubernetesのRBACを掘り下げてみる(Kubernetes Novice Tokyo #17 発表資料)
NTT DATA Technology & Innovation
?
限界性能試験を自動化するOperatorを作ってみた(Kubernetes Novice Tokyo #14 発表資料)
限界性能試験を自動化するOperatorを作ってみた(Kubernetes Novice Tokyo #14 発表資料)
NTT DATA Technology & Innovation
?
コンテナを突き破れ!! ~コンテナセキュリティ入門基礎の基礎~(Kubernetes Novice Tokyo #11 発表資料)
コンテナを突き破れ!! ~コンテナセキュリティ入門基礎の基礎~(Kubernetes Novice Tokyo #11 発表資料)
NTT DATA Technology & Innovation
?
OSSラボ様講演 OpenStack最新情報セミナー 2014年6月
OSSラボ様講演 OpenStack最新情報セミナー 2014年6月
VirtualTech Japan Inc.
?
IaaSクラウドを支える基礎技術 v1_0
IaaSクラウドを支える基礎技術 v1_0
Etsuji Nakai
?
OpenStackをコマンドで攻める! 構築?運用とトラブル解決 - OpenStack最新情報セミナー 2014年6月
OpenStackをコマンドで攻める! 構築?運用とトラブル解決 - OpenStack最新情報セミナー 2014年6月
VirtualTech Japan Inc.
?
Neutron Icehouse Update (Japanese)
Neutron Icehouse Update (Japanese)
Akihiro Motoki
?
IaaSクラウドを支える基礎技術 演習編_v1_0
IaaSクラウドを支える基礎技術 演習編_v1_0
Etsuji Nakai
?
【ネットワーク仮想化 事例セミナー 2017/2/28】ネットワンシステムズが目指すネットワーク仮想化によるセルフサービスITの実現
【ネットワーク仮想化 事例セミナー 2017/2/28】ネットワンシステムズが目指すネットワーク仮想化によるセルフサービスITの実現
Juniper Networks (日本)
?
翱厂厂コミッタの生活とその必要性
翱厂厂コミッタの生活とその必要性
Hirofumi Ichihara
?
今さら聞けない人のためのDocker超入門 - KOF
今さら聞けない人のためのDocker超入門 - KOF
VirtualTech Japan Inc.
?
ネットワーク仮想化ソフトウェア惭颈诲辞狈别迟 ユースケースとユーサ?メリット
ネットワーク仮想化ソフトウェア惭颈诲辞狈别迟 ユースケースとユーサ?メリット
Midokura
?
翱辫别苍厂迟补肠办クラウド基盘构筑ハンズオンセミナー 第2日:讲义狈辞2
翱辫别苍厂迟补肠办クラウド基盘构筑ハンズオンセミナー 第2日:讲义狈辞2
Etsuji Nakai
?
ディペンダブルなクラウドコンピューティング基盘を目指して
ディペンダブルなクラウドコンピューティング基盘を目指して
Kazuhiko Kato
?
OpenShift v3 Technical Introduction
OpenShift v3 Technical Introduction
Etsuji Nakai
?
入門!Software Defined Network
入門!Software Defined Network
Etsuji Nakai
?
翱辫别苍厂迟补肠办と顿辞肠办别谤の未来像
翱辫别苍厂迟补肠办と顿辞肠办别谤の未来像
Etsuji Nakai
?
自宅スケーラブル?ファイルシステムのご绍介
自宅スケーラブル?ファイルシステムのご绍介
Kentaro Mitsuyasu
?
顿辫诲办环境の话
顿辫诲办环境の话
Masaru Oki
?
KubernetesのRBACを掘り下げてみる(Kubernetes Novice Tokyo #17 発表資料)
KubernetesのRBACを掘り下げてみる(Kubernetes Novice Tokyo #17 発表資料)
NTT DATA Technology & Innovation
?
限界性能試験を自動化するOperatorを作ってみた(Kubernetes Novice Tokyo #14 発表資料)
限界性能試験を自動化するOperatorを作ってみた(Kubernetes Novice Tokyo #14 発表資料)
NTT DATA Technology & Innovation
?
コンテナを突き破れ!! ~コンテナセキュリティ入門基礎の基礎~(Kubernetes Novice Tokyo #11 発表資料)
コンテナを突き破れ!! ~コンテナセキュリティ入門基礎の基礎~(Kubernetes Novice Tokyo #11 発表資料)
NTT DATA Technology & Innovation
?
OSSラボ様講演 OpenStack最新情報セミナー 2014年6月
OSSラボ様講演 OpenStack最新情報セミナー 2014年6月
VirtualTech Japan Inc.
?

Similar to USENIX NSDI17 Memory Disaggregation (20)

データベース屋がHyperledger Fabricを検証してみた
データベース屋がHyperledger Fabricを検証してみた
LFDT Tokyo Meetup
?
厂补补厂/クラウドコンピューティングでのオープンソース活用とセキュリティ
厂补补厂/クラウドコンピューティングでのオープンソース活用とセキュリティ
Kuniyasu Suzaki
?
Cassandra Summit 2016 注目セッション報告
Cassandra Summit 2016 注目セッション報告
驰补丑辞辞!デベロッパーネットワーク
?
X pages day発表_20141118 final
X pages day発表_20141118 final
Fumiko Yamamoto
?
Dbtechshowcasesapporo mysql-turing-for-cloud-0.9.3
Dbtechshowcasesapporo mysql-turing-for-cloud-0.9.3
infinite_loop
?
OSC2012 Nagoya - OpenStack - Storage System; Overview
OSC2012 Nagoya - OpenStack - Storage System; Overview
irix_jp
?
翱辫别苍厂迟补肠办概要
翱辫别苍厂迟补肠办概要
Akira Yoshiyama
?
第24回「IBM STGエバンジェリスト座談会 2013年のインフラエンジニアの生き方」(2013/01/17 on しすなま!)
第24回「IBM STGエバンジェリスト座談会 2013年のインフラエンジニアの生き方」(2013/01/17 on しすなま!)
System x 部 (生!) : しすなま! @ Lenovo Enterprise Solutions Ltd.
?
础奥厂の狈辞厂蚕尝入门
础奥厂の狈辞厂蚕尝入门
Akihiro Kuwano
?
叠颈辞顿别惫翱辫蝉による再现性のあるバイオインフォマティクス环境の构筑
叠颈辞顿别惫翱辫蝉による再现性のあるバイオインフォマティクス环境の构筑
Itoshi Nikaido
?
OSC 2012 Microsoft Session [マイクロソフトの魅せるセンサー×クラウド技術]
OSC 2012 Microsoft Session [マイクロソフトの魅せるセンサー×クラウド技術]
Aya Tokura
?
クラウドの利活用
クラウドの利活用
Naoto MATSUMOTO
?
闯别濒濒测叠别补苍のソースをとりあえず眺めてみた(手抜き)
闯别濒濒测叠别补苍のソースをとりあえず眺めてみた(手抜き)
l_b__
?
CloudStack Overview(OSC2012Kansai@Kyoto)
CloudStack Overview(OSC2012Kansai@Kyoto)
Satoshi Shimazaki
?
私と翱厂厂の25年
私と翱厂厂の25年
MITSUNARI Shigeo
?
AWS re:Invent2017で見た AWSの強さとは
AWS re:Invent2017で見た AWSの強さとは
NTT Communications Technology Development
?
Azure Antenna AI 概要
Azure Antenna AI 概要
Miho Yamamoto
?
翱厂厂とクラウドによるコンピューティングモデルの変化
翱厂厂とクラウドによるコンピューティングモデルの変化
Nobuyori Takahashi
?
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
griddb
?
Guide to Cassandra for Production Deployments
Guide to Cassandra for Production Deployments
smdkk
?
データベース屋がHyperledger Fabricを検証してみた
データベース屋がHyperledger Fabricを検証してみた
LFDT Tokyo Meetup
?
厂补补厂/クラウドコンピューティングでのオープンソース活用とセキュリティ
厂补补厂/クラウドコンピューティングでのオープンソース活用とセキュリティ
Kuniyasu Suzaki
?
X pages day発表_20141118 final
X pages day発表_20141118 final
Fumiko Yamamoto
?
Dbtechshowcasesapporo mysql-turing-for-cloud-0.9.3
Dbtechshowcasesapporo mysql-turing-for-cloud-0.9.3
infinite_loop
?
OSC2012 Nagoya - OpenStack - Storage System; Overview
OSC2012 Nagoya - OpenStack - Storage System; Overview
irix_jp
?
翱辫别苍厂迟补肠办概要
翱辫别苍厂迟补肠办概要
Akira Yoshiyama
?
础奥厂の狈辞厂蚕尝入门
础奥厂の狈辞厂蚕尝入门
Akihiro Kuwano
?
叠颈辞顿别惫翱辫蝉による再现性のあるバイオインフォマティクス环境の构筑
叠颈辞顿别惫翱辫蝉による再现性のあるバイオインフォマティクス环境の构筑
Itoshi Nikaido
?
OSC 2012 Microsoft Session [マイクロソフトの魅せるセンサー×クラウド技術]
OSC 2012 Microsoft Session [マイクロソフトの魅せるセンサー×クラウド技術]
Aya Tokura
?
闯别濒濒测叠别补苍のソースをとりあえず眺めてみた(手抜き)
闯别濒濒测叠别补苍のソースをとりあえず眺めてみた(手抜き)
l_b__
?
CloudStack Overview(OSC2012Kansai@Kyoto)
CloudStack Overview(OSC2012Kansai@Kyoto)
Satoshi Shimazaki
?
Azure Antenna AI 概要
Azure Antenna AI 概要
Miho Yamamoto
?
翱厂厂とクラウドによるコンピューティングモデルの変化
翱厂厂とクラウドによるコンピューティングモデルの変化
Nobuyori Takahashi
?
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
griddb
?
Guide to Cassandra for Production Deployments
Guide to Cassandra for Production Deployments
smdkk
?
Ad

More from Kuniyasu Suzaki (20)

RISC-Vのセキュリティ技術(TEE, Root of Trust, Remote Attestation)
RISC-Vのセキュリティ技術(TEE, Root of Trust, Remote Attestation)
Kuniyasu Suzaki
?
遠隔デバイスとの信頼を築くための技術とその標準(TEEP RATS)
遠隔デバイスとの信頼を築くための技術とその標準(TEEP RATS)
Kuniyasu Suzaki
?
IETF111 RATS: Remote Attestation ProcedureS 報告
IETF111 RATS: Remote Attestation ProcedureS 報告
Kuniyasu Suzaki
?
狠狠撸 presented at FIT 2021 Top Conference (Reboot Oriented IoT, ACSAC2021)
狠狠撸 presented at FIT 2021 Top Conference (Reboot Oriented IoT, ACSAC2021)
Kuniyasu Suzaki
?
ACSAC2020 "Return-Oriented IoT" by Kuniyasu Suzaki
ACSAC2020 "Return-Oriented IoT" by Kuniyasu Suzaki
Kuniyasu Suzaki
?
TEE (Trusted Execution Environment)は第二の仮想化技術になるか?
TEE (Trusted Execution Environment)は第二の仮想化技術になるか?
Kuniyasu Suzaki
?
3種類のTEE比較(Intel SGX, ARM TrustZone, RISC-V Keystone)
3種類のTEE比較(Intel SGX, ARM TrustZone, RISC-V Keystone)
Kuniyasu Suzaki
?
Hardware-assisted Isolated Execution Environment to run trusted OS and applic...
Hardware-assisted Isolated Execution Environment to run trusted OS and applic...
Kuniyasu Suzaki
?
RISC-V-Day-Tokyo2018-suzaki
RISC-V-Day-Tokyo2018-suzaki
Kuniyasu Suzaki
?
BMC: Bare Metal Container @Open Source Summit Japan 2017
BMC: Bare Metal Container @Open Source Summit Japan 2017
Kuniyasu Suzaki
?
Io t security-suzki-20170224
Io t security-suzki-20170224
Kuniyasu Suzaki
?
”Bare-Metal Container" presented at HPCC2016
”Bare-Metal Container" presented at HPCC2016
Kuniyasu Suzaki
?
Kernel Memory Protection by an Insertable Hypervisor which has VM Introspec...
Kernel Memory Protection by an Insertable Hypervisor which has VM Introspec...
Kuniyasu Suzaki
?
Report for S4x14 (SCADA Security Scientific Symposium 2014)
Report for S4x14 (SCADA Security Scientific Symposium 2014)
Kuniyasu Suzaki
?
狠狠撸 used at ACM-SAC 2014 by Suzaki
狠狠撸 used at ACM-SAC 2014 by Suzaki
Kuniyasu Suzaki
?
翱厂セキュリティチュートリアル
翱厂セキュリティチュートリアル
Kuniyasu Suzaki
?
Nested Virtual Machines and Proxies
Nested Virtual Machines and Proxies
Kuniyasu Suzaki
?
叠颈迟惫颈蝉辞谤をベースとした既存奥颈苍诲辞飞蝉のドライバメモリ保护
叠颈迟惫颈蝉辞谤をベースとした既存奥颈苍诲辞飞蝉のドライバメモリ保护
Kuniyasu Suzaki
?
Security on cloud storage and IaaS (NSC: Taiwan - JST: Japan workshop)
Security on cloud storage and IaaS (NSC: Taiwan - JST: Japan workshop)
Kuniyasu Suzaki
?
仮想化技术によるマルウェア対策とその问题点
仮想化技术によるマルウェア対策とその问题点
Kuniyasu Suzaki
?
RISC-Vのセキュリティ技術(TEE, Root of Trust, Remote Attestation)
RISC-Vのセキュリティ技術(TEE, Root of Trust, Remote Attestation)
Kuniyasu Suzaki
?
遠隔デバイスとの信頼を築くための技術とその標準(TEEP RATS)
遠隔デバイスとの信頼を築くための技術とその標準(TEEP RATS)
Kuniyasu Suzaki
?
IETF111 RATS: Remote Attestation ProcedureS 報告
IETF111 RATS: Remote Attestation ProcedureS 報告
Kuniyasu Suzaki
?
狠狠撸 presented at FIT 2021 Top Conference (Reboot Oriented IoT, ACSAC2021)
狠狠撸 presented at FIT 2021 Top Conference (Reboot Oriented IoT, ACSAC2021)
Kuniyasu Suzaki
?
ACSAC2020 "Return-Oriented IoT" by Kuniyasu Suzaki
ACSAC2020 "Return-Oriented IoT" by Kuniyasu Suzaki
Kuniyasu Suzaki
?
TEE (Trusted Execution Environment)は第二の仮想化技術になるか?
TEE (Trusted Execution Environment)は第二の仮想化技術になるか?
Kuniyasu Suzaki
?
3種類のTEE比較(Intel SGX, ARM TrustZone, RISC-V Keystone)
3種類のTEE比較(Intel SGX, ARM TrustZone, RISC-V Keystone)
Kuniyasu Suzaki
?
Hardware-assisted Isolated Execution Environment to run trusted OS and applic...
Hardware-assisted Isolated Execution Environment to run trusted OS and applic...
Kuniyasu Suzaki
?
RISC-V-Day-Tokyo2018-suzaki
RISC-V-Day-Tokyo2018-suzaki
Kuniyasu Suzaki
?
BMC: Bare Metal Container @Open Source Summit Japan 2017
BMC: Bare Metal Container @Open Source Summit Japan 2017
Kuniyasu Suzaki
?
Io t security-suzki-20170224
Io t security-suzki-20170224
Kuniyasu Suzaki
?
”Bare-Metal Container" presented at HPCC2016
”Bare-Metal Container" presented at HPCC2016
Kuniyasu Suzaki
?
Kernel Memory Protection by an Insertable Hypervisor which has VM Introspec...
Kernel Memory Protection by an Insertable Hypervisor which has VM Introspec...
Kuniyasu Suzaki
?
Report for S4x14 (SCADA Security Scientific Symposium 2014)
Report for S4x14 (SCADA Security Scientific Symposium 2014)
Kuniyasu Suzaki
?
狠狠撸 used at ACM-SAC 2014 by Suzaki
狠狠撸 used at ACM-SAC 2014 by Suzaki
Kuniyasu Suzaki
?
翱厂セキュリティチュートリアル
翱厂セキュリティチュートリアル
Kuniyasu Suzaki
?
Nested Virtual Machines and Proxies
Nested Virtual Machines and Proxies
Kuniyasu Suzaki
?
叠颈迟惫颈蝉辞谤をベースとした既存奥颈苍诲辞飞蝉のドライバメモリ保护
叠颈迟惫颈蝉辞谤をベースとした既存奥颈苍诲辞飞蝉のドライバメモリ保护
Kuniyasu Suzaki
?
Security on cloud storage and IaaS (NSC: Taiwan - JST: Japan workshop)
Security on cloud storage and IaaS (NSC: Taiwan - JST: Japan workshop)
Kuniyasu Suzaki
?
仮想化技术によるマルウェア対策とその问题点
仮想化技术によるマルウェア対策とその问题点
Kuniyasu Suzaki
?
Ad

Recently uploaded (7)

PGConf.dev 2025 参加レポート (JPUG総会併設セミナー2025 発表資料)
PGConf.dev 2025 参加レポート (JPUG総会併設セミナー2025 発表資料)
NTT DATA Technology & Innovation
?
Vibe Codingを始めよう ?Cursorを例に、ノーコードでのプログラミング体験?
Vibe Codingを始めよう ?Cursorを例に、ノーコードでのプログラミング体験?
iPride Co., Ltd.
?
Forguncy 10 製品概要資料 - ノーコードWebアプリ開発プラットフォーム
Forguncy 10 製品概要資料 - ノーコードWebアプリ開発プラットフォーム
フォーガンシー
?
础滨技术共有会2025-06-05冲顿别别辫搁别蝉别补谤肠丑の理解と実践.辫诲蹿
础滨技术共有会2025-06-05冲顿别别辫搁别蝉别补谤肠丑の理解と実践.辫诲蹿
Takuma Oda
?
Protect Your IoT Data with UbiBot's Private Platform.pptx
Protect Your IoT Data with UbiBot's Private Platform.pptx
ユビボット 株式会社
?
勉強会_ターミナルコマント?入力迅速化_20250620. pptx. .
勉強会_ターミナルコマント?入力迅速化_20250620. pptx. .
iPride Co., Ltd.
?
色について.pptx .
色について.pptx .
iPride Co., Ltd.
?
PGConf.dev 2025 参加レポート (JPUG総会併設セミナー2025 発表資料)
PGConf.dev 2025 参加レポート (JPUG総会併設セミナー2025 発表資料)
NTT DATA Technology & Innovation
?
Vibe Codingを始めよう ?Cursorを例に、ノーコードでのプログラミング体験?
Vibe Codingを始めよう ?Cursorを例に、ノーコードでのプログラミング体験?
iPride Co., Ltd.
?
Forguncy 10 製品概要資料 - ノーコードWebアプリ開発プラットフォーム
Forguncy 10 製品概要資料 - ノーコードWebアプリ開発プラットフォーム
フォーガンシー
?
础滨技术共有会2025-06-05冲顿别别辫搁别蝉别补谤肠丑の理解と実践.辫诲蹿
础滨技术共有会2025-06-05冲顿别别辫搁别蝉别补谤肠丑の理解と実践.辫诲蹿
Takuma Oda
?
Protect Your IoT Data with UbiBot's Private Platform.pptx
Protect Your IoT Data with UbiBot's Private Platform.pptx
ユビボット 株式会社
?
勉強会_ターミナルコマント?入力迅速化_20250620. pptx. .
勉強会_ターミナルコマント?入力迅速化_20250620. pptx. .
iPride Co., Ltd.
?

USENIX NSDI17 Memory Disaggregation

  • 1. USENIX NDSI 2017報告 & Efficient Memory Disaggregation with Infiniswap (University of Michigan) 須崎有康 独立行政法人 産業技術総合研究所 第2回 システム系輪講会
  • 2. NSDI2017概要 ? 14th USENIX Symposium on Networked Systems Design and Implementation ? https://www.usenix.org/conference/nsdi17 ? MARCH 27–29, 2017, BOSTON, MA ? 投稿数254本、採択46本、シングルセッション、キーノートなし。 ? 主催者から発表された今年のNSDI論文で使われたキーワード ? Security、Data Center、Distributed Systems、Big Data ? Best Paper Award ? mOS: A Reusable Network stack for Flow Monitoring Middleboxes (KAIST) ? Community Award ? Transparently Compress Hundreds of Petabytes of Image Files for a File- Storage Service (Stanford)
  • 3. 個人的な感想 ? ネットワークがメインでない発表が多くあり、なぜNSDIで発 表するのかと思われるものが幾つかあった。 ? セキュリティは全13セッション中、2セッションあり、セキュ リティの関心の高い。 ? 韓国からは4本の論文(KAIST 3本、漢陽大学校1本)が採択され ており、存在感があった。特にKAISTはコンスタントに論文を 出している。 ? SDN: Software Designed Networkに関する発表が多くあった。 ? 他の会議では話題となっているzmapなどを使ったInternet全体 を対象にした調査がNSDIでは一つもなかったことが不思議
  • 4. Efficient Memory Disaggregation with Infiniswap (University of Michigan) ? この論文に決めた理由
  • 5. Infiniswap の概要 ? Motivation ? Memory Intensiveなアプリが多い。 ? データセンターでのメモリ利用の偏り。 ? RDMAを活用したDisaggregation Memory ? Challenge ? No application modification, Scalability, Fault-tolerance ? Swapの二重化(RDMA or DISK) ? Control Plane (各マシンのdeamon)とData Plane (RDMA)の分離。 ? 4KB物理ページに対して(1GB) slabによる管理。 ? decentralized slab placements and evictions. ? power of two random choice.
  • 6. Motivation 1 ? Memory Intensive applicationが多いが、
  • 7. Motivation 1 ? Memory Intensive applicationが多いが、
  • 8. Motivation 1 ? アプリケーションによるMemory Over Estimationによる性能劣化
  • 9. Motivation 2 Memory Imbalance ? 30%は割り当てて使われない。これを利用できないか?
  • 12. System Overview ? Disk(非同期書き込み)とRDMA(同期書き込み)の併用 ? Fault Tolerant の確保 ? Control Plane(Daemon)とData Plane(RDMA)の分離 ? Daemonが領域管理を行う。
  • 18. power of two random choices ? decentralized slab placements and evictionsの肝 ? Michael Mitzenmacher, The Power of Two Choices in Randomized Load Balancing, Ph.D Thesis, 2001. ? https://pdfs.semanticscholar.org/3885/812a092ff0aad3d45c0464660075e98d0231.pdf ? Michael Mitzenmacher, Andrea Richa, Ramesh Sitaraman,The Power of Two Random Choices: A Survey of Techniques and Results, 1996. ? http://www.ic.unicamp.br/~celio/peer2peer/math/mitzenmacher-power-of-two.pdf ? Michael Mitzenmacher, The Power of Two Choices in Randomized Load Balancing, IEEE Trans. Parallel and Distributed Systems, 2001. ? https://www.eecs.harvard.edu/~michaelm/postscripts/tpds2001.pdf
  • 19. パラメータ ? SlabSize=1GB ? HeadRoom=8GB ? Free Spaceの下限。これを超えるとSwap outする。 ? HotSlab=20 ? 一秒間のI/O Request数。不必要なslab Mappingを避ける。
  • 20. 実装 ? Linux 3.13.0 のSwapを改良。3,500 LOC。 ? Loadable Moduleとして実装。 ? ndbX for Mellanox https://github.com/accelio/NBDXを活用。 ? Stackdb (Stacking a block device over another block device https://github.com/OrenKishon/stackbd) を活用
  • 24. Fault Tolerantのテスト ? VoltDB(75% memory)、SLABマシン6台のうち、1台を落とし た場合の性能劣化。
  • 25. Discussion ? Application-aware Design ? アプリがremote memoryを認識(頻繁に使うHot Tableと使わないCold Table)してプログラムしたほうが早い。 ? 個人的なコメント:Linuxのmadvise()が使えないか? ? OS-Aware Design ? SwapベースにしているためContext Switchのオーバーヘッドが馬鹿に ならない。
  • 26. 個人的な疑問 ? Remote-memoryを使うより、Memory IntensiveとCPU Intensive のアプリを混在させるスケジューラを使ったほうが全体的に効率的 では? ? 1GB Slabにある4KB PageがランダムにSwap Inされたら効率的? ? 複数アプリの4KB Pageが1GB Slabに割り当てられるのか? ? この場合、swap inがアプリ毎に変わるが効率的?
  • 27. Conclusion ? ソースコードは発表時にはComing Soon でしたが、公開されて います。 ? https://github.com/Infiniswap/infiniswap ? 質疑応答 ? 質問:Infiniswap はLinuxのSWAPを改良しているが、Huge Pageは対応できるのか。たしか、LinuxのSWAPでは扱えない はずだが。 ? 回答:現在のInfiniswapでもHuge Pageは扱えない。Future workだ。
  • 28. The Design, Implementation, and Deployment of a System to Transparently Compress Hundreds of Petabytes of Image Files for a File-Storage Service (Dropbox, Stanford University) ? Community Award Paper。JPEGファイルを保存するのにHuffman Codeから parallelized arithmetic codeでスキャンし直して保存するファイルシステムの Leptonの発表。圧縮率もCPU性能もよい。Lepton は2017年2月にDropBoxで 使われるようになっており、ソースコードも公開されている。 ? PackJPG, MozJPG, JPEGreenなど類似に研究はあるが、JPEGの特徴を取り直 すためにHuffman Codeから別の圧縮方法でファイルシステムが対応するのは、 既存のフォーマットを残しつつシステム側で対応する新たな研究方向と思われ る。 ? また、Leptonの実装ではセキュリティを確保するのにLinuxのSECCOMを使っ ている。また、C++のthreadで書かれているが、Deterministicを確保している など、セキュリチィや再現性にまで言及しており、研究の質の高さを示してい る。
  • 29. APUNet: Revitalizing GPU as Packet Processing Accelerator (KAIST) ? パケット処理にGPUを使う研究(G-Opt[NSDI15])ではメモリコ ピーの負荷がある。CPUと同じダイにあるIntegrated GPU(AMD Accelerated Processing Unit)を使うことでアドレ ス空間を共有し、効率的に処理するAPUNetの提案である。 APUNetはNetwork IDSにもAho-Corasickパターンマッチの高 速化に使えるとのことであった。 ? GPUは普及するハードウェアであるが、メモリのコピーの課題 をAMDのAPUを使ってパケット処理と言うターゲットを絞って 活用するのは目の付け所がよい。
  • 30. One Key to Sign Them All Considered Vulnerable: Evaluation of DNSSEC in the Internet (Fraunhofer) ? 現在使われている210万個のDNSSECの鍵の脆弱性調査の発表。 190万個がRSA keyであり、このうち66%が1024bit以下。また、 共通のモジュラスや素数も見つかっている。 ? モジュラスが共通だとCommon Modulus Attackが可能となる。 ? この発表がインターネット全体を調査した唯一のものであった。 他の一流会議では2,3本あるのに対して、ネットワークが主眼な 会議にしては少ない。
  • 31. Enhancing Security and Privacy of Tor's Ecosystem by Using Trusted Execution Environments (KAIST) ? Torではリレーノードが改ざんされてプライバシーが守れなく なる脆弱性がある。Intel SGXを使い、TEE: Trusted Execution Environmentによる安全なリレーノード検出し、それらのみを 使うSGX-Torの提案。Remote Attestationで検証し、承認され たRelayのみを使う。SGX-Tor の実装ではEnclave中にSSL Library(OpenSSL), zlib, libevnetが含まれる。 ? 性能劣化は11.9%。 ? SGX-Torのソースコード ? https://github.com/KAIST-INA/SGX-Tor
  • 32. Opaque: An Oblivious and Encrypted Distributed Analytics Platform, (UCB) ? SQLの処理に Hardware enclave(Intel SGX, AMD memory encryption)を使ってもAccess pattern leakageがある。アクセ スパターンを隠すoblivious relational operatorsを加えたSpark SQLのOpaqueの提案である。 ? OpaqueのHP。ソースコードあり ? https://github.com/ucbrise/opaque
  • 33. Bringing IoT to Sports Analytics, (University of Illinois at Urbana–Champaign) ? 現在のスポーツ解説はハイスピードカメラを使って軌跡を追う ことができるが、機材が高い。この問題を解決するために、ク リケットのボールの中に加速度計、ジャイロ、磁力計、WiFiを 入れて軌跡を追うiballの発表。位置検出は複数のWiFiインフラ を使う。 ? 位置検出にGPSではなく、WiFiによるものが興味深い。また、 フリーフォールでは加速度計は0になるので活用できなくなる 問題あり。
  • 34. Clipper: A Low-Latency Online Prediction Serving System (USB) ? 現在のMachine LearningはGoogle TensorFlowのように専用の ハードウェアを使って性能向上を図っているが、このような専 用化は変更が難しい。汎用にする技術ためにLayered Architectureを採用したClipperの提案。Spark, Tensor Flow, Caffeのエンジンが抽象化されるModel Abstraction Layer とそ れを活用するアプリを抽象化したModel selection layerで構成 される。Model Abstraction Layerは複数のエンジンを配下に置 くことができる。 ? Clipperのソースは一か月後に公開されるそうだ。現在公開済み。 ? https://github.com/ucbrise/clipper
  • 35. Gaia: Geo-Distributed Machine Learning Approaching LAN Speeds (CMU, ETH) ? 世界中に散らばったデータセンタをMachine Learningで使える ようにするGeo-distributed ML systemのGaiaの提案。 Parameter serverで各データセンタを調整する。レイテンシを 隠すためにデータ転送、同期などの工夫し、LANに近い性能を 達成。