2. 1. Cloud Computing
3つのCloud Computing
3つの仮想化技術
!
2. Infrastructure as Code
ハードウェア?ソフトウェア管理をプログラムする
chef, vagrant
!
3. Bayes Linux: Bioinformatics Analysis
Environment System
BioDevOps.org
RIKEN Cloud System
3. 林崎研@RIKEN GSC
Mouse full-length cDNA sequencing
FANTOM1-2
cDNA microarray, imprinted genes
上田研@RIKEN CDB
ChIP-seq
Single-Cell RNA-seq (Quartz-Seq)
Research
Outreach & Community
Knoppix for Bio
KNOB
KGB
自己紹介
実験生物学の側で研究?オープンソースコミュニティとの関わり
RIKEN ACCC
Single-Cell RNA-Seq
Epigenome
BioDevOp
Bioinformatics-jp
4. バイオインフォマティクス研究開発ユニット
Advanced Center for Computing and Communication
Informatics Biology
1. DNAシーケンサーデータ解析手法?実験手法の開発
2. 理研内外の実験研究者との共同研究?教育
3. 理研のバイオインフォマティクス研究の方向性を議論?ロールモデルになる
xi
θi
G
G0γ
σ-?‐
a b
10#pg#total#RNA
Ampli?ed#cDNA
1細胞RNA-Seq?新規エピゲノム実データ解析と実験技術の開発
7. エバンジェリストモデルによるBioinformatics Infrastructureの整備
多くの研究者を救い、バイオインフォ研究も るモデル
Sequencing Core
Research Team/Unit
Research Team/Unit
Research Team/Unit
Bioinformatics Evangelist
Bioinformatics Research Unit Preventive medicine and applied genomics unit
Bioinformatics Research Group, RIKEN ACCC
Research Center
? ひとりのバイオインフォ研究
者あたり多くて2,3件程度の
共同研究!
? 理研では、解析の専門性にロー
カル性がある (CLSTは転
写、IMSはゲノムなど)!
? センターでバイオインフォを
支える人間を積極的にサポー
トする
9. Providing bioinformatics analysis environment
Virtual machine with NGS Data analysis tools and pipelines
Bioinformatics Research Unit
User
(inside/outside RIKEN)
Browser, tools, Pipelines
Install and setup tools
(BioDevOps)
Development of tools
Browser & Pipelines
SSH, HTTPS
Calc.Result
Browser & Pipeline
Consultation
TutorialUser’s tools
Sequencing Facility
Cloud Computer
sequence data
Sample
10. Introduction of Bioinformatics research activity in RIKEN ACCC
Bioinformatics: 研究とエンジニアリング
? バイオインフォマティクス研究に集中したい
? データ解析環境を構築することは手間がかかる
?計算機の調達や管理、保守の手間がかかる
? NGS解析はたくさんのツールの組み合わせ
? ツールのアップデートが速い
? たくさんのバイオデータベースを使う
? 解析の再現性担保
? 論文のマテメソは記載が不足しており解析が再現できない
14. 1. Cloud Computing
3つのCloud Computing
3つの仮想化技術
!
2. Infrastructure as Code
ハードウェア?ソフトウェア管理をプログラムする
chef, vagrant
!
3. Bayes Linux: Bioinformatics Analysis
Environment System
BioDevOps.org
RIKEN Cloud System
15. Providing bioinformatics analysis environment
Virtual machine with NGS Data analysis tools and pipelines
Bioinformatics Research Unit
Cloud Computer
User
(inside/outside RIKEN)
BioDevOps
Install and setup tools
Development of tools
Browser & Pipelines
SSH, HTTPS
Calc.Result
Browser & Pipeline
Consultation
TutorialUser’s tools
21. 1. Cloud Computing
3つのCloud Computing
3つの仮想化技術
!
2. Infrastructure as Code
ハードウェア?ソフトウェア管理をプログラムする
chef, vagrant
!
3. Bayes Linux: Bioinformatics Analysis
Environment System
BioDevOps.org
RIKEN Cloud System
22. Chef: プログラムを管理するプログラム
3つのツール: chef, knife, Vegrant
http://www.getchef.com/chef/
User
仮想計算機へアクセス
chef cookbookを
実行しプログラムを
自動セットアップ
3. chef cookbookを
配信するサーバー
1. chef cookbookを実装し
コード共有レポジトリで管理
2. chef cookbookを
配信サーバーへ提供
0. vegrantでマシンを管理
23. Chef recipe and Integration Test
Example: Installing NCBI BLAST by chef
debian, Ubuntuの場合は”ncbi-blast+”というパッケージをインストール
CentOSの場合はNCBIからRPMパッケージを取ってきてインストール
24. Chef recipe and Integration Test
Example: Installing NCBI BLAST by chef
blastpを実行できたらテスト成功
30. Bayes Linux on RIKEN Cloud System
Virtual machine with NGS Data analysis tools and pipelines
Bioinformatics Research Unit
User
(inside/outside RIKEN)
Browser, tools, Pipelines
Install and setup tools
(BioDevOps)
Development of tools
Browser & Pipelines
SSH, HTTPS
Calc.Result
Browser & Pipeline
Consultation
TutorialUser’s tools
Sequencing Facility
Cloud Computer
sequence data
Sample
31. ? Cloud system is located at Wako campus
? You can access your virtual machine (Ubuntu 14.04 LTS)
? with root privileges
? via SSH and HTTP
? from only Wako, Yokohama, Kobe and Tsukuba
? We provide
? over 125 tools on Galaxy, 900 R/Bioconductor Packages and 600
command line tools (DebianMed)
? one virtual machine per one research group
? 10 virtual machines at drawing logs
? 8 CPU cores (2GHz), 64 GB RAM and 3 TB strage/VM
? NFS for mouse/human reference genome/transcriptome
Spec. of virtual machine
Bioinformatics Analysis Environment for Your Laboratory Use
35. 1. Cloud Computing
3つのCloud Computing
3つの仮想化技術
!
2. Infrastructure as Code
ハードウェア?ソフトウェア管理をプログラムする
テストと継続的インテグレーション
ソーシャルソースコードレボジトリ
!
3. Bayes Linux: Bioinformatics Analysis Environment
System
BioDevOps.org
RIKEN Cloud System
36. 叠颈辞顿别惫翱辫蝉による再现性のあるバイオインフォマティクス环境の构筑
Itoshi NIKAIDO, PhD <itoshi.nikaido@riken.jp>
Unit Leader, Bioinformatics Research Unit
RIKEN Advanced Center for Computer and Communication
http://bit.accc.riken.jp/
? RIKEN ACCC
? BiT
? Manabu Ishida (DevOps)
? Mika Yoshimura, PhD (Galaxy & pipeline)
? Akihiro Matsushima (Infrastructure)
? Koki Tsuyuzaki, PhD (Pipeline for RNA-Seq)
? Preventive medicine and applied genomics unit
? Wako unit & RIKEN Cloud Team
? Fujitsu SSL
? Yamamoto Go
? RIKEN President's Discretionary Fund