狠狠撸

狠狠撸Share a Scribd company logo
DDBJ と
NIG SuperComputer の
紹介
国立遺伝学研究所 DDBJ センター
中村 保一
DDBJing 講習会
+
次世代モデル生物におけるゲノム情報利用ワークショップ
Dec. 15-16, 2016
第34回 DDBJing 講習会 in 三島 (2016.12.15-16)
DDBJ (http://www.ddbj.nig.ac.jp/)
?全世界で解読された塩基配列情報を
?査定して受入れ
?データベースに蓄積し
?公開して共有する
塩基配列データバンクとはこのような事業
データベース
国際塩基配列データベース (INSDC) の一員
?米国: GenBank (NCBI)
?欧州: ENA (EBI)
?日本: DDBJ
Paper
Paper
Paper
Paper
NGS
reads
assemble mapping
annotation
DDBJ
GenBank
ENA
Trad INSDC
re-annotation
omics paper
DOR
GEO
ArrayExpress
Omics Data Archives
papers
DRA
SRA
ERA
open access
contigs
Paper
genome paper
The ecosystem of sequence data
JGA
dbGAP
EGA
controlled
access
genome
database
公開
NGSデータ
制限公開
NGSデータ
公開
解析済データ
Trad INSDC
DDBJ登録ファイルの例
LOCUS AB091058 2109 bp DNA linear BCT 02-SEP-2003
DEFINITION Gluconacetobacter xylinus cmcase, ccp genes for
endo-beta-1,4-glucanase, cellulose complementing protein, complete
cds.
ACCESSION AB091058
VERSION AB091058.1
KEYWORDS .
SOURCE Gluconacetobacter xylinus
ORGANISM Gluconacetobacter xylinus
Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales;
Acetobacteraceae; Gluconacetobacter.
REFERENCE 1 (bases 1 to 2109)
AUTHORS Kawano,S., Tajima,K., Uemori,Y., Yamashita,H., Erata,T.,
Munekata,M. and Takai,M.
TITLE Direct Submission
JOURNAL Submitted (28-AUG-2002) to the DDBJ/EMBL/GenBank databases.
Contact:Kenji Tajima
Hokkaido University, Graduate School of Engineering; N13W8,
Kita-ku, Sapporo, Hokkaido 060-8628, Japan
REFERENCE 2
AUTHORS Kawano,S., Tajima,K., Uemori,Y., Yamashita,H., Erata,T.,
Munekata,M. and Takai,M.
TITLE Cloning of Cellulose Synthesis Related Genes from Acetobacter
xylinum ATCC23769 and ATCC53582: Comparison of Cellulose Synthetic
Ability Between ATCC23769 and ATCC53582
JOURNAL Unpublished (2002)
COMMENT
FEATURES Location/Qualifiers
source 1..2109
/db_xref="taxon:28448"
/mol_type="genomic DNA"
/note="synonym:Acetobacter xylinum"
/organism="Gluconacetobacter xylinus"
/strain="ATCC 53582"
CDS 10..1038
/codon_start=1
/gene="cmcase"
/product="endo-beta-1,4-glucanase"
/protein_id="BAC82540.1"
/transl_table=11
/translation="MSVMAAMGGAQVLSSTGAFADTAPDAVAQQWAIFRAKYLRPSGR
VVDTGNGGESHSEGQGYGMLFAASAGDLASFQSMWMWARTNLQHTNDKLFSWRFLKGH
QPPVPDKNNATDGDLLIALALGRAGKRFQRPDYIQDAMAIYGDVLNLMTMKAGPYVVL
MPGAVGFTKKDSVILNLSYYVMPSLLQAFDLTADPRWRQVMEDGIRLVSAGRFGQWRL
PPDWLAVNRATGALSIASGWPPRFSYDAIRVPLYFYWAHMLAPNVLADFTRFWNNFGA
NALPGWVDLTTGARSPYNAPPGYLAVAECTGLDSAGELPTLDHAPDYYSAALTLLVYI
ARAEETIK"
CDS 1035..2096
/codon_start=1
/gene="ccp"
/product="cellulose complementing protein"
/protein_id="BAC82541.1"
/transl_table=11
/translation="MSASGSDEVAGGGQAGSPQDFQRVLRSFGVEGGQYSYRPFVDRS
FDVTGVPEAVERHFDQAEHDTAVEEQVTPAPQIAVAPPPPPVVPDPPAIVTETAPPPP
VVVSAPVTYEPPAAAVPAEPPVQEAPVQAAPVPPAPVPPIAEQAPPAAPDPASVPYAN
VAAAPVPPDPAPVTPAPQARVTGPNTRMVEPFSRPQVRTVQEGATPSRVPSRSMNAFP
RTSASSISERPVDRGVADEWSPVPKARLSPRERPRPGDLSFFFQGMRDTRDEKKFFPV
ASTRSVRSNVSRMTSMTKTDTNSSQASRPGSPVASPDGSPTMAEVFMTLGGRATELLS
PRPSLREALLRRRENEEES"
BASE COUNT 343 a 661 c 661 g 444 t
ORIGIN
1 cgttccttta tgtcggtcat ggcggcgatg ggaggggcgc aggtgctttc atccaccggt
61 gcgttcgcag acaccgcccc cgatgcggtc gcgcagcaat gggccatctt ccgcgccaag
121 tatcttcgtc ccagcggacg tgtcgtggat acgggcaatg gtggcgaatc ccatagtgag
181 gggcagggct atggcatgct ctttgccgcg tcggcggggg accttgcgtc gttccagtcg
241 atgtggatgt gggcgcgcac caacctgcag cataccaatg acaagctgtt ttcctggcgg
301 ttcctcaagg ggcatcagcc cccggtgccc gacaagaaca atgccacaga tggcgacctg
361 ctgatcgcgc ttgcgcttgg tcgtgcgggc aagcgtttcc agcgccccga ttacattcag
421 gacgccatgg ccatttatgg cgatgtgctg aacctgatga cgatgaaggc gggaccgtat
481 gtcgtcctca tgcccggtgc tgtcggcttt accaagaagg acagcgtgat cctcaacctg
541 tcctattacg tcatgccctc gctgctgcag gcgttcgacc ttacggccga cccgcgctgg
601 cgtcaggtga tggaagacgg gattcgcctt gtttccgccg gccgtttcgg gcagtggcgc
661 ctgccccccg actggctggc ggtgaatcgc gccaccggtg cgctgtcgat cgcatcggga
721 tggccgccgc gcttttccta tgatgcgatt cgggtgccgc tttattttta ttgggcgcat
781 atgctggcgc cgaacgtgtt ggctgatttc acccgattct ggaataattt cggggctaat
841 gccctgccag gatgggttga tctgacaaca ggggcgcgtt cgccgtacaa cgccccgcct
901 ggatatcttg ctgttgccga atgcacgggg cttgattctg ccggggaact cccgacactg
961 gatcatgcgc ccgattatta ttccgcagcg ttgacgctgc tcgtttacat cgcgcgggcg
1021 gaggagacta taaagtgagt gcttcagggt ctgatgaggt ggctggggga gggcaggctg
1081 gaagtccgca ggattttcag cgggtcctgc gttcttttgg tgtcgaaggt gggcagtatt
1141 cctaccggcc gtttgttgac cgttcctttg atgtgacagg cgtgcccgag gctgttgaaa
1201 ggcacttcga tcaggcggag catgacacgg cggttgagga gcaggtcact cccgcgccac
1261 aaatcgcggt cgcaccgcca ccgccgccag tcgttcctga cccgcccgcc atcgtgacgg
1321 aaaccgcgcc cccgccgcct gtcgtggtca gcgctccggt cacgtatgaa cccccggctg
1381 ccgccgtgcc ggcagagcct cccgttcagg aagcccccgt gcaggcggcg ccggttcccc
1441 ccgcgcctgt gcccccgatt gcggagcagg ctcctcccgc ggcgccggac ccggcatccg
1501 tgccgtatgc gaacgtcgcg gcagcacccg ttccacctga tcccgcaccg gttacgcctg
1561 cgccgcaggc gcgcgtgacg gggccgaaca cccgtatggt ggagcccttt tcccgcccgc
1621 aggtccgcac ggtgcaggag ggggcaaccc cgtcacgtgt accttcgcgt tcaatgaacg
1681 ctttcccccg cacatcagca tcgtccataa gtgagcgtcc ggtggacagg ggtgttgccg
1741 atgaatggag tcctgttccg aaggcacgcc tcagcccgcg ggagcgtccg cgtcccggcg
1801 atctgagctt tttctttcag gggatgcgcg acacccgtga tgaaaagaag ttctttcccg
1861 tggcgtccac gcgatcagtt cgttctaatg tttccaggat gaccagcatg accaagacag
1921 acacgaattc ctctcaggct tctcgtcccg gcagccccgt cgcctcgcct gatgggtcgc
1981 ccacaatggc cgaagtgttc atgacgctgg gtggtcgtgc gacggaactc ctcagccccc
2041 gtccttcgct gcgggaggcg ctgttgcgtc gtcgtgaaaa cgaagaagaa tcctaaggcc
2101 ctatattca
//
遺伝子?立体構造の論文には登録が不可欠
?2012 PLoS Licensed Under CC Attribution 2.5
論文投稿時の注意:論文の著者は、論文で言及した塩基配列や立体構造などのデー
タについて、インターネットで参照可能な公共データベースの登録番号を掲載しな
ければならない
DDBJ (http://www.ddbj.nig.ac.jp/)
INSDC DB Growth
塩基数
2187億
登録数
1億9642万
Entries by Contributors
Division-Bank distribution
INSDCに多くの配列が登録された生物種
DDBJに登録されている生物種 Top 100のワー
ドクラウド(数が多いほど大きい字で表示)
Images created by the Wordle.net web application are licensed under
a Creative Commons Attribution 3.0 United States License.
ヒト
トウモロコシ
マウス
ラット
ブタ
ウシ
Taxonomy DB (30万種を超える生物種)
生物学の
情報爆発
今時(いまどき)のシーケンサー
(左)PacBio RSII System
(中)illumina: HiSeq 2500 System
(右)Oxford NANOPORE MinION/SmidgION
http://www.1000genomes.org/
http://1001genomes.org/
http://iric.irri.org/resources/3000-genomes-project
http://www.uk10k.org
SRA growth (NCBI)
https://trace.ncbi.nlm.nih.gov/Traces/sra
完全公開分
4,137 TeraBases
(4 PetaBases)
制限公開分
9,203 TeraBases
(9 PetaBases)
今や生物学は
情報学である
遗伝研スパコン
遺伝研スーパーコンピュータサイト top
http://sc.ddbj.nig.ac.jp/
遗伝研スーパーコンピュータ全容
遺伝研スーパーコンピュータ(概要)
5.5 PB
MAID
大容量省電力HDD
7 PB
Lustre
高速HDD
“medium”
2TB memory
x 10 台
“thin”
64GB memory
x 554 台
“fat”
10TB memory
(SGI UV) 1 台
CC-PD from OpenClipart
NGS s + SC s in Biology
“medium”
2TB memory
x 10
“fat”
10TB memory
(SGI UV)
スパコン利用申請はこちら
?[ 遺伝研 スーパーコンピュータ ] で検索
無料です!
Complete:
9,078!
GOLD DB - https://gold.jgi.doe.gov
[genome gold ]
で検索
「ゲノム」が解読された「身近な」生物種
Oryza sativa
Solanum lycopersicum
Glycine max
Zea mays
Populus trichocarpa
Gallus gallus
Bos taurus
Sus scrofa
Canis lupus familiaris
Felis catus
Mus musculus
Rattus norvegicus
Homo sapiens
?
稲
トマト
大豆
トウモロコシ
ポプラ
ニワトリ
牛
豚
イヌ
イエネコ
マウス
ラット
ヒト
研究に
使い倒して
役立てよう
[DDBJing34] DDBJ と NIG SuperComputer の紹介

More Related Content

More from DNA Data Bank of Japan center (20)

狈骋厂解析を始めた时にぶつかりがちな小さい壁あれこれ
狈骋厂解析を始めた时にぶつかりがちな小さい壁あれこれ狈骋厂解析を始めた时にぶつかりがちな小さい壁あれこれ
狈骋厂解析を始めた时にぶつかりがちな小さい壁あれこれ
DNA Data Bank of Japan center
?
[DDBJing27] DDBJ Pipeline の紹介と実習
[DDBJing27] DDBJ Pipeline の紹介と実習[DDBJing27] DDBJ Pipeline の紹介と実習
[DDBJing27] DDBJ Pipeline の紹介と実習
DNA Data Bank of Japan center
?
[All-in-one2016] PDBデータの検索?見方
[All-in-one2016] PDBデータの検索?見方[All-in-one2016] PDBデータの検索?見方
[All-in-one2016] PDBデータの検索?見方
DNA Data Bank of Japan center
?
[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリング
[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリング[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリング
[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリング
DNA Data Bank of Japan center
?
[All-in-one2015] 文献情報関連サービス活用法
[All-in-one2015] 文献情報関連サービス活用法[All-in-one2015] 文献情報関連サービス活用法
[All-in-one2015] 文献情報関連サービス活用法
DNA Data Bank of Japan center
?
[All-in-one2015] データベース統合化の取り組みとNBDCで提供するサービス
[All-in-one2015] データベース統合化の取り組みとNBDCで提供するサービス[All-in-one2015] データベース統合化の取り組みとNBDCで提供するサービス
[All-in-one2015] データベース統合化の取り組みとNBDCで提供するサービス
DNA Data Bank of Japan center
?
[All-in-one2015] DDBJ へのデータ登録
[All-in-one2015] DDBJ へのデータ登録[All-in-one2015] DDBJ へのデータ登録
[All-in-one2015] DDBJ へのデータ登録
DNA Data Bank of Japan center
?
[All-in-one2015] セマンティックウェブ技術を活用した生命科学データ利用環境の紹介
[All-in-one2015] セマンティックウェブ技術を活用した生命科学データ利用環境の紹介[All-in-one2015] セマンティックウェブ技術を活用した生命科学データ利用環境の紹介
[All-in-one2015] セマンティックウェブ技術を活用した生命科学データ利用環境の紹介
DNA Data Bank of Japan center
?
[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法
DNA Data Bank of Japan center
?
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
DNA Data Bank of Japan center
?
[All-in-one2016] 立体構造データの検索?可視化法
[All-in-one2016] 立体構造データの検索?可視化法[All-in-one2016] 立体構造データの検索?可視化法
[All-in-one2016] 立体構造データの検索?可視化法
DNA Data Bank of Japan center
?
[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法
DNA Data Bank of Japan center
?
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
DNA Data Bank of Japan center
?
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
DNA Data Bank of Japan center
?
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
DNA Data Bank of Japan center
?
[DDBJing34] NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
[DDBJing34]  NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)[DDBJing34]  NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
[DDBJing34] NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
DNA Data Bank of Japan center
?
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
DNA Data Bank of Japan center
?
[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介
[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介
[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介
DNA Data Bank of Japan center
?
[DDBJing34] BioProject, BioSample の紹介
[DDBJing34] BioProject, BioSample の紹介[DDBJing34] BioProject, BioSample の紹介
[DDBJing34] BioProject, BioSample の紹介
DNA Data Bank of Japan center
?
DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開
DNA Data Bank of Japan center
?
狈骋厂解析を始めた时にぶつかりがちな小さい壁あれこれ
狈骋厂解析を始めた时にぶつかりがちな小さい壁あれこれ狈骋厂解析を始めた时にぶつかりがちな小さい壁あれこれ
狈骋厂解析を始めた时にぶつかりがちな小さい壁あれこれ
DNA Data Bank of Japan center
?
[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリング
[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリング[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリング
[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリング
DNA Data Bank of Japan center
?
[All-in-one2015] 文献情報関連サービス活用法
[All-in-one2015] 文献情報関連サービス活用法[All-in-one2015] 文献情報関連サービス活用法
[All-in-one2015] 文献情報関連サービス活用法
DNA Data Bank of Japan center
?
[All-in-one2015] データベース統合化の取り組みとNBDCで提供するサービス
[All-in-one2015] データベース統合化の取り組みとNBDCで提供するサービス[All-in-one2015] データベース統合化の取り組みとNBDCで提供するサービス
[All-in-one2015] データベース統合化の取り組みとNBDCで提供するサービス
DNA Data Bank of Japan center
?
[All-in-one2015] セマンティックウェブ技術を活用した生命科学データ利用環境の紹介
[All-in-one2015] セマンティックウェブ技術を活用した生命科学データ利用環境の紹介[All-in-one2015] セマンティックウェブ技術を活用した生命科学データ利用環境の紹介
[All-in-one2015] セマンティックウェブ技術を活用した生命科学データ利用環境の紹介
DNA Data Bank of Japan center
?
[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法
DNA Data Bank of Japan center
?
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
DNA Data Bank of Japan center
?
[All-in-one2016] 立体構造データの検索?可視化法
[All-in-one2016] 立体構造データの検索?可視化法[All-in-one2016] 立体構造データの検索?可視化法
[All-in-one2016] 立体構造データの検索?可視化法
DNA Data Bank of Japan center
?
[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法
DNA Data Bank of Japan center
?
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
DNA Data Bank of Japan center
?
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
DNA Data Bank of Japan center
?
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
DNA Data Bank of Japan center
?
[DDBJing34] NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
[DDBJing34]  NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)[DDBJing34]  NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
[DDBJing34] NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
DNA Data Bank of Japan center
?
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
DNA Data Bank of Japan center
?
DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開
DNA Data Bank of Japan center
?

[DDBJing34] DDBJ と NIG SuperComputer の紹介