第2回nips+読み会: Learning to learn by gradient decent by gradient decentTaku Tsuzuki
?
第2回NIPS読み会の発表資料です.learning to learn by gradient decent by gradient decent. OptimizerをLSTMとして表現し,逆誤差伝播によりそれを最適化. 目的関数の成分ごと独立に,パラメタを共有したLSTMで最適化を行うことで最適化すべきOptimizerのパラメタ数を小さく抑える.
This document presents mathematical formulas for calculating gradients and updates in reinforcement learning. It defines a formula for calculating the gradient of a value function with respect to its parameters, a formula for calculating the gradient of a policy based on the reward and value, and a formula for calculating the gradient of a parameter vector that is a weighted combination of its previous value and the policy gradient.
This document discusses generative adversarial networks (GANs) and their relationship to reinforcement learning. It begins with an introduction to GANs, explaining how they can generate images without explicitly defining a probability distribution by using an adversarial training process. The second half discusses how GANs are related to actor-critic models and inverse reinforcement learning in reinforcement learning. It explains how GANs can be viewed as training a generator to fool a discriminator, similar to how policies are trained in reinforcement learning.
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative ModelDeep Learning JP
?
NeRF-VAE is a 3D scene generative model that combines Neural Radiance Fields (NeRF) and Generative Query Networks (GQN) with a variational autoencoder (VAE). It uses a NeRF decoder to generate novel views conditioned on a latent code. An encoder extracts latent codes from input views. During training, it maximizes the evidence lower bound to learn the latent space of scenes and allow for novel view synthesis. NeRF-VAE aims to generate photorealistic novel views of scenes by leveraging NeRF's view synthesis abilities within a generative model framework.
論文紹介 Anomaly Detection using One-Class Neural Networks (修正版Katsuki Ohto
?
This document discusses anomaly detection using one-class neural networks (OC-NN). It begins by introducing one-class support vector machines (OC-SVM) which learn a decision boundary to distinguish normal data points from anomalies using only normal data for training. The document then presents OC-NN as an alternative, where a neural network is trained to learn a low-dimensional representation of only normal data, and anomalies are detected as points with a large reconstruction error. It evaluates OC-NN on several datasets, finding it can achieve good performance compared to OC-SVM at detecting anomalies, as measured by the area under the ROC curve metric.
第2回nips+読み会: Learning to learn by gradient decent by gradient decentTaku Tsuzuki
?
第2回NIPS読み会の発表資料です.learning to learn by gradient decent by gradient decent. OptimizerをLSTMとして表現し,逆誤差伝播によりそれを最適化. 目的関数の成分ごと独立に,パラメタを共有したLSTMで最適化を行うことで最適化すべきOptimizerのパラメタ数を小さく抑える.
This document presents mathematical formulas for calculating gradients and updates in reinforcement learning. It defines a formula for calculating the gradient of a value function with respect to its parameters, a formula for calculating the gradient of a policy based on the reward and value, and a formula for calculating the gradient of a parameter vector that is a weighted combination of its previous value and the policy gradient.
This document discusses generative adversarial networks (GANs) and their relationship to reinforcement learning. It begins with an introduction to GANs, explaining how they can generate images without explicitly defining a probability distribution by using an adversarial training process. The second half discusses how GANs are related to actor-critic models and inverse reinforcement learning in reinforcement learning. It explains how GANs can be viewed as training a generator to fool a discriminator, similar to how policies are trained in reinforcement learning.
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative ModelDeep Learning JP
?
NeRF-VAE is a 3D scene generative model that combines Neural Radiance Fields (NeRF) and Generative Query Networks (GQN) with a variational autoencoder (VAE). It uses a NeRF decoder to generate novel views conditioned on a latent code. An encoder extracts latent codes from input views. During training, it maximizes the evidence lower bound to learn the latent space of scenes and allow for novel view synthesis. NeRF-VAE aims to generate photorealistic novel views of scenes by leveraging NeRF's view synthesis abilities within a generative model framework.
論文紹介 Anomaly Detection using One-Class Neural Networks (修正版Katsuki Ohto
?
This document discusses anomaly detection using one-class neural networks (OC-NN). It begins by introducing one-class support vector machines (OC-SVM) which learn a decision boundary to distinguish normal data points from anomalies using only normal data for training. The document then presents OC-NN as an alternative, where a neural network is trained to learn a low-dimensional representation of only normal data, and anomalies are detected as points with a large reconstruction error. It evaluates OC-NN on several datasets, finding it can achieve good performance compared to OC-SVM at detecting anomalies, as measured by the area under the ROC curve metric.
Statstical Genetics Summer School 2023
http://www.sg.med.osaka-u.ac.jp/school_2023.html
Aug 25-27th 2023, Osaka University, The University of Tokyo, RIKENm, Japan
3. N G S デ ー タ の S N V / I n d e l 検 出
Copyright ? Amelieff Corporation. All Rights Reserved.
3
入力ファイル
リードのクリーニング
クオリティチェック
リファレンスゲノムへのマッピング
重複リードを除去
リアライメント、リキャリブレーション
マッピング結果のファイル
? Illumina CASAVA filter [Y] を除去
? クオリティ20未満の塩基が80%以上のリードを除去
? クオリティ20未満の末端をトリム
? 未知の塩基(N)が多いリード除去
? 配列長が短いリード除去
? 片側のみのリードを除去
ファイルの形式
フリーソフト
自社開発ツール
SNV / Indel 検出とフィルタリング
アノテーション付与
多型情報のファイル
4. Copyright ? Amelieff Corporation. All Rights Reserved.
4
N G S デ ー タ の S N V / I n d e l 検 出
ショートリード
リファレンスゲノム
マッピングソフトウェア
?最新版 0.7.12(2014/12/28公開)
?BWA-SW & BWA-MEMアルゴリズム
? 70bp~1Mbに対応。
? MEMはクオリティの高いシーケンスの時に高速かつ
高精度。70~100bpのイルミナシーケンス、454、
Ion Torrent、Sanger などで使用。
? SWはgapが多いときに感度が良い。
? Error rateは、100bpで2%以下、200bpで3%以下、
500bpで5%以下、 1000bp以上で10%以下が推奨。
? BWA-backtrackアルゴリズム
? 100bp以上のイルミナシーケンス用に最適化。
? Error rateは、2%以下が対象。
BWA
5. Copyright ? Amelieff Corporation. All Rights Reserved.
5
N G S デ ー タ の S N V / I n d e l 検 出
ショートリード
リファレンスゲノム
パッケージソフトウェア
?最新版 3.3-0(2014/10/23公開)
?DNAseqおよびRNAseqからSNV/Indel検出
? UnifiedGenotyperとHaplotypeCaller
? HaplotypeCallerはlocal de-novo assemblyを実施
? VQSR(Variant Quality Score Recalibration)を使用
して、VQSLODを付与。既知SNPを用いたエラーモ
デルによって、真の変異であるか評価。ガウス混合
モデルで推定した対数オッズ比。
?2倍体以外の生物種の変異検出に対応。
? 「-ploidy」オプションの引数として、倍数を指定可能。
GATK
6. Copyright ? Amelieff Corporation. All Rights Reserved.
6
N G S デ ー タ の S N V / I n d e l 検 出
リードがマッピング
されている様子
カバレージ
変異
BAM
VCF
?IGVによる可視化
?VCFファイル
:
7. Copyright ? Amelieff Corporation. All Rights Reserved.
7
N G S デ ー タ の S N V / I n d e l 検 出
?アノテーション情報
SnpEff
基本情報
ICGC
COSMIC
転写産物によって、
タンパク質へのインパ
クトが大きく異なる。
米国の直腸がんのプロジェクトで
0.46%の頻度で報告されている。
Functional impactが「Low」に
なっているが、どのように考えたらいいのか?
8. Copyright ? Amelieff Corporation. All Rights Reserved.
8
N G S デ ー タ の S N V / I n d e l 検 出
?アノテーション情報
ClinVar
HGVD, ESP, 1kgp
OMIM
IntOGen
さまざまな集団中で
Altアリルの頻度が高い。
疾患関連変異のデータベースに登録がない。
dbSNP
9. Copyright ? Amelieff Corporation. All Rights Reserved.
9
N G S デ ー タ の S N V / I n d e l 検 出
dbSNPに登録されている変異は除外してもいいのだろうか?
サンプル数が増えて
同じ作業を繰り返している。
自動的に絞り込んでくれるシ
ステムを作れないだろうか?
どのデータベースが信頼できるのか?
疾患関連の既知の変異のみを
まずは見たい。
でも、新規の可能性がある
変異情報も蓄積したい。
?アノテーション情報の活用?
13. Copyright ? Amelieff Corporation. All Rights Reserved.
13
公 開 デ ー タ ベ ー ス
?Disease curation
ClinVar
? 論文
? 臨床医学的に重要な変異と表現型の関連性についてのデータベース。
ClinVar: public archive of relationships among sequence variation and human phenotype
Landrum MJ, Lee JM, et al., Nucleic Acids Res. 2014 Jan 1
? 0 - Uncertain significance,
1 - not provided
2 - Benign
3 - Likely benign
4 - probable-pathogenic,
5 - pathogenic
6 - drug-response
7 - histocompatibility
255 – other / confers sensitivity /
risk factor / association / protective 88,268変異を収録
※引用 http://www.ncbi.nlm.nih.gov/clinvar/docs/clinsig/
14. Copyright ? Amelieff Corporation. All Rights Reserved.
14
公 開 デ ー タ ベ ー ス
?Prediction database
dbNSFP
[1] dbNSFP: A Lightweight Database of Human Nonsynonymous SNPs and Their
Functional Predictions
Liu et al., HUMAN MUTATION, Vol. 32, No. 8, 894–899, 2011.
[2] dbNSFP v2.0: A Database of Human Non-synonymous SNVs and Their Functional
Predictions and Annotations
Liu et al., HUMAN MUTATION Database in Brief 34: E2393-E2402 (2013) Online.
? 論文
? ヒトゲノムで起こりうるnon-synonymous SNP(NS)について、
SIFT、PolyPhen-2、LRT、Mutation Tasterによるprediction
scoreを公開。
? PhyloP によるconservation scoreを公開。
? 遺伝子とコドンは、hg18のCCDS v.20090327に基づいて計算し、
liftOver tool を用いてhg19に変換。
? 全てのscoreは高いほど、高度に保存されている、または、有害で
ある可能性が高い。
19. ? driver gene / mutationを特定するソフトウェア。
? TCGAなどのExome-seqデータ(6,079 cases)を使用。
? 多数のアルゴリズムで変異の有害性を評価してDriver Scoreを
付与。
Copyright ? Amelieff Corporation. All Rights Reserved.
19
公 開 デ ー タ ベ ー ス
?がんデータベースからドライバー遺伝子/変異を予測するアルゴリズム
CanDrA: Cancer-Specific Driver Missense Mutation Annotation with Optimized Features
Mao Y, et al., PLoS ONE 8(10): e77945. 2013.
? missense driver mutationの predictionソフトウェア。
? driver mutationを「腫瘍細胞にgrowth advantage を獲得させる体細胞変異」と定義。
? COSMIC、TCGA、Cancer Cell Line Encyclopedia (CCLE)のデータから、
driver mutationとpassenger mutationのトレーニングデータを作成。
? support vector machine (SMV) algorithmを用いて、3つのカテゴリ(driver、
passenger、non-call)に分類。
CanDrA
DriverDB: an exome sequencing database for cancer driver gene identification
Cheng et al., Nucleic Acids Research, 2013.DriverDB
20. Copyright ? Amelieff Corporation. All Rights Reserved.
20
公 開 デ ー タ ベ ー ス
? 実験医学増刊「個別化医療を拓くがんゲノム研究」の3章6の英語版
? cancer mutationのインパクトの評価
① non-synonymous mutationsを特定する。
SIFT, Polyphen-2, Mutation Assessor ,Condel, FATHMM, CHASM,
transFIC
② driver mutationによって細胞は増殖優位性を獲得する。このようなpositive
selectionのシグナルは、ドライバー遺伝子の推定にも用いられる。
MuSiC, MutSigCV , OncodriverFM , OncodriveCLUST , Active Driver
Identification of oncogenic driver mutations (Chapter 3.6)
Tamborero et al., Experimental Medicine, 2014
実験医学
※引用 https://www.yodosha.co.jp/jikkenigaku/book/9784758103404/
偶然よりも高い確率
で変異が蓄積される
機能的に影響を及ぼ
す変異に偏っている
特定の領域に蓄積する
タンパク質のリン酸化部
位に起きる傾向がある
?がんデータベースからドライバー遺伝子/変異を予測するアルゴリズム
21. Copyright ? Amelieff Corporation. All Rights Reserved.
21
デ ー タ ベ ー ス 活 用 実 践
① nsSNVとssSNVを検索
② 1kgpとESPで、MAFが5%を超える変異を除外
③ prediction scoreが高い順にランク付け
④ conservation scoreが高い順にランク付け
⑤ 疾患関連の組織で発現していない遺伝子の変異を除外
⑥ Mendelian Inheritance in Man (MIM)に登録のある、または、
GWASで報告のある遺伝子の変異を強調
⑦ 疾患を引き起こす遺伝子と相互作用する遺伝子の変異を強調
⑧ 疾患関連のパスウェイにある遺伝子の変異を強調
dbNSFPが推奨しているフィルタリング方法
?「疾患関連の既知変異探索と新規変異探索」の例
22. Copyright ? Amelieff Corporation. All Rights Reserved.
22
デ ー タ ベ ー ス 活 用 実 践
Variant classification
Clinical Whole-Exome Sequencing for the Diagnosis of Mendelian Disorders
Yang et al., N Engl J Med 369, 2013.
?「疾患関連の既知変異探索と新規変異探索」の例