狠狠撸

狠狠撸Share a Scribd company logo
AI semi
Keio Univ.
Imai Lab.
M1
Keisuke Takiguchi
AI Seminar 2018/10/17
話すこと
? インターンのすすめ
? インターンでやってたこと1
? インターンでやってたこと2
? おまけ(研究進捗)
2
インターンに行きましょう.
3
インターンのすすめ
なぜインターンに行った方が良い?
? 技術,スキルを学べる
? 将来どんな分野で働きたいかのイメージを掴む
? (特に情報工学科は)暇なので
? 研究するか,開発するかの判断材料として
どんなところに行くべき?
? 将来行きたい所(雰囲気調査,あわよくば内定)
? 時給が良い所(責任も大きい→より学べる)
行くならどの時期が良い?
? 夏休み,時間があれば長期インターンを平日に
? B3やM1,時間があるなら他学年でも
4
CycleGAN-
VC
7
声質変換
声質変換とは?
→話者の声を別の話者の声へと変換すること
通常,音響特徴抽出を行う
8
[6]
処理の流れ
9
10
100 25
15 5
メルケプストラム次数による違い
11
original 25 15 5 1
従来研究(1/3)
音響特徴量抽出+音声波形予測
? パラレルデータを用いて学習
? Bidirectional RNNベースのモデルなど
12
DBLSTM-RNN based model
従来研究(2/3)
13
WaveNet
? パラレルデータを用いて学習
? 波形を直接扱う
? 生成が非常に遅い
従来研究(3/3)
14
? フーリエ変換+位相推定による手法
? GAN[1]を用いる手法などがある
? 時系列データである音声特徴を画像として扱うことで
効率よくデータを利用できる.
問題点
WaveNet
? 学習に大量のデータが必要,用意が困難
? 処理が重く,リアルタイムな変換が不可能
STFT+位相推定
? 位相推定に時間を要する
普遍的な問題
? パラレルデータを用意するのが困難
15
CycleGAN[2] (1/2)
16
[2]CycleGAN
CycleGAN[2] (2/2)
17
[2]CycleGAN
CycleGAN-VC
Introduction&Samples
http://www.kecl.ntt.co.jp/people/kaneko.takuhiro/projects/cy
clegan-vc/
18
Architecture
19[4]CycleGAN-VC
1D CNN
20
mfcc
Frame size
結果
21
M to F
original converted
F to M
original converted
GANerated
22
23
GANを用いた三次元位置推定
画像から,三次元の座標を推定する手法
? OpenPoseなどがある
? リアルタイム向きではない(らしい)
24
OpenPose
やりたかったこと
手が写った画像を入力して,手の三次元座標を推定したい
シミュレータで手のモデルを作って,
座標と画像のペアデータを作成,教師データにできる
生成した手の画像が,実世界のものとかけ離れている
手の画像をリアルな質感に変換できれば
精度向上できるのでは
25
GANerated Hands for Real-Time 3D Hand
Tracking from Monocular RGB
26
教師画像生成 三次元位置推定 モデルに適用
処理の流れ
Architecture
27
Result(論文中)
28
おまけ
29
? 階層的な構造を持つ強化学習フレームワークの提案
? 複数の異なる抽象目的を階層的に持つことで
タスクを分解して解釈可能
? サブサンプションアーキテクチャ的な制御
参考文献
[1] Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua
Bengio, “Generative Adversarial Networks”, Jun 2014
[2] Jun-Yan Zhu, Taesung Park, Phillip Isola, Alexei A. Efros, ”Unpaired Image-to-Image Translation using Cycle-Consistent
Adversarial Networks”, ICCV 2017.
[3] S M. Ali Eslami, Danilo Jimenez Rezende, et.al. “Neural scene representation and rendering”, Science 15 Jun 2018
[4] Takuhiro Kaneko, Hirokazu Kameoka ,“PARALLEL-DATA-FREE VOICE CONVERSION USING CYCLE-CONSISTENT
ADVERSARIAL NETWORKS”, NTT Corporation
[5] Lifa Sun, Kun Li, Hao Wang, Shiyin Kang and Helen Meng, “PHONETIC POSTERIORGRAMS FOR MANY-TO-ONE VOICE
CONVERSION WITHOUT PARALLEL DATA TRAINING “
[6] 統計的声質変換を行うための知識と手法
https://nico-opendata.jp/ja/casestudy/2stack_voice_conversion/report.html#[4]
[7] 人工知能に関する断創録
http://aidiary.hatenablog.com/
[8]スペクトログラムとメル周波数スペクトログラムの可視化
http://r9y9.github.io/blog/2013/11/16/mel-spectrogram/
30

More Related Content

What's hot (6)

论文のいろは
论文のいろは论文のいろは
论文のいろは
Shu Sakamoto
?
プレゼンスキルアップ!讲座 原田?牛久研究室(日本语)
プレゼンスキルアップ!讲座 原田?牛久研究室(日本语)プレゼンスキルアップ!讲座 原田?牛久研究室(日本语)
プレゼンスキルアップ!讲座 原田?牛久研究室(日本语)
Antonio Tejero de Pablos
?
対话の方法论 ~〈対话法〉を使って対话する~
対话の方法论 ~〈対话法〉を使って対话する~対话の方法论 ~〈対话法〉を使って対话する~
対话の方法论 ~〈対话法〉を使って対话する~
Philosophy Detective
?
レポートの书き方(基础演习)
レポートの书き方(基础演习)レポートの书き方(基础演习)
レポートの书き方(基础演习)
MunenoriNAGAO
?
演习での発表について
演习での発表について演习での発表について
演习での発表について
MunenoriNAGAO
?
Rediscovery of the presentation(public)
Rediscovery of the presentation(public)Rediscovery of the presentation(public)
Rediscovery of the presentation(public)
TAKIMOTO Hiroki
?
プレゼンスキルアップ!讲座 原田?牛久研究室(日本语)
プレゼンスキルアップ!讲座 原田?牛久研究室(日本语)プレゼンスキルアップ!讲座 原田?牛久研究室(日本语)
プレゼンスキルアップ!讲座 原田?牛久研究室(日本语)
Antonio Tejero de Pablos
?
対话の方法论 ~〈対话法〉を使って対话する~
対话の方法论 ~〈対话法〉を使って対话する~対话の方法论 ~〈対话法〉を使って対话する~
対话の方法论 ~〈対话法〉を使って対话する~
Philosophy Detective
?
レポートの书き方(基础演习)
レポートの书き方(基础演习)レポートの书き方(基础演习)
レポートの书き方(基础演习)
MunenoriNAGAO
?
演习での発表について
演习での発表について演习での発表について
演习での発表について
MunenoriNAGAO
?
Rediscovery of the presentation(public)
Rediscovery of the presentation(public)Rediscovery of the presentation(public)
Rediscovery of the presentation(public)
TAKIMOTO Hiroki
?

Similar to 機械学習ゼミ 2018/10/17 (20)

????????用 ????????? 201307研修効果を最大化?????????(人事実务?????2013:飞产)
????????用 ????????? 201307研修効果を最大化?????????(人事実务?????2013:飞产)????????用 ????????? 201307研修効果を最大化?????????(人事実务?????2013:飞产)
????????用 ????????? 201307研修効果を最大化?????????(人事実务?????2013:飞产)
kkcolumn
?
研修効果の最大化(闯辫肠 飞产)
研修効果の最大化(闯辫肠 飞产)研修効果の最大化(闯辫肠 飞产)
研修効果の最大化(闯辫肠 飞产)
kkcolumn
?
思考の手引き ?整理?分析編?
思考の手引き ?整理?分析編?思考の手引き ?整理?分析編?
思考の手引き ?整理?分析編?
tankyu tomonokai
?
2021年度 伊藤ゼミ ゼミと研究
2021年度 伊藤ゼミ ゼミと研究2021年度 伊藤ゼミ ゼミと研究
2021年度 伊藤ゼミ ゼミと研究
Masahiko Itoh
?
プレゼンテーションの考え方20140628
プレゼンテーションの考え方20140628プレゼンテーションの考え方20140628
プレゼンテーションの考え方20140628
Professional University of Information and Management for Innovation (情報経営イノベーション専門職大学)
?
抄読会2.0
抄読会2.0抄読会2.0
抄読会2.0
Siro Kida
?
研究発表をするときの心得
研究発表をするときの心得研究発表をするときの心得
研究発表をするときの心得
tatthiy
?
闯础惭就活キックオフ pdfプレゼン
闯础惭就活キックオフ pdfプレゼン闯础惭就活キックオフ pdfプレゼン
闯础惭就活キックオフ pdfプレゼン
Kengo Muraguchi
?
新入社员の方による就活体験谈と现场での人材育成
新入社员の方による就活体験谈と现场での人材育成新入社员の方による就活体験谈と现场での人材育成
新入社员の方による就活体験谈と现场での人材育成
You&I
?
とてか03「「いかす!」のために大事だと思う4つのこと」
とてか03「「いかす!」のために大事だと思う4つのこと」とてか03「「いかす!」のために大事だと思う4つのこと」
とてか03「「いかす!」のために大事だと思う4つのこと」
Tsuyoshi Yumoto
?
【9月1日开催】本场スタンフォード大学に学ぶ!デザイン思考入门
【9月1日开催】本场スタンフォード大学に学ぶ!デザイン思考入门【9月1日开催】本场スタンフォード大学に学ぶ!デザイン思考入门
【9月1日开催】本场スタンフォード大学に学ぶ!デザイン思考入门
Takanori Kashino
?
20110108 論評ワークショップ(東京メトロポリタンTMC)
20110108 論評ワークショップ(東京メトロポリタンTMC)20110108 論評ワークショップ(東京メトロポリタンTMC)
20110108 論評ワークショップ(東京メトロポリタンTMC)
raizo
?
修士の振り返り.辫辫迟虫
修士の振り返り.辫辫迟虫修士の振り返り.辫辫迟虫
修士の振り返り.辫辫迟虫
亮介 西田
?
20120731 江戸tmc table topics workshop
20120731 江戸tmc table topics workshop20120731 江戸tmc table topics workshop
20120731 江戸tmc table topics workshop
Kiminari Azuma
?
2011论评ワークショップ(东京尘)予告编
2011论评ワークショップ(东京尘)予告编2011论评ワークショップ(东京尘)予告编
2011论评ワークショップ(东京尘)予告编
raizo
?
Jacet2014ykondo_final
Jacet2014ykondo_finalJacet2014ykondo_final
Jacet2014ykondo_final
早稲田大学
?
『Toi toitoiケース研究月例会』説明資料
『Toi toitoiケース研究月例会』説明資料『Toi toitoiケース研究月例会』説明資料
『Toi toitoiケース研究月例会』説明資料
Keiichi Yokoyama
?
実践の手引き ~課題研究編~
実践の手引き ~課題研究編~実践の手引き ~課題研究編~
実践の手引き ~課題研究編~
tankyu tomonokai
?
北海学园英语教育研究会第4回研究会特别セミナースライド
北海学园英语教育研究会第4回研究会特别セミナースライド北海学园英语教育研究会第4回研究会特别セミナースライド
北海学园英语教育研究会第4回研究会特别セミナースライド
Kazuhito Yamato
?
????????用 ????????? 201307研修効果を最大化?????????(人事実务?????2013:飞产)
????????用 ????????? 201307研修効果を最大化?????????(人事実务?????2013:飞产)????????用 ????????? 201307研修効果を最大化?????????(人事実务?????2013:飞产)
????????用 ????????? 201307研修効果を最大化?????????(人事実务?????2013:飞产)
kkcolumn
?
研修効果の最大化(闯辫肠 飞产)
研修効果の最大化(闯辫肠 飞产)研修効果の最大化(闯辫肠 飞产)
研修効果の最大化(闯辫肠 飞产)
kkcolumn
?
思考の手引き ?整理?分析編?
思考の手引き ?整理?分析編?思考の手引き ?整理?分析編?
思考の手引き ?整理?分析編?
tankyu tomonokai
?
2021年度 伊藤ゼミ ゼミと研究
2021年度 伊藤ゼミ ゼミと研究2021年度 伊藤ゼミ ゼミと研究
2021年度 伊藤ゼミ ゼミと研究
Masahiko Itoh
?
研究発表をするときの心得
研究発表をするときの心得研究発表をするときの心得
研究発表をするときの心得
tatthiy
?
闯础惭就活キックオフ pdfプレゼン
闯础惭就活キックオフ pdfプレゼン闯础惭就活キックオフ pdfプレゼン
闯础惭就活キックオフ pdfプレゼン
Kengo Muraguchi
?
新入社员の方による就活体験谈と现场での人材育成
新入社员の方による就活体験谈と现场での人材育成新入社员の方による就活体験谈と现场での人材育成
新入社员の方による就活体験谈と现场での人材育成
You&I
?
とてか03「「いかす!」のために大事だと思う4つのこと」
とてか03「「いかす!」のために大事だと思う4つのこと」とてか03「「いかす!」のために大事だと思う4つのこと」
とてか03「「いかす!」のために大事だと思う4つのこと」
Tsuyoshi Yumoto
?
【9月1日开催】本场スタンフォード大学に学ぶ!デザイン思考入门
【9月1日开催】本场スタンフォード大学に学ぶ!デザイン思考入门【9月1日开催】本场スタンフォード大学に学ぶ!デザイン思考入门
【9月1日开催】本场スタンフォード大学に学ぶ!デザイン思考入门
Takanori Kashino
?
20110108 論評ワークショップ(東京メトロポリタンTMC)
20110108 論評ワークショップ(東京メトロポリタンTMC)20110108 論評ワークショップ(東京メトロポリタンTMC)
20110108 論評ワークショップ(東京メトロポリタンTMC)
raizo
?
修士の振り返り.辫辫迟虫
修士の振り返り.辫辫迟虫修士の振り返り.辫辫迟虫
修士の振り返り.辫辫迟虫
亮介 西田
?
20120731 江戸tmc table topics workshop
20120731 江戸tmc table topics workshop20120731 江戸tmc table topics workshop
20120731 江戸tmc table topics workshop
Kiminari Azuma
?
2011论评ワークショップ(东京尘)予告编
2011论评ワークショップ(东京尘)予告编2011论评ワークショップ(东京尘)予告编
2011论评ワークショップ(东京尘)予告编
raizo
?
『Toi toitoiケース研究月例会』説明資料
『Toi toitoiケース研究月例会』説明資料『Toi toitoiケース研究月例会』説明資料
『Toi toitoiケース研究月例会』説明資料
Keiichi Yokoyama
?
実践の手引き ~課題研究編~
実践の手引き ~課題研究編~実践の手引き ~課題研究編~
実践の手引き ~課題研究編~
tankyu tomonokai
?
北海学园英语教育研究会第4回研究会特别セミナースライド
北海学园英语教育研究会第4回研究会特别セミナースライド北海学园英语教育研究会第4回研究会特别セミナースライド
北海学园英语教育研究会第4回研究会特别セミナースライド
Kazuhito Yamato
?

More from KCS Keio Computer Society (20)

Large scale gan training for high fidelity natural
Large scale gan training for high fidelity naturalLarge scale gan training for high fidelity natural
Large scale gan training for high fidelity natural
KCS Keio Computer Society
?
Imagenet trained cnns-are_biased_towards
Imagenet trained cnns-are_biased_towardsImagenet trained cnns-are_biased_towards
Imagenet trained cnns-are_biased_towards
KCS Keio Computer Society
?
機械学習ゼミ: Area attenttion
機械学習ゼミ: Area attenttion機械学習ゼミ: Area attenttion
機械学習ゼミ: Area attenttion
KCS Keio Computer Society
?
機械学習ゼミ2018 06 15
機械学習ゼミ2018 06 15機械学習ゼミ2018 06 15
機械学習ゼミ2018 06 15
KCS Keio Computer Society
?
Control by deep learning
Control by deep learningControl by deep learning
Control by deep learning
KCS Keio Computer Society
?
深层学习 第6章
深层学习 第6章深层学习 第6章
深层学习 第6章
KCS Keio Computer Society
?
Vector-Based navigation using grid-like representations in artificial agents
 Vector-Based navigation using grid-like representations in artificial agents Vector-Based navigation using grid-like representations in artificial agents
Vector-Based navigation using grid-like representations in artificial agents
KCS Keio Computer Society
?
文章生成の未解决问题
文章生成の未解决问题文章生成の未解决问题
文章生成の未解决问题
KCS Keio Computer Society
?
Word2vec alpha
Word2vec alphaWord2vec alpha
Word2vec alpha
KCS Keio Computer Society
?
テンソル代数
テンソル代数テンソル代数
テンソル代数
KCS Keio Computer Society
?
Hindsight experience replay
Hindsight experience replayHindsight experience replay
Hindsight experience replay
KCS Keio Computer Society
?
Kml 輪読514
Kml 輪読514Kml 輪読514
Kml 輪読514
KCS Keio Computer Society
?
ゼロから作るDeepLearning 5章 輪読
ゼロから作るDeepLearning 5章 輪読ゼロから作るDeepLearning 5章 輪読
ゼロから作るDeepLearning 5章 輪読
KCS Keio Computer Society
?
贰尝叠翱型痴础贰のダメなところ
贰尝叠翱型痴础贰のダメなところ贰尝叠翱型痴础贰のダメなところ
贰尝叠翱型痴础贰のダメなところ
KCS Keio Computer Society
?
ゼロから作るDeepLearning 2~3章 輪読
ゼロから作るDeepLearning 2~3章 輪読ゼロから作るDeepLearning 2~3章 輪読
ゼロから作るDeepLearning 2~3章 輪読
KCS Keio Computer Society
?
ゼロから作るDeepLearning 4章 輪読
ゼロから作るDeepLearning 4章 輪読ゼロから作るDeepLearning 4章 輪読
ゼロから作るDeepLearning 4章 輪読
KCS Keio Computer Society
?
Soft Actor Critic 解説
Soft Actor Critic 解説Soft Actor Critic 解説
Soft Actor Critic 解説
KCS Keio Computer Society
?
ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読
KCS Keio Computer Society
?
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
KCS Keio Computer Society
?
Graph Convolutional Network 概説
Graph Convolutional Network 概説Graph Convolutional Network 概説
Graph Convolutional Network 概説
KCS Keio Computer Society
?
Large scale gan training for high fidelity natural
Large scale gan training for high fidelity naturalLarge scale gan training for high fidelity natural
Large scale gan training for high fidelity natural
KCS Keio Computer Society
?
Vector-Based navigation using grid-like representations in artificial agents
 Vector-Based navigation using grid-like representations in artificial agents Vector-Based navigation using grid-like representations in artificial agents
Vector-Based navigation using grid-like representations in artificial agents
KCS Keio Computer Society
?
ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読
KCS Keio Computer Society
?
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
KCS Keio Computer Society
?

機械学習ゼミ 2018/10/17

Editor's Notes

  • #5: 质疑応答,机械学习のことだけじゃなくて,インターンのことでも大丈夫です.础滨ゼミ的に大丈夫かは知らないです.
  • #7: こっから本题.
  • #13: パラレルデータとは,入力話者と出力話者について同時に同じ内容を発話した音声データのことをいう Bidirectional RNN 音響特徴量(基本周波数、スペクトラム、非周期信号
  • #14: 大量の計算資源と大量の学習データが必要 16-bitの整数値で保存される. つまり取りうる値を生成するために, 1タイムステップあたり65,536個の確率をアウトプット データを用意するのが困難.
  • #15: 音质わるわる