狠狠撸

狠狠撸Share a Scribd company logo
Microsoft Cognitive Services の
Speech API の概要
を個人的にまとめてみました。
2016-12-20
Cogbot勉強会 #3
session version
自己紹介
@BEACH_SIDE
横浜 篤
よこはま あつし
http://beachside.hatenablog.com/
株式会社アイティーブレーン
Edge Technology and Projects 部
部長
Using…
C#, ASP.NET, Azure, Machine Learning, Xamarin ….
I’m C#er
2016年12月20日時点の情報です。
アップデートのペースが速いためご注意ください。
フォント:HG行書体
注意事項
1. Cognitive Servicesの概要
2. Speech APIの概要
3. What comes next
Agenda
Bing Speech API
Speaker Recognition API
Custom Recognition
Intelligent Service
1. Microsoft Cognitive Services の概要 – 全体像
Vision
? Computer Vision
? Content Moderator
? Emotion
? Face
? Video
Speech
? Bing Speech
? Custom Recognition
? Speaker Recognition
? Translator Speech
Language
? Bing Spell Check
? Language Understanding
? Linguistic Analysis
? Text Analytics
? Translator
? WebLM
Knowledge
? Academic
? Entity Linking
? Knowledge Exploration
? QnA Maker
? Recommendations
Search
? Bing Autosuggest
? Bing Image Search
? Bing News Search
? Bing Video Search
? Bing Web Search
Give your apps a human side.
Roll your own with REST APIs
Simple to add: just a few lines of
code required
Integrate into the language and
platform of your choice
Breadth of offerings helps you find the
right API for your app
Built by experts in their field from
Microsoft Research, Bing, and Azure
Machine Learning
Quality documentation, sample
code, and community support
Easy Flexible Tested
Why
GET A
KEY
1. Cognitive Servicesの概要
2. Speech APIの概要
3. What comes next
Agenda
Bing Speech API
Speaker Recognition API
Custom Recognition
Intelligent Service
Speaker Recognition API
Custom Recognition
Intelligent Service
Bing Speech API
2-1
1. Cognitive Servicesの概要
2. Speech APIの概要
2-1 Bing Speech
2-2 Speaker Recognition
2-3 CRIS
3. What comes next
Agenda
2 -1 Bing Speech API
2つのAPIがコンポーネントで構成されている。
MicrosoftでもCortanaやSkype Translatorといったアプリで使っている。
? Speech Recognition API
音声データをテキストに変換
? Text To Speech API
テキストを音声データに変換
Speech Recognition API
Text To Speech API
DEMO
Speaker Recognition API
Custom Recognition
Intelligent Service
Bing Speech API
Agenda
Bing Speech API
Custom Recognition
Intelligent Service
Speaker Recognition
API
2-2
1. Cognitive Servicesの概要
2. Speech APIの概要
2-1 Bing Speech
2-2 Speaker Recognition
2-3 CRIS
3. What comes next
Agenda
2 -2 Speaker Recognition API
2つのAPIがコンポーネントがあります。対応言語は英語のみ。
? Speaker Verification
音声認証をする。
? Speaker Identification
音声データから話す人を自動的に識別する。
Speaker Identification
DEMO
Bing Speech API
Custom Recognition
Intelligent Service
Speaker Recognition
API
1. Cognitive Servicesの概
要
2. Speech APIの概要
2-1 Bing Speech
2-2 Speaker Recognition
2-3 CRIS
3. What comes next
Agenda
Bing Speech API
Speaker Recognition API
Custom Recognition
Intelligent Service
2-3
2 -3 Custom Recognition Intelligent Service
「acoustic model」と「language model」をカスタマイズして、最適な音声
認識をするためのサービス。日本語未対応。
? acoustic model(音響モデル)のカスタマイズ
例として工場や病院などで使用するアプリを作る場合、環境に応じた
ノイズ下で音声を正しく音声を認識できるようにする
? language model(言語モデル)のカスタマイズ
例としてMSDNで音声検索をするアプリの場合、
”object-oriented”や” namespace”、“dot net”といった
専門用語を正しく認知させる
Bing Speech API
Speaker Recognition API
Custom Recognition
Intelligent Service
+11. Cognitive Servicesの概要
2. Speech APIの概要
2-1 Bing Speech
2-2 Speaker Recognition
2-3 CRIS
2-4 Translator Speech
3. What comes next
Agenda 2-4
Translator Speech API
2016-12-13発表
「Microsoft Translator introduces the world’s first
personal universal translator」
http://bit.ly/2gVUgUv
Translator Speech API
DEMO
Bing Speech API
Speaker Recognition API
Custom Recognition
Intelligent Service
1. Cognitive Servicesの概要
2. Speech APIの概要
3. What comes next
Agenda
Bing Speech API
Speaker Recognition API
Custom Recognition
Intelligent Service
TODO
? TODO
TODO。
Get Started!
It’s free. Visit
microsoft.com/cognitive-services
Learn more!
Cognitive Services
microsoft.com/cognitive-services
What to do next…
Developer
Resources
Preview Pricing
https://www.microsoft.com/cognitive-services/en-us/pricing
Documentation
https://www.microsoft.com/cognitive-services/en-us/documentation
https://azure.microsoft.com/ja-jp/services/cognitive-services/
Join Community
https://www.facebook.com/groups/cogbot/
https://stackoverflow.com/questions/tagged/microsoft-cognitive
https://social.msdn.microsoft.com/forums/azure/en-
US/home?forum=mlapi
https://cognitive.uservoice.com/
enjoy Cogbot.
Thank you.
2016-12-20
Cogbot勉強会 #3

More Related Content

Speech API の概要(Microsoft Cognitive Services)