狠狠撸

狠狠撸Share a Scribd company logo
Voice Recognization in
       Android
Roger
yixx@ucweb.com
roger2yi@gmail.com
www.twitter.com/roger2yi
https://plus.google.com/
Voice Recognization
? 语音识别目前在应用上可以分作两个层次
    – 语音识别:将语音识别成文本(Speech To
      Text)
    – 自然语言理解:对语音进行分析,理解用户的
      实际意图
? 前者主要用于语音输入,而后者主要用于
  像智能助手这样的辅助软件


2011-10-20          Roger, UC
Voice Apps

? 在Android,iOS上面的一些比较知名的语
  音类软件




2011-10-20                  3
骋辞辞驳濒别拼音输入法(础苍诲谤辞颈诲)
          拼音输入法(Android
    Google拼音输入法( Android)




2011-10-20   Roger, UC
讯飞语音输入法(础苍诲谤辞颈诲)
       讯飞语音输入法(Android
               Android)




2011-10-20                5
Nuance T9 Flex输入法(Android)
              输入法(Android
          Flex输入法( Android)




2011-10-20   Roger, UC
Google Voice Search(Android)
             Search( Android)
? 支持简单的自然语言
  理解,可以用于搜
  索,拨打电话,发邮
  件,导航等
? 支持中文的语音识别
? 目前不支持中文的意
  图识别,中文语音输
  入只能用于搜索



2011-10-20    Roger, UC
痴濒颈苍驳辞(础苍诲谤辞颈诲,颈翱厂)
             Vlingo( Android, iOS)

? 支持简单的自然语言
  理解,可以用于搜
  索,拨打电话,发邮
  件,导航,调用系统
  服务等

? 支持中文的意图识别



2011-10-20           Roger, UC
厂颈谤颈(颈翱厂)
             厂颈谤颈(颈翱厂)
? 支持较为复杂的自然
  语言理解,可以用于
  搜索,拨打电话,发
  邮件,导航,调用系
  统服务等
? 支持陪聊?
? 目前不支持中文语音
  识别


2011-10-20      Roger, UC
Android Voice API
? Android SDK本身包括了一个简单的语音识
  别的API接口,提供语音识别功能的应用可
  以注册自己的服务,而需要语音识别功能
  的应用可以通过Intent调用这些服务
? 在安装Google Voice Search和Vlingo之
  后,它们都会注册自己的语音识别服务到
  系统里面提供给第三方调用,除了Service
  外,Google Voice Search还会提供一个
  Activity供直接使用
2011-10-20         Roger, UC
Cont.

? 第三方程序可以使用Activity或者Service来
  获得语音识别的能力

? 海豚浏览器在检查到安装了Google Voice
  Search之后会增加使用Google Voice的服
  务来进行语音输入的功能(用于搜索)



2011-10-20   Roger, UC
private void startVoiceRecognitionActivity() {

               //通过Intent传递语音识别的模式,开启语音
               Intent intent = new Intent(
                         RecognizerIntent.ACTION_RECOGNIZE_SPEECH);

               //语言模式和自由形式的语音识别
               intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,
                        RecognizerIntent.LANGUAGE_MODEL_WEB_SEARCH);

               //提示语音开始
               intent.putExtra(RecognizerIntent.EXTRA_PROMPT, "");

               //开始执行我们的Intent、语音识别
               startActivityForResult(intent,
                                 VOICE_RECOGNITION_REQUEST_CODE);
      }

2011-10-20                          Roger, UC
云端识别
? 语音识别和语言理解大都是在服务器端进行的,
  本地只是负责把语音数据打包传送给服务器,然
  后再接收服务器传回的数据
? 第三方应用使用Google Voice或者Vlingo提供的
  语音识别服务,也是通过它们的服务器进行识别
? 跟iOS已经整合在一起的Siri也是一样,它使用的
  Nuance的语音识别引擎和WolframAlpha搜索引
  擎,也是部署在服务器端。



2011-10-20    Roger, UC
本地识别
? Android系统内置了一个Nuance SREC的本地语音
  识别引擎,但只支持识别特定的指令而不是任意
  的语音输入,并且这部分的API是私有的,意味不
  能够安全地使用它
? Android系统自带的语音拨号应用使用了这个库,
  但是只支持简单的英文指令如“Call”,“Open”,
  “Redial”等
? Android4.0提供了内置的连续语音输入功能,但
  是不知道是否是在本地识别,并且是否公开API


2011-10-20    Roger, UC
Reference
? http://developer.android.com/resources/article
  s/speech-input.html
? http://googlemobile.blogspot.com/2010/08/just
  -speak-it-introducing-voice-actions.html
? http://dmfs.org/handsfree/?engines
? http://www.vlingo.com/demo/videos
? http://www.nuance.com/


2011-10-20           Roger, UC
The End
Thank you for your listening
  Yours Sincerely, Roger

More Related Content

Viewers also liked (13)

Morgen Mukamwi - CV
Morgen Mukamwi  - CVMorgen Mukamwi  - CV
Morgen Mukamwi - CV
Morgen Mukamwi
?
Automated Project Office
Automated Project OfficeAutomated Project Office
Automated Project Office
Computer Aid, Inc
?
Text-To-Speech from the Start : A Primary Support for Lifespan Learning
Text-To-Speech from the Start: A Primary Support for Lifespan LearningText-To-Speech from the Start: A Primary Support for Lifespan Learning
Text-To-Speech from the Start : A Primary Support for Lifespan Learning
Albemarle County Public Schools
?
Speech recognition
Speech recognitionSpeech recognition
Speech recognition
fluffyemily
?
Motion and gesture in Android
Motion and gesture in AndroidMotion and gesture in Android
Motion and gesture in Android
rogeryi
?
础苍诲谤辞颈诲の音声认识とテキスト読み上げ机能について
础苍诲谤辞颈诲の音声认识とテキスト読み上げ机能について础苍诲谤辞颈诲の音声认识とテキスト読み上げ机能について
础苍诲谤辞颈诲の音声认识とテキスト読み上げ机能について
moai kids
?
Android Hardware Accelerated 2D Rendering
Android Hardware Accelerated 2D RenderingAndroid Hardware Accelerated 2D Rendering
Android Hardware Accelerated 2D Rendering
rogeryi
?
Beyond Android Views - Window,Surface,Special Views,and More
Beyond Android Views - Window,Surface,Special Views,and MoreBeyond Android Views - Window,Surface,Special Views,and More
Beyond Android Views - Window,Surface,Special Views,and More
rogeryi
?
Voice Recognization in Android
Voice Recognization in AndroidVoice Recognization in Android
Voice Recognization in Android
rogeryi
?
Text to Speech for Mobile Voice
Text to Speech for Mobile Voice Text to Speech for Mobile Voice
Text to Speech for Mobile Voice
June Hostetter
?
Why your Android Apps Suck
Why your Android Apps SuckWhy your Android Apps Suck
Why your Android Apps Suck
rogeryi
?
Web Page Rendering and Accelerated Compositing
Web Page Rendering and Accelerated CompositingWeb Page Rendering and Accelerated Compositing
Web Page Rendering and Accelerated Compositing
rogeryi
?
Speech to text conversion
Speech to text conversionSpeech to text conversion
Speech to text conversion
ankit_saluja
?
Text-To-Speech from the Start : A Primary Support for Lifespan Learning
Text-To-Speech from the Start: A Primary Support for Lifespan LearningText-To-Speech from the Start: A Primary Support for Lifespan Learning
Text-To-Speech from the Start : A Primary Support for Lifespan Learning
Albemarle County Public Schools
?
Motion and gesture in Android
Motion and gesture in AndroidMotion and gesture in Android
Motion and gesture in Android
rogeryi
?
础苍诲谤辞颈诲の音声认识とテキスト読み上げ机能について
础苍诲谤辞颈诲の音声认识とテキスト読み上げ机能について础苍诲谤辞颈诲の音声认识とテキスト読み上げ机能について
础苍诲谤辞颈诲の音声认识とテキスト読み上げ机能について
moai kids
?
Android Hardware Accelerated 2D Rendering
Android Hardware Accelerated 2D RenderingAndroid Hardware Accelerated 2D Rendering
Android Hardware Accelerated 2D Rendering
rogeryi
?
Beyond Android Views - Window,Surface,Special Views,and More
Beyond Android Views - Window,Surface,Special Views,and MoreBeyond Android Views - Window,Surface,Special Views,and More
Beyond Android Views - Window,Surface,Special Views,and More
rogeryi
?
Voice Recognization in Android
Voice Recognization in AndroidVoice Recognization in Android
Voice Recognization in Android
rogeryi
?
Text to Speech for Mobile Voice
Text to Speech for Mobile Voice Text to Speech for Mobile Voice
Text to Speech for Mobile Voice
June Hostetter
?
Why your Android Apps Suck
Why your Android Apps SuckWhy your Android Apps Suck
Why your Android Apps Suck
rogeryi
?
Web Page Rendering and Accelerated Compositing
Web Page Rendering and Accelerated CompositingWeb Page Rendering and Accelerated Compositing
Web Page Rendering and Accelerated Compositing
rogeryi
?
Speech to text conversion
Speech to text conversionSpeech to text conversion
Speech to text conversion
ankit_saluja
?

Similar to Voice recognization in Android (20)

移动互联网时代的语音云
移动互联网时代的语音云移动互联网时代的语音云
移动互联网时代的语音云
csdnmobile
?
讯飞语音云及示范应用讯飞语点
讯飞语音云及示范应用讯飞语点讯飞语音云及示范应用讯飞语点
讯飞语音云及示范应用讯飞语点
geekparknet
?
AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM [ 說明含影片連結 ]
AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM [ 說明含影片連結 ]AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM [ 說明含影片連結 ]
AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM [ 說明含影片連結 ]
olami.ai
?
第18期极客活动-有道词典
第18期极客活动-有道词典第18期极客活动-有道词典
第18期极客活动-有道词典
geekparknet
?
AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM
AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUMAI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM
AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM
Ryan Hang
?
Android 系統的歷史、發展策略與技術創新 v1.1.0
Android 系統的歷史、發展策略與技術創新 v1.1.0Android 系統的歷史、發展策略與技術創新 v1.1.0
Android 系統的歷史、發展策略與技術創新 v1.1.0
信宏 陳
?
2011/08/20跨平台行動應用程式使用者介面開發—以titanium mobile為例
2011/08/20跨平台行動應用程式使用者介面開發—以titanium mobile為例2011/08/20跨平台行動應用程式使用者介面開發—以titanium mobile為例
2011/08/20跨平台行動應用程式使用者介面開發—以titanium mobile為例
Justin Lee
?
行动与云端科技在图书馆的应用
行动与云端科技在图书馆的应用行动与云端科技在图书馆的应用
行动与云端科技在图书馆的应用
皓仁 柯
?
础辫辫肠补苍介绍自己的应用开发平台
础辫辫肠补苍介绍自己的应用开发平台础辫辫肠补苍介绍自己的应用开发平台
础辫辫肠补苍介绍自己的应用开发平台
MOBINODE
?
App發展趨勢與語音搜尋應用 201203
App發展趨勢與語音搜尋應用 201203App發展趨勢與語音搜尋應用 201203
App發展趨勢與語音搜尋應用 201203
Blanc Chen
?
App發展趨勢與語音搜尋應用 201203
App發展趨勢與語音搜尋應用 201203App發展趨勢與語音搜尋應用 201203
App發展趨勢與語音搜尋應用 201203
Blanc Chen
?
Mobile app2012 topology
Mobile app2012 topologyMobile app2012 topology
Mobile app2012 topology
Blanc Chen
?
App發展趨勢與語音搜尋應用 201203
App發展趨勢與語音搜尋應用 201203App發展趨勢與語音搜尋應用 201203
App發展趨勢與語音搜尋應用 201203
Blanc Chen
?
础辫辫肠补苍移动应用开发平台介绍120409
础辫辫肠补苍移动应用开发平台介绍120409础辫辫肠补苍移动应用开发平台介绍120409
础辫辫肠补苍移动应用开发平台介绍120409
zhengyiwuxian
?
快速生成FAQ Bot - 使用Azure Language Service LanguageService-03-FAQbot (微軟)(鐘祥仁)(20...
快速生成FAQ Bot - 使用Azure Language Service LanguageService-03-FAQbot (微軟)(鐘祥仁)(20...快速生成FAQ Bot - 使用Azure Language Service LanguageService-03-FAQbot (微軟)(鐘祥仁)(20...
快速生成FAQ Bot - 使用Azure Language Service LanguageService-03-FAQbot (微軟)(鐘祥仁)(20...
AllenLi78
?
础辫辫肠补苍平台介绍
础辫辫肠补苍平台介绍础辫辫肠补苍平台介绍
础辫辫肠补苍平台介绍
36Kr.com
?
台北食记推广心法分享
台北食记推广心法分享台北食记推广心法分享
台北食记推广心法分享
PunApp
?
第一次 Mobile App 就上手
第一次 Mobile App 就上手第一次 Mobile App 就上手
第一次 Mobile App 就上手
Ying-Hsiang Liao
?
鼎钧数位行销础辫辫营运实务全攻略
鼎钧数位行销础辫辫营运实务全攻略鼎钧数位行销础辫辫营运实务全攻略
鼎钧数位行销础辫辫营运实务全攻略
淳甫 鄭
?
July 2021, 台灣金融業 AI 語音發展 (杭志明 Ryan | 2021 Tech Open Sharing, Workshop)
July 2021, 台灣金融業 AI 語音發展 (杭志明 Ryan | 2021 Tech Open Sharing, Workshop)July 2021, 台灣金融業 AI 語音發展 (杭志明 Ryan | 2021 Tech Open Sharing, Workshop)
July 2021, 台灣金融業 AI 語音發展 (杭志明 Ryan | 2021 Tech Open Sharing, Workshop)
Ryan Hang
?
移动互联网时代的语音云
移动互联网时代的语音云移动互联网时代的语音云
移动互联网时代的语音云
csdnmobile
?
讯飞语音云及示范应用讯飞语点
讯飞语音云及示范应用讯飞语点讯飞语音云及示范应用讯飞语点
讯飞语音云及示范应用讯飞语点
geekparknet
?
AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM [ 說明含影片連結 ]
AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM [ 說明含影片連結 ]AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM [ 說明含影片連結 ]
AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM [ 說明含影片連結 ]
olami.ai
?
第18期极客活动-有道词典
第18期极客活动-有道词典第18期极客活动-有道词典
第18期极客活动-有道词典
geekparknet
?
AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM
AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUMAI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM
AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM
Ryan Hang
?
Android 系統的歷史、發展策略與技術創新 v1.1.0
Android 系統的歷史、發展策略與技術創新 v1.1.0Android 系統的歷史、發展策略與技術創新 v1.1.0
Android 系統的歷史、發展策略與技術創新 v1.1.0
信宏 陳
?
2011/08/20跨平台行動應用程式使用者介面開發—以titanium mobile為例
2011/08/20跨平台行動應用程式使用者介面開發—以titanium mobile為例2011/08/20跨平台行動應用程式使用者介面開發—以titanium mobile為例
2011/08/20跨平台行動應用程式使用者介面開發—以titanium mobile為例
Justin Lee
?
行动与云端科技在图书馆的应用
行动与云端科技在图书馆的应用行动与云端科技在图书馆的应用
行动与云端科技在图书馆的应用
皓仁 柯
?
础辫辫肠补苍介绍自己的应用开发平台
础辫辫肠补苍介绍自己的应用开发平台础辫辫肠补苍介绍自己的应用开发平台
础辫辫肠补苍介绍自己的应用开发平台
MOBINODE
?
App發展趨勢與語音搜尋應用 201203
App發展趨勢與語音搜尋應用 201203App發展趨勢與語音搜尋應用 201203
App發展趨勢與語音搜尋應用 201203
Blanc Chen
?
App發展趨勢與語音搜尋應用 201203
App發展趨勢與語音搜尋應用 201203App發展趨勢與語音搜尋應用 201203
App發展趨勢與語音搜尋應用 201203
Blanc Chen
?
Mobile app2012 topology
Mobile app2012 topologyMobile app2012 topology
Mobile app2012 topology
Blanc Chen
?
App發展趨勢與語音搜尋應用 201203
App發展趨勢與語音搜尋應用 201203App發展趨勢與語音搜尋應用 201203
App發展趨勢與語音搜尋應用 201203
Blanc Chen
?
础辫辫肠补苍移动应用开发平台介绍120409
础辫辫肠补苍移动应用开发平台介绍120409础辫辫肠补苍移动应用开发平台介绍120409
础辫辫肠补苍移动应用开发平台介绍120409
zhengyiwuxian
?
快速生成FAQ Bot - 使用Azure Language Service LanguageService-03-FAQbot (微軟)(鐘祥仁)(20...
快速生成FAQ Bot - 使用Azure Language Service LanguageService-03-FAQbot (微軟)(鐘祥仁)(20...快速生成FAQ Bot - 使用Azure Language Service LanguageService-03-FAQbot (微軟)(鐘祥仁)(20...
快速生成FAQ Bot - 使用Azure Language Service LanguageService-03-FAQbot (微軟)(鐘祥仁)(20...
AllenLi78
?
础辫辫肠补苍平台介绍
础辫辫肠补苍平台介绍础辫辫肠补苍平台介绍
础辫辫肠补苍平台介绍
36Kr.com
?
台北食记推广心法分享
台北食记推广心法分享台北食记推广心法分享
台北食记推广心法分享
PunApp
?
第一次 Mobile App 就上手
第一次 Mobile App 就上手第一次 Mobile App 就上手
第一次 Mobile App 就上手
Ying-Hsiang Liao
?
鼎钧数位行销础辫辫营运实务全攻略
鼎钧数位行销础辫辫营运实务全攻略鼎钧数位行销础辫辫营运实务全攻略
鼎钧数位行销础辫辫营运实务全攻略
淳甫 鄭
?
July 2021, 台灣金融業 AI 語音發展 (杭志明 Ryan | 2021 Tech Open Sharing, Workshop)
July 2021, 台灣金融業 AI 語音發展 (杭志明 Ryan | 2021 Tech Open Sharing, Workshop)July 2021, 台灣金融業 AI 語音發展 (杭志明 Ryan | 2021 Tech Open Sharing, Workshop)
July 2021, 台灣金融業 AI 語音發展 (杭志明 Ryan | 2021 Tech Open Sharing, Workshop)
Ryan Hang
?

More from rogeryi (7)

Layout Management - Android and Qt
Layout Management - Android and QtLayout Management - Android and Qt
Layout Management - Android and Qt
rogeryi
?
Character Encoding - Concepts and Practices
Character Encoding - Concepts and PracticesCharacter Encoding - Concepts and Practices
Character Encoding - Concepts and Practices
rogeryi
?
Java Memory Tips&Tricks
Java Memory Tips&TricksJava Memory Tips&Tricks
Java Memory Tips&Tricks
rogeryi
?
Build local web server in 5 minutes with mongoose
Build local web server in 5 minutes with mongooseBuild local web server in 5 minutes with mongoose
Build local web server in 5 minutes with mongoose
rogeryi
?
Android Event Retrospect
Android Event RetrospectAndroid Event Retrospect
Android Event Retrospect
rogeryi
?
Android event retrospect
Android event retrospectAndroid event retrospect
Android event retrospect
rogeryi
?
Android Event 02-02-2011 Retrospect
Android Event 02-02-2011 RetrospectAndroid Event 02-02-2011 Retrospect
Android Event 02-02-2011 Retrospect
rogeryi
?
Layout Management - Android and Qt
Layout Management - Android and QtLayout Management - Android and Qt
Layout Management - Android and Qt
rogeryi
?
Character Encoding - Concepts and Practices
Character Encoding - Concepts and PracticesCharacter Encoding - Concepts and Practices
Character Encoding - Concepts and Practices
rogeryi
?
Java Memory Tips&Tricks
Java Memory Tips&TricksJava Memory Tips&Tricks
Java Memory Tips&Tricks
rogeryi
?
Build local web server in 5 minutes with mongoose
Build local web server in 5 minutes with mongooseBuild local web server in 5 minutes with mongoose
Build local web server in 5 minutes with mongoose
rogeryi
?
Android Event Retrospect
Android Event RetrospectAndroid Event Retrospect
Android Event Retrospect
rogeryi
?
Android event retrospect
Android event retrospectAndroid event retrospect
Android event retrospect
rogeryi
?
Android Event 02-02-2011 Retrospect
Android Event 02-02-2011 RetrospectAndroid Event 02-02-2011 Retrospect
Android Event 02-02-2011 Retrospect
rogeryi
?

Voice recognization in Android

  • 1. Voice Recognization in Android Roger yixx@ucweb.com roger2yi@gmail.com www.twitter.com/roger2yi https://plus.google.com/
  • 2. Voice Recognization ? 语音识别目前在应用上可以分作两个层次 – 语音识别:将语音识别成文本(Speech To Text) – 自然语言理解:对语音进行分析,理解用户的 实际意图 ? 前者主要用于语音输入,而后者主要用于 像智能助手这样的辅助软件 2011-10-20 Roger, UC
  • 4. 骋辞辞驳濒别拼音输入法(础苍诲谤辞颈诲) 拼音输入法(Android Google拼音输入法( Android) 2011-10-20 Roger, UC
  • 5. 讯飞语音输入法(础苍诲谤辞颈诲) 讯飞语音输入法(Android Android) 2011-10-20 5
  • 6. Nuance T9 Flex输入法(Android) 输入法(Android Flex输入法( Android) 2011-10-20 Roger, UC
  • 7. Google Voice Search(Android) Search( Android) ? 支持简单的自然语言 理解,可以用于搜 索,拨打电话,发邮 件,导航等 ? 支持中文的语音识别 ? 目前不支持中文的意 图识别,中文语音输 入只能用于搜索 2011-10-20 Roger, UC
  • 8. 痴濒颈苍驳辞(础苍诲谤辞颈诲,颈翱厂) Vlingo( Android, iOS) ? 支持简单的自然语言 理解,可以用于搜 索,拨打电话,发邮 件,导航,调用系统 服务等 ? 支持中文的意图识别 2011-10-20 Roger, UC
  • 9. 厂颈谤颈(颈翱厂) 厂颈谤颈(颈翱厂) ? 支持较为复杂的自然 语言理解,可以用于 搜索,拨打电话,发 邮件,导航,调用系 统服务等 ? 支持陪聊? ? 目前不支持中文语音 识别 2011-10-20 Roger, UC
  • 10. Android Voice API ? Android SDK本身包括了一个简单的语音识 别的API接口,提供语音识别功能的应用可 以注册自己的服务,而需要语音识别功能 的应用可以通过Intent调用这些服务 ? 在安装Google Voice Search和Vlingo之 后,它们都会注册自己的语音识别服务到 系统里面提供给第三方调用,除了Service 外,Google Voice Search还会提供一个 Activity供直接使用 2011-10-20 Roger, UC
  • 11. Cont. ? 第三方程序可以使用Activity或者Service来 获得语音识别的能力 ? 海豚浏览器在检查到安装了Google Voice Search之后会增加使用Google Voice的服 务来进行语音输入的功能(用于搜索) 2011-10-20 Roger, UC
  • 12. private void startVoiceRecognitionActivity() { //通过Intent传递语音识别的模式,开启语音 Intent intent = new Intent( RecognizerIntent.ACTION_RECOGNIZE_SPEECH); //语言模式和自由形式的语音识别 intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL, RecognizerIntent.LANGUAGE_MODEL_WEB_SEARCH); //提示语音开始 intent.putExtra(RecognizerIntent.EXTRA_PROMPT, ""); //开始执行我们的Intent、语音识别 startActivityForResult(intent, VOICE_RECOGNITION_REQUEST_CODE); } 2011-10-20 Roger, UC
  • 13. 云端识别 ? 语音识别和语言理解大都是在服务器端进行的, 本地只是负责把语音数据打包传送给服务器,然 后再接收服务器传回的数据 ? 第三方应用使用Google Voice或者Vlingo提供的 语音识别服务,也是通过它们的服务器进行识别 ? 跟iOS已经整合在一起的Siri也是一样,它使用的 Nuance的语音识别引擎和WolframAlpha搜索引 擎,也是部署在服务器端。 2011-10-20 Roger, UC
  • 14. 本地识别 ? Android系统内置了一个Nuance SREC的本地语音 识别引擎,但只支持识别特定的指令而不是任意 的语音输入,并且这部分的API是私有的,意味不 能够安全地使用它 ? Android系统自带的语音拨号应用使用了这个库, 但是只支持简单的英文指令如“Call”,“Open”, “Redial”等 ? Android4.0提供了内置的连续语音输入功能,但 是不知道是否是在本地识别,并且是否公开API 2011-10-20 Roger, UC
  • 15. Reference ? http://developer.android.com/resources/article s/speech-input.html ? http://googlemobile.blogspot.com/2010/08/just -speak-it-introducing-voice-actions.html ? http://dmfs.org/handsfree/?engines ? http://www.vlingo.com/demo/videos ? http://www.nuance.com/ 2011-10-20 Roger, UC
  • 16. The End Thank you for your listening Yours Sincerely, Roger