狠狠撸

狠狠撸Share a Scribd company logo
自然语言处理介绍	
 ?
By	
 ?Mark	
 ?Chang	
 ?
自然語言處理	
 ?
?? 自然語言處理是人工智慧和語言學領域的分支	
 ?
–? 探討如何處理及運用自然語言	
 ?
?? 自然語言理解系統	
 ?
–? 把自然語言轉化為電腦易於處理的形式。	
 ?
?? 自然語言生成系統	
 ?
–? 把電腦程式數據轉化為自然語言。	
 ?
?? h,ps://zh.wikipedia.org/wiki/%E8%87%AA
%E7%84%B6%E8%AF%AD
%E8%A8%80%E5%A4%84%E7%90%86
	
 ?
機器翻譯	
 ?
https://translate.google.com/	
 ?
	
 ?
問答系統
www.wolframalpha.com	
 ?
資訊檢索
https://www.google.com	
 ?
	
 ?
輸入法選字
https://www.ptt.cc/bbs/StupidClown/M.1423419065.A.AF8.html	
 ?
自然語言處理流程
純文字
斷詞 	
 ?
句法剖析
語意剖析
 小明 騎 機車	
 ?
詞性標記	
 ?
 小明騎機車	
 ?
 小明(Nb) 騎(VC) 機車(Na)	
 ?
 小明(Nb) 騎(VC) 機車(Na)	
 ?
 騎(	
 ?小明,	
 ?機車 )	
 ?
中文斷詞 &詞性標記	
 ?
	
 ?
	
 ?	
 ?
http://ckipsvr.iis.sinica.edu.tw/	
 ?
	
 ?
小明(Nb) 騎(VC) 機車(Na)	
 ?
Nb:專有名詞	
 ?
VC:及物動詞	
 ?
Na:普通名詞	
 ?
句法結構剖析	
 ?
h,p://rocling.iis.sinica.edu.tw/CKIP/parser.htm	
 ?
	
 ?
語意剖析
	
 ?

 騎( 小明,	
 ?機車	
 ?)	
 ?
h,p://www.let.rug.nl/bos/comsem/	
 ?
	
 ?
	
 ?

一階邏輯(First	
 ?Order	
 ?Logic)	
 ?
騎:Predicate	
 ?
小明、機車:Argument	
 ?
自然語言處理的困難
?? 歧義(Ambiguity)	
 ?
發生於自然語言處理過程中的每個步驟	
 ?
–?斷詞歧義	
 ?
–?句法歧義	
 ?
–?…
斷詞歧義
http://3rd.mafengwo.cn/travels/info_weibo.php?
id=2861280	
 ?
	
 ?
http://www.appledaily.com.tw/realtimenews/
article/new/20151006/705309/	
 ?
	
 ?
句法結構歧義
http://www.phil.uu.nl/~yoad/synsem/lecture1/lecture1.html	
 ?

Tina	
 ?is	
 ?not	
 ?tall	
 ?and	
 ?thin.	
 ?
一字多義
h,ps://www.moedict.tw	
 ?
	
 ?
代名詞指涉(Anaphora	
 ?Resolu.on)
http://web.iiit.ac.in/~sharada.mohanty/content/anaphora-resolution	
 ?
自然語言處理相關領域
?? 語言學	
 ?
?? 統計學	
 ?
?? 機器學習(Machine	
 ?Learning)	
 ?
?? 資訊檢索(InformaXon	
 ?Retrieval)	
 ?
?? 資料探勘(Data	
 ?Mining)	
 ?
?? …	
 ?
相關課程
?? 台大:	
 ?
–?資工系 陳信希 自然語言處理	
 ?
?? Coursera:	
 ?
–?h,ps://www.coursera.org/course/nlp	
 ?
–?h,ps://www.coursera.org/course/nlangp	
 ?
–?h,ps://www.coursera.org/course/nlpintro	
 ?
講者資訊
?? Mark	
 ?Chang	
 ?
–? Blog	
 ?: h,p://cpmarkchang.logdown.com	
 ?
–? 狠狠撸share : h,p://www.slideshare.net/ckmarkohchang	
 ?
–? Github	
 ?: h,p://github.com/ckmarkoh	
 ?
–? email	
 ?: ckmarkoh	
 ?at	
 ?gmail.com

More Related Content

What's hot (16)

Microsoft Word программын дадлага ажлууд
Microsoft Word программын дадлага ажлуудMicrosoft Word программын дадлага ажлууд
Microsoft Word программын дадлага ажлууд
oyunerdene_gansukh
?
6 9 -r angi
6 9 -r angi6 9 -r angi
6 9 -r angi
Баярдалай Баатаржав
?
用十分鐘学会字串处理的那些事儿!
用十分鐘学会字串处理的那些事儿!用十分鐘学会字串处理的那些事儿!
用十分鐘学会字串处理的那些事儿!
鍾誠 陳鍾誠
?
???? ?????? ?? ????? ?????? ????? ???? ?????? ??????? ?1
  ???? ?????? ?? ????? ?????? ????? ???? ?????? ??????? ?1  ???? ?????? ?? ????? ?????? ????? ???? ?????? ??????? ?1
???? ?????? ?? ????? ?????? ????? ???? ?????? ??????? ?1
Free Courses
?
用十分鐘瞭解 新竹科學園區的發展史
用十分鐘瞭解  新竹科學園區的發展史用十分鐘瞭解  新竹科學園區的發展史
用十分鐘瞭解 新竹科學園區的發展史
鍾誠 陳鍾誠
?
專為程式人寫的神經網路導論 (以反傳遞演算法為入門磚)
專為程式人寫的神經網路導論  (以反傳遞演算法為入門磚) 專為程式人寫的神經網路導論  (以反傳遞演算法為入門磚)
專為程式人寫的神經網路導論 (以反傳遞演算法為入門磚)
鍾誠 陳鍾誠
?
用十分鐘《让你的专案一开始就搞砸》!
用十分鐘《让你的专案一开始就搞砸》!用十分鐘《让你的专案一开始就搞砸》!
用十分鐘《让你的专案一开始就搞砸》!
鍾誠 陳鍾誠
?
基礎からのCode Contracts
基礎からのCode Contracts基礎からのCode Contracts
基礎からのCode Contracts
Yoshifumi Kawai
?
RDBMS MySQL DB server
RDBMS MySQL DB serverRDBMS MySQL DB server
RDBMS MySQL DB server
Batzorigt Rentsen
?
????? ??? ?????????? ??????? ?????? ?????? ???????? ??????? ?? ????? 5 ????...
????? ??? ?????????? ??????? ?????? ?????? ???????? ???????   ?? ????? 5 ????...????? ??? ?????????? ??????? ?????? ?????? ???????? ???????   ?? ????? 5 ????...
????? ??? ?????????? ??????? ?????? ?????? ???????? ??????? ?? ????? 5 ????...
Massoud AlShareef
?
如何設計電腦 -- 還有讓電腦變快的那些方法
如何設計電腦  -- 還有讓電腦變快的那些方法如何設計電腦  -- 還有讓電腦變快的那些方法
如何設計電腦 -- 還有讓電腦變快的那些方法
鍾誠 陳鍾誠
?
如何用十分鐘快速瞭解一個程式語言 《以JavaScript和C語言為例》
如何用十分鐘快速瞭解一個程式語言  《以JavaScript和C語言為例》如何用十分鐘快速瞭解一個程式語言  《以JavaScript和C語言為例》
如何用十分鐘快速瞭解一個程式語言 《以JavaScript和C語言為例》
鍾誠 陳鍾誠
?
Astah Community スタートガイド
Astah Community スタートガイドAstah Community スタートガイド
Astah Community スタートガイド
ChangeVision
?
ソースコードレビューのススメ
ソースコードレビューのススメソースコードレビューのススメ
ソースコードレビューのススメ
KLab Inc. / Tech
?
Microsoft Word программын дадлага ажлууд
Microsoft Word программын дадлага ажлуудMicrosoft Word программын дадлага ажлууд
Microsoft Word программын дадлага ажлууд
oyunerdene_gansukh
?
用十分鐘学会字串处理的那些事儿!
用十分鐘学会字串处理的那些事儿!用十分鐘学会字串处理的那些事儿!
用十分鐘学会字串处理的那些事儿!
鍾誠 陳鍾誠
?
???? ?????? ?? ????? ?????? ????? ???? ?????? ??????? ?1
  ???? ?????? ?? ????? ?????? ????? ???? ?????? ??????? ?1  ???? ?????? ?? ????? ?????? ????? ???? ?????? ??????? ?1
???? ?????? ?? ????? ?????? ????? ???? ?????? ??????? ?1
Free Courses
?
用十分鐘瞭解 新竹科學園區的發展史
用十分鐘瞭解  新竹科學園區的發展史用十分鐘瞭解  新竹科學園區的發展史
用十分鐘瞭解 新竹科學園區的發展史
鍾誠 陳鍾誠
?
專為程式人寫的神經網路導論 (以反傳遞演算法為入門磚)
專為程式人寫的神經網路導論  (以反傳遞演算法為入門磚) 專為程式人寫的神經網路導論  (以反傳遞演算法為入門磚)
專為程式人寫的神經網路導論 (以反傳遞演算法為入門磚)
鍾誠 陳鍾誠
?
用十分鐘《让你的专案一开始就搞砸》!
用十分鐘《让你的专案一开始就搞砸》!用十分鐘《让你的专案一开始就搞砸》!
用十分鐘《让你的专案一开始就搞砸》!
鍾誠 陳鍾誠
?
基礎からのCode Contracts
基礎からのCode Contracts基礎からのCode Contracts
基礎からのCode Contracts
Yoshifumi Kawai
?
????? ??? ?????????? ??????? ?????? ?????? ???????? ??????? ?? ????? 5 ????...
????? ??? ?????????? ??????? ?????? ?????? ???????? ???????   ?? ????? 5 ????...????? ??? ?????????? ??????? ?????? ?????? ???????? ???????   ?? ????? 5 ????...
????? ??? ?????????? ??????? ?????? ?????? ???????? ??????? ?? ????? 5 ????...
Massoud AlShareef
?
如何設計電腦 -- 還有讓電腦變快的那些方法
如何設計電腦  -- 還有讓電腦變快的那些方法如何設計電腦  -- 還有讓電腦變快的那些方法
如何設計電腦 -- 還有讓電腦變快的那些方法
鍾誠 陳鍾誠
?
如何用十分鐘快速瞭解一個程式語言 《以JavaScript和C語言為例》
如何用十分鐘快速瞭解一個程式語言  《以JavaScript和C語言為例》如何用十分鐘快速瞭解一個程式語言  《以JavaScript和C語言為例》
如何用十分鐘快速瞭解一個程式語言 《以JavaScript和C語言為例》
鍾誠 陳鍾誠
?
Astah Community スタートガイド
Astah Community スタートガイドAstah Community スタートガイド
Astah Community スタートガイド
ChangeVision
?
ソースコードレビューのススメ
ソースコードレビューのススメソースコードレビューのススメ
ソースコードレビューのススメ
KLab Inc. / Tech
?

Similar to 自然语言处理介绍 (7)

Python in word cloud
Python in word cloudPython in word cloud
Python in word cloud
FEG
?
Statistical computing 00
Statistical computing 00Statistical computing 00
Statistical computing 00
Kevin Chun-Hsien Hsu
?
2021《芝麻开门——语音的声音开啟人类文明的无限空间》台大科学教育中心「探索科学讲座」
2021《芝麻开门——语音的声音开啟人类文明的无限空间》台大科学教育中心「探索科学讲座」2021《芝麻开门——语音的声音开啟人类文明的无限空间》台大科学教育中心「探索科学讲座」
2021《芝麻开门——语音的声音开啟人类文明的无限空间》台大科学教育中心「探索科学讲座」
linshanleearchive
?
第九章千年之際展望語料庫語言學 佩娟15
第九章千年之際展望語料庫語言學 佩娟15第九章千年之際展望語料庫語言學 佩娟15
第九章千年之際展望語料庫語言學 佩娟15
ungian iunn
?
芝麻开门:语音技术的前世今生
芝麻开门:语音技术的前世今生芝麻开门:语音技术的前世今生
芝麻开门:语音技术的前世今生
linshanleearchive
?
語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會
語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會
語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會
olami.ai
?
腾讯大讲堂49期 产物翻译面面谈
腾讯大讲堂49期 产物翻译面面谈腾讯大讲堂49期 产物翻译面面谈
腾讯大讲堂49期 产物翻译面面谈
George Ang
?
Python in word cloud
Python in word cloudPython in word cloud
Python in word cloud
FEG
?
2021《芝麻开门——语音的声音开啟人类文明的无限空间》台大科学教育中心「探索科学讲座」
2021《芝麻开门——语音的声音开啟人类文明的无限空间》台大科学教育中心「探索科学讲座」2021《芝麻开门——语音的声音开啟人类文明的无限空间》台大科学教育中心「探索科学讲座」
2021《芝麻开门——语音的声音开啟人类文明的无限空间》台大科学教育中心「探索科学讲座」
linshanleearchive
?
第九章千年之際展望語料庫語言學 佩娟15
第九章千年之際展望語料庫語言學 佩娟15第九章千年之際展望語料庫語言學 佩娟15
第九章千年之際展望語料庫語言學 佩娟15
ungian iunn
?
芝麻开门:语音技术的前世今生
芝麻开门:语音技术的前世今生芝麻开门:语音技术的前世今生
芝麻开门:语音技术的前世今生
linshanleearchive
?
語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會
語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會
語音人機互動在各個運算時代下的發展 | Feb. 2018 威盛 OLAMI | 智慧家庭生活服務業交流會
olami.ai
?
腾讯大讲堂49期 产物翻译面面谈
腾讯大讲堂49期 产物翻译面面谈腾讯大讲堂49期 产物翻译面面谈
腾讯大讲堂49期 产物翻译面面谈
George Ang
?

More from Mark Chang (20)

Modeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential EquationModeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential Equation
Mark Chang
?
Modeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential EquationModeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential Equation
Mark Chang
?
Information in the Weights
Information in the WeightsInformation in the Weights
Information in the Weights
Mark Chang
?
Information in the Weights
Information in the WeightsInformation in the Weights
Information in the Weights
Mark Chang
?
PAC Bayesian for Deep Learning
PAC Bayesian for Deep LearningPAC Bayesian for Deep Learning
PAC Bayesian for Deep Learning
Mark Chang
?
PAC-Bayesian Bound for Deep Learning
PAC-Bayesian Bound for Deep LearningPAC-Bayesian Bound for Deep Learning
PAC-Bayesian Bound for Deep Learning
Mark Chang
?
Domain Adaptation
Domain AdaptationDomain Adaptation
Domain Adaptation
Mark Chang
?
NTU ML TENSORFLOW
NTU ML TENSORFLOWNTU ML TENSORFLOW
NTU ML TENSORFLOW
Mark Chang
?
NTHU AI Reading Group: Improved Training of Wasserstein GANs
NTHU AI Reading Group: Improved Training of Wasserstein GANsNTHU AI Reading Group: Improved Training of Wasserstein GANs
NTHU AI Reading Group: Improved Training of Wasserstein GANs
Mark Chang
?
Generative Adversarial Networks
Generative Adversarial NetworksGenerative Adversarial Networks
Generative Adversarial Networks
Mark Chang
?
Applied Deep Learning 11/03 Convolutional Neural Networks
Applied Deep Learning 11/03 Convolutional Neural NetworksApplied Deep Learning 11/03 Convolutional Neural Networks
Applied Deep Learning 11/03 Convolutional Neural Networks
Mark Chang
?
The Genome Assembly Problem
The Genome Assembly ProblemThe Genome Assembly Problem
The Genome Assembly Problem
Mark Chang
?
DRAW: Deep Recurrent Attentive Writer
DRAW: Deep Recurrent Attentive WriterDRAW: Deep Recurrent Attentive Writer
DRAW: Deep Recurrent Attentive Writer
Mark Chang
?
浅谈深度学习
浅谈深度学习浅谈深度学习
浅谈深度学习
Mark Chang
?
Variational Autoencoder
Variational AutoencoderVariational Autoencoder
Variational Autoencoder
Mark Chang
?
TensorFlow 深度學習快速上手班--深度學習
 TensorFlow 深度學習快速上手班--深度學習 TensorFlow 深度學習快速上手班--深度學習
TensorFlow 深度學習快速上手班--深度學習
Mark Chang
?
TensorFlow 深度學習快速上手班--電腦視覺應用
TensorFlow 深度學習快速上手班--電腦視覺應用TensorFlow 深度學習快速上手班--電腦視覺應用
TensorFlow 深度學習快速上手班--電腦視覺應用
Mark Chang
?
TensorFlow 深度學習快速上手班--自然語言處理應用
TensorFlow 深度學習快速上手班--自然語言處理應用TensorFlow 深度學習快速上手班--自然語言處理應用
TensorFlow 深度學習快速上手班--自然語言處理應用
Mark Chang
?
TensorFlow 深度學習快速上手班--機器學習
TensorFlow 深度學習快速上手班--機器學習TensorFlow 深度學習快速上手班--機器學習
TensorFlow 深度學習快速上手班--機器學習
Mark Chang
?
Computational Linguistics week 10
 Computational Linguistics week 10 Computational Linguistics week 10
Computational Linguistics week 10
Mark Chang
?
Modeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential EquationModeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential Equation
Mark Chang
?
Modeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential EquationModeling the Dynamics of SGD by Stochastic Differential Equation
Modeling the Dynamics of SGD by Stochastic Differential Equation
Mark Chang
?
Information in the Weights
Information in the WeightsInformation in the Weights
Information in the Weights
Mark Chang
?
Information in the Weights
Information in the WeightsInformation in the Weights
Information in the Weights
Mark Chang
?
PAC Bayesian for Deep Learning
PAC Bayesian for Deep LearningPAC Bayesian for Deep Learning
PAC Bayesian for Deep Learning
Mark Chang
?
PAC-Bayesian Bound for Deep Learning
PAC-Bayesian Bound for Deep LearningPAC-Bayesian Bound for Deep Learning
PAC-Bayesian Bound for Deep Learning
Mark Chang
?
Domain Adaptation
Domain AdaptationDomain Adaptation
Domain Adaptation
Mark Chang
?
NTU ML TENSORFLOW
NTU ML TENSORFLOWNTU ML TENSORFLOW
NTU ML TENSORFLOW
Mark Chang
?
NTHU AI Reading Group: Improved Training of Wasserstein GANs
NTHU AI Reading Group: Improved Training of Wasserstein GANsNTHU AI Reading Group: Improved Training of Wasserstein GANs
NTHU AI Reading Group: Improved Training of Wasserstein GANs
Mark Chang
?
Generative Adversarial Networks
Generative Adversarial NetworksGenerative Adversarial Networks
Generative Adversarial Networks
Mark Chang
?
Applied Deep Learning 11/03 Convolutional Neural Networks
Applied Deep Learning 11/03 Convolutional Neural NetworksApplied Deep Learning 11/03 Convolutional Neural Networks
Applied Deep Learning 11/03 Convolutional Neural Networks
Mark Chang
?
The Genome Assembly Problem
The Genome Assembly ProblemThe Genome Assembly Problem
The Genome Assembly Problem
Mark Chang
?
DRAW: Deep Recurrent Attentive Writer
DRAW: Deep Recurrent Attentive WriterDRAW: Deep Recurrent Attentive Writer
DRAW: Deep Recurrent Attentive Writer
Mark Chang
?
浅谈深度学习
浅谈深度学习浅谈深度学习
浅谈深度学习
Mark Chang
?
Variational Autoencoder
Variational AutoencoderVariational Autoencoder
Variational Autoencoder
Mark Chang
?
TensorFlow 深度學習快速上手班--深度學習
 TensorFlow 深度學習快速上手班--深度學習 TensorFlow 深度學習快速上手班--深度學習
TensorFlow 深度學習快速上手班--深度學習
Mark Chang
?
TensorFlow 深度學習快速上手班--電腦視覺應用
TensorFlow 深度學習快速上手班--電腦視覺應用TensorFlow 深度學習快速上手班--電腦視覺應用
TensorFlow 深度學習快速上手班--電腦視覺應用
Mark Chang
?
TensorFlow 深度學習快速上手班--自然語言處理應用
TensorFlow 深度學習快速上手班--自然語言處理應用TensorFlow 深度學習快速上手班--自然語言處理應用
TensorFlow 深度學習快速上手班--自然語言處理應用
Mark Chang
?
TensorFlow 深度學習快速上手班--機器學習
TensorFlow 深度學習快速上手班--機器學習TensorFlow 深度學習快速上手班--機器學習
TensorFlow 深度學習快速上手班--機器學習
Mark Chang
?
Computational Linguistics week 10
 Computational Linguistics week 10 Computational Linguistics week 10
Computational Linguistics week 10
Mark Chang
?

自然语言处理介绍