狠狠撸

狠狠撸Share a Scribd company logo
—
2017/3/12
2
?
Deep Semantic Feature ?
Sentence Sentence
Embedding
Video
Embedding
Web Images
Embedding Space
Video
“A baby is playing a guitar.”
Image Search
?
Deep Semantic Feature
?
- Xu et al., “Show, attend and tell: Neural image caption generation
with visual attention,” in Proc. ICML 2015.
?
- Grave, Wayne, et al., “Hybrid computing using a neural network with
dynamic external memory,” Nature, vol. 2538, pp.471—476, 2016.
? Adversarial Examples
- Goodfellow, et al., “Exmpaining and harnessing adversarial
examples,” in Proc. ICLR 2015.
3
? Xu, Ba, Kiros, Cho, Courville, Salakhutdinov, Zemel, and Bengio?
“Show, attend and tell: Neural image caption generation with visual attention”?
Proc. ICML 2015
?
? (?)
5
Images from: [Xu et al. 2015]
6
?
?
?
? Visual Question Answering
?
7
Q: what are racing down the?
track with their jockies?
A: horses
?
-
-
?
8Image from: [Nakashima et al. 2012]
? Grave, Wayne, et al. ?
“Hybrid computing using a neural network with dynamic external memory” ?
Nature, vol. 2538, pp.471—476, 2016
Differentiable neural computer (DCN)
10
Image from: [Grave et al. 2016]
?
- ?
? ?
DCN
11
:
: ?
Controller
Image from: [Grave et al. 2016]
? RNN
/
- 3D-CNN
- Mean/Max pooling
?
-
-
12
Adversarial examples
? Goodfellow, Shlens, and Szegedy?
“Exmpaining and harnessing adversarial examples”?
Proc. ICLR 2015.
Adversarial examples?
?
DNN
14
Images from: [Goodfellow et al. 2015]
? DNN
?
?
15
?
?
?
16
? Microsoft Research Video Description Corpus
? > 2000 Video and descriptions
? TVD: a reproducible and multiply aligned TV series dataset
? Big Bang Theory Games of Thrones
? MSR VTT
? > 1M video and description pairs
? MPII Movie Description Dataset
? > 100K clip and description pairs
? YouTube 8M
?
? SumMe
? TVSum
? UG Video Dataset
17

More Related Content

Viewers also liked (12)

多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
自然言语処理分野の最前线(ステアラボ人工知能シンポジウム2017)
自然言语処理分野の最前线(ステアラボ人工知能シンポジウム2017)自然言语処理分野の最前线(ステアラボ人工知能シンポジウム2017)
自然言语処理分野の最前线(ステアラボ人工知能シンポジウム2017)
STAIR Lab, Chiba Institute of Technology
?
Higher-order Factorization Machines(第5回ステアラボ人工知能セミナー)
Higher-order Factorization Machines(第5回ステアラボ人工知能セミナー)Higher-order Factorization Machines(第5回ステアラボ人工知能セミナー)
Higher-order Factorization Machines(第5回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
知識グラフの埋め込みとその応用 (第10回ステアラボ人工知能セミナー)
知識グラフの埋め込みとその応用 (第10回ステアラボ人工知能セミナー)知識グラフの埋め込みとその応用 (第10回ステアラボ人工知能セミナー)
知識グラフの埋め込みとその応用 (第10回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
高次元空間におけるハブの出現 (第11回ステアラボ人工知能セミナー)
高次元空間におけるハブの出現 (第11回ステアラボ人工知能セミナー)高次元空間におけるハブの出現 (第11回ステアラボ人工知能セミナー)
高次元空間におけるハブの出現 (第11回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
群众の知を引き出すための机械学习(第4回ステアラボ人工知能セミナー)
群众の知を引き出すための机械学习(第4回ステアラボ人工知能セミナー)群众の知を引き出すための机械学习(第4回ステアラボ人工知能セミナー)
群众の知を引き出すための机械学习(第4回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
JSAI Cup2017報告会
JSAI Cup2017報告会JSAI Cup2017報告会
JSAI Cup2017報告会
STAIR Lab, Chiba Institute of Technology
?
第1回ステアラボ人工知能セミナー(オープニング)
第1回ステアラボ人工知能セミナー(オープニング)第1回ステアラボ人工知能セミナー(オープニング)
第1回ステアラボ人工知能セミナー(オープニング)
STAIR Lab, Chiba Institute of Technology
?
时系列ビッグデータの特徴自动抽出とリアルタイム将来予测(第9回ステアラボ人工知能セミナー)
时系列ビッグデータの特徴自动抽出とリアルタイム将来予测(第9回ステアラボ人工知能セミナー)时系列ビッグデータの特徴自动抽出とリアルタイム将来予测(第9回ステアラボ人工知能セミナー)
时系列ビッグデータの特徴自动抽出とリアルタイム将来予测(第9回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
情報抽出入門 ?非構造化データを構造化させる技術?
情報抽出入門 ?非構造化データを構造化させる技術?情報抽出入門 ?非構造化データを構造化させる技術?
情報抽出入門 ?非構造化データを構造化させる技術?
Yuya Unno
?
深层学习による自然言语処理の研究动向
深层学习による自然言语処理の研究动向深层学习による自然言语処理の研究动向
深层学习による自然言语処理の研究动向
STAIR Lab, Chiba Institute of Technology
?
深层学习时代の自然言语処理
深层学习时代の自然言语処理深层学习时代の自然言语処理
深层学习时代の自然言语処理
Yuya Unno
?
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
自然言语処理分野の最前线(ステアラボ人工知能シンポジウム2017)
自然言语処理分野の最前线(ステアラボ人工知能シンポジウム2017)自然言语処理分野の最前线(ステアラボ人工知能シンポジウム2017)
自然言语処理分野の最前线(ステアラボ人工知能シンポジウム2017)
STAIR Lab, Chiba Institute of Technology
?
Higher-order Factorization Machines(第5回ステアラボ人工知能セミナー)
Higher-order Factorization Machines(第5回ステアラボ人工知能セミナー)Higher-order Factorization Machines(第5回ステアラボ人工知能セミナー)
Higher-order Factorization Machines(第5回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
知識グラフの埋め込みとその応用 (第10回ステアラボ人工知能セミナー)
知識グラフの埋め込みとその応用 (第10回ステアラボ人工知能セミナー)知識グラフの埋め込みとその応用 (第10回ステアラボ人工知能セミナー)
知識グラフの埋め込みとその応用 (第10回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
高次元空間におけるハブの出現 (第11回ステアラボ人工知能セミナー)
高次元空間におけるハブの出現 (第11回ステアラボ人工知能セミナー)高次元空間におけるハブの出現 (第11回ステアラボ人工知能セミナー)
高次元空間におけるハブの出現 (第11回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
群众の知を引き出すための机械学习(第4回ステアラボ人工知能セミナー)
群众の知を引き出すための机械学习(第4回ステアラボ人工知能セミナー)群众の知を引き出すための机械学习(第4回ステアラボ人工知能セミナー)
群众の知を引き出すための机械学习(第4回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
时系列ビッグデータの特徴自动抽出とリアルタイム将来予测(第9回ステアラボ人工知能セミナー)
时系列ビッグデータの特徴自动抽出とリアルタイム将来予测(第9回ステアラボ人工知能セミナー)时系列ビッグデータの特徴自动抽出とリアルタイム将来予测(第9回ステアラボ人工知能セミナー)
时系列ビッグデータの特徴自动抽出とリアルタイム将来予测(第9回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
情報抽出入門 ?非構造化データを構造化させる技術?
情報抽出入門 ?非構造化データを構造化させる技術?情報抽出入門 ?非構造化データを構造化させる技術?
情報抽出入門 ?非構造化データを構造化させる技術?
Yuya Unno
?
深层学习时代の自然言语処理
深层学习时代の自然言语処理深层学习时代の自然言语処理
深层学习时代の自然言语処理
Yuya Unno
?

More from STAIR Lab, Chiba Institute of Technology (7)

リアクティブプログラミングにおける時変値永続化の試み (第2回ステアラボソフトウェア技術セミナー)
リアクティブプログラミングにおける時変値永続化の試み (第2回ステアラボソフトウェア技術セミナー)リアクティブプログラミングにおける時変値永続化の試み (第2回ステアラボソフトウェア技術セミナー)
リアクティブプログラミングにおける時変値永続化の試み (第2回ステアラボソフトウェア技術セミナー)
STAIR Lab, Chiba Institute of Technology
?
制約解消によるプログラム検証?合成 (第1回ステアラボソフトウェア技術セミナー)
制約解消によるプログラム検証?合成 (第1回ステアラボソフトウェア技術セミナー)制約解消によるプログラム検証?合成 (第1回ステアラボソフトウェア技術セミナー)
制約解消によるプログラム検証?合成 (第1回ステアラボソフトウェア技術セミナー)
STAIR Lab, Chiba Institute of Technology
?
グラフ構造データに対する深層学習?創薬?材料科学への応用とその問題点? (第26回ステアラボ人工知能セミナー)
グラフ構造データに対する深層学習?創薬?材料科学への応用とその問題点? (第26回ステアラボ人工知能セミナー)グラフ構造データに対する深層学習?創薬?材料科学への応用とその問題点? (第26回ステアラボ人工知能セミナー)
グラフ構造データに対する深層学習?創薬?材料科学への応用とその問題点? (第26回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
公司化する大学と、公益化する公司。そして、人工知能の社会実装に向けて。(ステアラボ人工知能シンポジウム)
公司化する大学と、公益化する公司。そして、人工知能の社会実装に向けて。(ステアラボ人工知能シンポジウム)公司化する大学と、公益化する公司。そして、人工知能の社会実装に向けて。(ステアラボ人工知能シンポジウム)
公司化する大学と、公益化する公司。そして、人工知能の社会実装に向けて。(ステアラボ人工知能シンポジウム)
STAIR Lab, Chiba Institute of Technology
?
メテオサーチチャレンジ報告 (2位解法)
メテオサーチチャレンジ報告 (2位解法)メテオサーチチャレンジ報告 (2位解法)
メテオサーチチャレンジ報告 (2位解法)
STAIR Lab, Chiba Institute of Technology
?
画像キャプションと動作認識の最前線 ?データセットに注目して?(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 ?データセットに注目して?(第17回ステアラボ人工知能セミナー)画像キャプションと動作認識の最前線 ?データセットに注目して?(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 ?データセットに注目して?(第17回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
文法および流暢性を考慮した頑健なテキスト誤り訂正 (第15回ステアラボ人工知能セミナー)
文法および流暢性を考慮した頑健なテキスト誤り訂正 (第15回ステアラボ人工知能セミナー)文法および流暢性を考慮した頑健なテキスト誤り訂正 (第15回ステアラボ人工知能セミナー)
文法および流暢性を考慮した頑健なテキスト誤り訂正 (第15回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
リアクティブプログラミングにおける時変値永続化の試み (第2回ステアラボソフトウェア技術セミナー)
リアクティブプログラミングにおける時変値永続化の試み (第2回ステアラボソフトウェア技術セミナー)リアクティブプログラミングにおける時変値永続化の試み (第2回ステアラボソフトウェア技術セミナー)
リアクティブプログラミングにおける時変値永続化の試み (第2回ステアラボソフトウェア技術セミナー)
STAIR Lab, Chiba Institute of Technology
?
制約解消によるプログラム検証?合成 (第1回ステアラボソフトウェア技術セミナー)
制約解消によるプログラム検証?合成 (第1回ステアラボソフトウェア技術セミナー)制約解消によるプログラム検証?合成 (第1回ステアラボソフトウェア技術セミナー)
制約解消によるプログラム検証?合成 (第1回ステアラボソフトウェア技術セミナー)
STAIR Lab, Chiba Institute of Technology
?
グラフ構造データに対する深層学習?創薬?材料科学への応用とその問題点? (第26回ステアラボ人工知能セミナー)
グラフ構造データに対する深層学習?創薬?材料科学への応用とその問題点? (第26回ステアラボ人工知能セミナー)グラフ構造データに対する深層学習?創薬?材料科学への応用とその問題点? (第26回ステアラボ人工知能セミナー)
グラフ構造データに対する深層学習?創薬?材料科学への応用とその問題点? (第26回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
公司化する大学と、公益化する公司。そして、人工知能の社会実装に向けて。(ステアラボ人工知能シンポジウム)
公司化する大学と、公益化する公司。そして、人工知能の社会実装に向けて。(ステアラボ人工知能シンポジウム)公司化する大学と、公益化する公司。そして、人工知能の社会実装に向けて。(ステアラボ人工知能シンポジウム)
公司化する大学と、公益化する公司。そして、人工知能の社会実装に向けて。(ステアラボ人工知能シンポジウム)
STAIR Lab, Chiba Institute of Technology
?
画像キャプションと動作認識の最前線 ?データセットに注目して?(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 ?データセットに注目して?(第17回ステアラボ人工知能セミナー)画像キャプションと動作認識の最前線 ?データセットに注目して?(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 ?データセットに注目して?(第17回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?
文法および流暢性を考慮した頑健なテキスト誤り訂正 (第15回ステアラボ人工知能セミナー)
文法および流暢性を考慮した頑健なテキスト誤り訂正 (第15回ステアラボ人工知能セミナー)文法および流暢性を考慮した頑健なテキスト誤り訂正 (第15回ステアラボ人工知能セミナー)
文法および流暢性を考慮した頑健なテキスト誤り訂正 (第15回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
?

Recently uploaded (20)

DevNexus - Building 10x Development Organizations.pdf
DevNexus - Building 10x Development Organizations.pdfDevNexus - Building 10x Development Organizations.pdf
DevNexus - Building 10x Development Organizations.pdf
Justin Reock
?
EaseUS Partition Master Crack 2025 + Serial Key
EaseUS Partition Master Crack 2025 + Serial KeyEaseUS Partition Master Crack 2025 + Serial Key
EaseUS Partition Master Crack 2025 + Serial Key
kherorpacca127
?
Webinar: LF Energy GEISA: Addressing edge interoperability at the meter
Webinar: LF Energy GEISA: Addressing edge interoperability at the meterWebinar: LF Energy GEISA: Addressing edge interoperability at the meter
Webinar: LF Energy GEISA: Addressing edge interoperability at the meter
DanBrown980551
?
10 FinTech Solutions Every Business Should Know!.pdf
10 FinTech Solutions Every Business Should Know!.pdf10 FinTech Solutions Every Business Should Know!.pdf
10 FinTech Solutions Every Business Should Know!.pdf
Yodaplus Technologies Private Limited
?
MIND Revenue Release Quarter 4 2024 - Finacial Presentation
MIND Revenue Release Quarter 4 2024 - Finacial PresentationMIND Revenue Release Quarter 4 2024 - Finacial Presentation
MIND Revenue Release Quarter 4 2024 - Finacial Presentation
MIND CTI
?
Data-Driven Public Safety: Reliable Data When Every Second Counts
Data-Driven Public Safety: Reliable Data When Every Second CountsData-Driven Public Safety: Reliable Data When Every Second Counts
Data-Driven Public Safety: Reliable Data When Every Second Counts
Safe Software
?
Dev Dives: Unlock the future of automation with UiPath Agent Builder
Dev Dives: Unlock the future of automation with UiPath Agent BuilderDev Dives: Unlock the future of automation with UiPath Agent Builder
Dev Dives: Unlock the future of automation with UiPath Agent Builder
UiPathCommunity
?
Mastering ChatGPT & LLMs for Practical Applications: Tips, Tricks, and Use Cases
Mastering ChatGPT & LLMs for Practical Applications: Tips, Tricks, and Use CasesMastering ChatGPT & LLMs for Practical Applications: Tips, Tricks, and Use Cases
Mastering ChatGPT & LLMs for Practical Applications: Tips, Tricks, and Use Cases
Sanjay Willie
?
THE BIG TEN BIOPHARMACEUTICAL MNCs: GLOBAL CAPABILITY CENTERS IN INDIA
THE BIG TEN BIOPHARMACEUTICAL MNCs: GLOBAL CAPABILITY CENTERS IN INDIATHE BIG TEN BIOPHARMACEUTICAL MNCs: GLOBAL CAPABILITY CENTERS IN INDIA
THE BIG TEN BIOPHARMACEUTICAL MNCs: GLOBAL CAPABILITY CENTERS IN INDIA
Srivaanchi Nathan
?
Getting Started with AWS - Enterprise Landing Zone for Terraform Learning & D...
Getting Started with AWS - Enterprise Landing Zone for Terraform Learning & D...Getting Started with AWS - Enterprise Landing Zone for Terraform Learning & D...
Getting Started with AWS - Enterprise Landing Zone for Terraform Learning & D...
Chris Wahl
?
Cloud of everything Tech of the 21 century in Aviation
Cloud of everything Tech of the 21 century in AviationCloud of everything Tech of the 21 century in Aviation
Cloud of everything Tech of the 21 century in Aviation
Assem mousa
?
5 Best Agentic AI Frameworks for 2025.pdf
5 Best Agentic AI Frameworks for 2025.pdf5 Best Agentic AI Frameworks for 2025.pdf
5 Best Agentic AI Frameworks for 2025.pdf
SoluLab1231
?
AMER Introduction to ThousandEyes Webinar
AMER Introduction to ThousandEyes WebinarAMER Introduction to ThousandEyes Webinar
AMER Introduction to ThousandEyes Webinar
ThousandEyes
?
L01 Introduction to Nanoindentation - What is hardness
L01 Introduction to Nanoindentation - What is hardnessL01 Introduction to Nanoindentation - What is hardness
L01 Introduction to Nanoindentation - What is hardness
RostislavDaniel
?
[Webinar] Scaling Made Simple: Getting Started with No-Code Web Apps
[Webinar] Scaling Made Simple: Getting Started with No-Code Web Apps[Webinar] Scaling Made Simple: Getting Started with No-Code Web Apps
[Webinar] Scaling Made Simple: Getting Started with No-Code Web Apps
Safe Software
?
DealBook of Ukraine: 2025 edition | AVentures Capital
DealBook of Ukraine: 2025 edition | AVentures CapitalDealBook of Ukraine: 2025 edition | AVentures Capital
DealBook of Ukraine: 2025 edition | AVentures Capital
Yevgen Sysoyev
?
Build with AI on Google Cloud Session #3
Build with AI on Google Cloud Session #3Build with AI on Google Cloud Session #3
Build with AI on Google Cloud Session #3
Margaret Maynard-Reid
?
Caching for Performance Masterclass: Caching Strategies
Caching for Performance Masterclass: Caching StrategiesCaching for Performance Masterclass: Caching Strategies
Caching for Performance Masterclass: Caching Strategies
ScyllaDB
?
UiPath Agentic Automation Capabilities and Opportunities
UiPath Agentic Automation Capabilities and OpportunitiesUiPath Agentic Automation Capabilities and Opportunities
UiPath Agentic Automation Capabilities and Opportunities
DianaGray10
?
SECURE BLOCKCHAIN FOR ADMISSION PROCESSING IN EDUCATIONAL INSTITUTIONS.pdf
SECURE BLOCKCHAIN FOR ADMISSION PROCESSING IN EDUCATIONAL INSTITUTIONS.pdfSECURE BLOCKCHAIN FOR ADMISSION PROCESSING IN EDUCATIONAL INSTITUTIONS.pdf
SECURE BLOCKCHAIN FOR ADMISSION PROCESSING IN EDUCATIONAL INSTITUTIONS.pdf
spub1985
?
DevNexus - Building 10x Development Organizations.pdf
DevNexus - Building 10x Development Organizations.pdfDevNexus - Building 10x Development Organizations.pdf
DevNexus - Building 10x Development Organizations.pdf
Justin Reock
?
EaseUS Partition Master Crack 2025 + Serial Key
EaseUS Partition Master Crack 2025 + Serial KeyEaseUS Partition Master Crack 2025 + Serial Key
EaseUS Partition Master Crack 2025 + Serial Key
kherorpacca127
?
Webinar: LF Energy GEISA: Addressing edge interoperability at the meter
Webinar: LF Energy GEISA: Addressing edge interoperability at the meterWebinar: LF Energy GEISA: Addressing edge interoperability at the meter
Webinar: LF Energy GEISA: Addressing edge interoperability at the meter
DanBrown980551
?
MIND Revenue Release Quarter 4 2024 - Finacial Presentation
MIND Revenue Release Quarter 4 2024 - Finacial PresentationMIND Revenue Release Quarter 4 2024 - Finacial Presentation
MIND Revenue Release Quarter 4 2024 - Finacial Presentation
MIND CTI
?
Data-Driven Public Safety: Reliable Data When Every Second Counts
Data-Driven Public Safety: Reliable Data When Every Second CountsData-Driven Public Safety: Reliable Data When Every Second Counts
Data-Driven Public Safety: Reliable Data When Every Second Counts
Safe Software
?
Dev Dives: Unlock the future of automation with UiPath Agent Builder
Dev Dives: Unlock the future of automation with UiPath Agent BuilderDev Dives: Unlock the future of automation with UiPath Agent Builder
Dev Dives: Unlock the future of automation with UiPath Agent Builder
UiPathCommunity
?
Mastering ChatGPT & LLMs for Practical Applications: Tips, Tricks, and Use Cases
Mastering ChatGPT & LLMs for Practical Applications: Tips, Tricks, and Use CasesMastering ChatGPT & LLMs for Practical Applications: Tips, Tricks, and Use Cases
Mastering ChatGPT & LLMs for Practical Applications: Tips, Tricks, and Use Cases
Sanjay Willie
?
THE BIG TEN BIOPHARMACEUTICAL MNCs: GLOBAL CAPABILITY CENTERS IN INDIA
THE BIG TEN BIOPHARMACEUTICAL MNCs: GLOBAL CAPABILITY CENTERS IN INDIATHE BIG TEN BIOPHARMACEUTICAL MNCs: GLOBAL CAPABILITY CENTERS IN INDIA
THE BIG TEN BIOPHARMACEUTICAL MNCs: GLOBAL CAPABILITY CENTERS IN INDIA
Srivaanchi Nathan
?
Getting Started with AWS - Enterprise Landing Zone for Terraform Learning & D...
Getting Started with AWS - Enterprise Landing Zone for Terraform Learning & D...Getting Started with AWS - Enterprise Landing Zone for Terraform Learning & D...
Getting Started with AWS - Enterprise Landing Zone for Terraform Learning & D...
Chris Wahl
?
Cloud of everything Tech of the 21 century in Aviation
Cloud of everything Tech of the 21 century in AviationCloud of everything Tech of the 21 century in Aviation
Cloud of everything Tech of the 21 century in Aviation
Assem mousa
?
5 Best Agentic AI Frameworks for 2025.pdf
5 Best Agentic AI Frameworks for 2025.pdf5 Best Agentic AI Frameworks for 2025.pdf
5 Best Agentic AI Frameworks for 2025.pdf
SoluLab1231
?
AMER Introduction to ThousandEyes Webinar
AMER Introduction to ThousandEyes WebinarAMER Introduction to ThousandEyes Webinar
AMER Introduction to ThousandEyes Webinar
ThousandEyes
?
L01 Introduction to Nanoindentation - What is hardness
L01 Introduction to Nanoindentation - What is hardnessL01 Introduction to Nanoindentation - What is hardness
L01 Introduction to Nanoindentation - What is hardness
RostislavDaniel
?
[Webinar] Scaling Made Simple: Getting Started with No-Code Web Apps
[Webinar] Scaling Made Simple: Getting Started with No-Code Web Apps[Webinar] Scaling Made Simple: Getting Started with No-Code Web Apps
[Webinar] Scaling Made Simple: Getting Started with No-Code Web Apps
Safe Software
?
DealBook of Ukraine: 2025 edition | AVentures Capital
DealBook of Ukraine: 2025 edition | AVentures CapitalDealBook of Ukraine: 2025 edition | AVentures Capital
DealBook of Ukraine: 2025 edition | AVentures Capital
Yevgen Sysoyev
?
Build with AI on Google Cloud Session #3
Build with AI on Google Cloud Session #3Build with AI on Google Cloud Session #3
Build with AI on Google Cloud Session #3
Margaret Maynard-Reid
?
Caching for Performance Masterclass: Caching Strategies
Caching for Performance Masterclass: Caching StrategiesCaching for Performance Masterclass: Caching Strategies
Caching for Performance Masterclass: Caching Strategies
ScyllaDB
?
UiPath Agentic Automation Capabilities and Opportunities
UiPath Agentic Automation Capabilities and OpportunitiesUiPath Agentic Automation Capabilities and Opportunities
UiPath Agentic Automation Capabilities and Opportunities
DianaGray10
?
SECURE BLOCKCHAIN FOR ADMISSION PROCESSING IN EDUCATIONAL INSTITUTIONS.pdf
SECURE BLOCKCHAIN FOR ADMISSION PROCESSING IN EDUCATIONAL INSTITUTIONS.pdfSECURE BLOCKCHAIN FOR ADMISSION PROCESSING IN EDUCATIONAL INSTITUTIONS.pdf
SECURE BLOCKCHAIN FOR ADMISSION PROCESSING IN EDUCATIONAL INSTITUTIONS.pdf
spub1985
?

最近の重要な論文の紹介 - テキストとの対応付けによる映像の理解に関連して(ステアラボ人工知能シンポジウム2017)

  • 2. 2 ? Deep Semantic Feature ? Sentence Sentence Embedding Video Embedding Web Images Embedding Space Video “A baby is playing a guitar.” Image Search ? Deep Semantic Feature
  • 3. ? - Xu et al., “Show, attend and tell: Neural image caption generation with visual attention,” in Proc. ICML 2015. ? - Grave, Wayne, et al., “Hybrid computing using a neural network with dynamic external memory,” Nature, vol. 2538, pp.471—476, 2016. ? Adversarial Examples - Goodfellow, et al., “Exmpaining and harnessing adversarial examples,” in Proc. ICLR 2015. 3
  • 4. ? Xu, Ba, Kiros, Cho, Courville, Salakhutdinov, Zemel, and Bengio? “Show, attend and tell: Neural image caption generation with visual attention”? Proc. ICML 2015
  • 5. ? ? (?) 5 Images from: [Xu et al. 2015]
  • 6. 6
  • 7. ? ? ? ? Visual Question Answering ? 7 Q: what are racing down the? track with their jockies? A: horses
  • 9. ? Grave, Wayne, et al. ? “Hybrid computing using a neural network with dynamic external memory” ? Nature, vol. 2538, pp.471—476, 2016
  • 10. Differentiable neural computer (DCN) 10 Image from: [Grave et al. 2016]
  • 11. ? - ? ? ? DCN 11 : : ? Controller Image from: [Grave et al. 2016]
  • 12. ? RNN / - 3D-CNN - Mean/Max pooling ? - - 12
  • 13. Adversarial examples ? Goodfellow, Shlens, and Szegedy? “Exmpaining and harnessing adversarial examples”? Proc. ICLR 2015.
  • 17. ? Microsoft Research Video Description Corpus ? > 2000 Video and descriptions ? TVD: a reproducible and multiply aligned TV series dataset ? Big Bang Theory Games of Thrones ? MSR VTT ? > 1M video and description pairs ? MPII Movie Description Dataset ? > 100K clip and description pairs ? YouTube 8M ? ? SumMe ? TVSum ? UG Video Dataset 17