狠狠撸

狠狠撸Share a Scribd company logo
Data-Centric AI
データ中心のAIとは
2022.8
2
為安 圭介
https://linktr.ee/keisuketameyasu
経歴
札幌在住。
普段の仕事はシステム開発やチームマネジメントなど。
AIコミュニティ”CDLE”の運営にも携わる。
好きなこと
心地よい場で過ごすこと。あるいはそんな場を作ること。
友情とか努力とかチームワーク。
大事にしていること
楽(楽しいこと)
技(得意なスキルを発揮できること)
価(まわりに価値を提供できること)
益(利益を生むこと)
The Power of PowerPoint - thepopp.com
3
従来の考え方
Model-Centric AI
データ:固定
モデルを改良していく
新しい考え方
Data-Centric AI
モデル:固定
データを改良していく
AIトレンド
AIの第一人者であるアンドリュー?ンは、データが世
界を飲み込むようになる中、データの品質を格段に向
上させる必要があると考えている。彼は、「データは
AIの食糧だ」と言い、AI技術者はモデルやアルゴリズ
ムの構築よりも、モデルの学習に用いるデータの品質
向上を優先させるべきだと主張する。
4
アンドリュー?ン
アンドリュー?ヤン=タック?ンは、中国系アメリカ人の計算機科学者、人
工知能研究者、投資家、起業家、Google Brainの共同設立者、 Baiduの元副社
長兼チーフサイエンティスト、スタンフォード大学 兼担教授である。
※人工知能業界では知らない人がいない超有名人。
起業家
? https://www.deeplearning.ai/
? https://youtu.be/PySo_6S4ZAg?list=PLoROMvodv4rOABXSygHTsbvUz4G_YQhOb
5
なぜデータ中心
AIなのか
少ないが一貫性のあるクリーンなデータ
多いがノイズのあるデータ
データ収集
6
スコープ定義 モデル学習
Data Centric AIの成立には
常に高い品質のデータを確保するSystematicな仕組みが必須
デプロイ
MLOps
7
Data Centric AI開発においては、PDCAを回すようにデータを作成し改善することが重要となる。この場合、コードやアル
ゴリズムを固定化して、データを何度も修正して改善していくような形式で進めると良い。
データに重点を置く場合、データ収集工程では「データをどう定義し収集するか」モデル学習工程では「性能向上のために
はデータの修正がどれくらい必要か」デプロイ工程ではデータドリフトを追跡するためにはどのデータが必要か」というよ
うに、プロジェクトの全工程で体系的にデータの品質を管理する必要がある。
つまり、MLOpsチームは機械学習プロジェクトのライフサイクルを通して常に高品質なデータを保証する必要がある。
MLOps
The Power of PowerPoint - thepopp.com
8
01
03
02
定義が一貫している
Good Data 01
重要なケースをカバーしている
Good Data 02
サイズが適切である
Good Data 03
Big Dataから
Good Dataへ
SpecialThanks To
S.T, A.K, S.S, M.F, H.K
Y.Y
おわり

More Related Content

Similar to Deta-Centric AI (20)

情报システム部门の组织开発
 情报システム部门の组织开発 情报システム部门の组织开発
情报システム部门の组织开発
Kazutaka Sankai
?
リクルートライフスタイル流!分析基盘との贤い付き合い方
リクルートライフスタイル流!分析基盘との贤い付き合い方リクルートライフスタイル流!分析基盘との贤い付き合い方
リクルートライフスタイル流!分析基盘との贤い付き合い方
Recruit Lifestyle Co., Ltd.
?
データ分析基盘を支えるエンジニアリング
データ分析基盘を支えるエンジニアリングデータ分析基盘を支えるエンジニアリング
データ分析基盘を支えるエンジニアリング
Recruit Lifestyle Co., Ltd.
?
企業に広がる AI 活用 経営幹部の視点に学ぶ
企業に広がる AI 活用 経営幹部の視点に学ぶ企業に広がる AI 活用 経営幹部の視点に学ぶ
企業に広がる AI 活用 経営幹部の視点に学ぶ
NVIDIA Japan
?
Data × AI でどんな業務が改善できる? ?製造業様向け Data × AI 活用ユースケース & 製造MVPソリューションのご紹介
Data × AI でどんな業務が改善できる? ?製造業様向け Data × AI 活用ユースケース & 製造MVPソリューションのご紹介Data × AI でどんな業務が改善できる? ?製造業様向け Data × AI 活用ユースケース & 製造MVPソリューションのご紹介
Data × AI でどんな業務が改善できる? ?製造業様向け Data × AI 活用ユースケース & 製造MVPソリューションのご紹介
滨辞罢ビジネス共创ラボ
?
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Ryusuke Ashiya
?
やはりデータ設計は大切です 藤原紀章
やはりデータ設計は大切です 藤原紀章やはりデータ設計は大切です 藤原紀章
やはりデータ設計は大切です 藤原紀章
Noriaki Fujiwara
?
BPSttudy#84 アイデアをカタチにする方法
BPSttudy#84 アイデアをカタチにする方法BPSttudy#84 アイデアをカタチにする方法
BPSttudy#84 アイデアをカタチにする方法
Haruo Sato
?
ビッグデータ解析とクラウドの関係
ビッグデータ解析とクラウドの関係ビッグデータ解析とクラウドの関係
ビッグデータ解析とクラウドの関係
Satoshi Ishikawa
?
Microsoft 365 Day 基調講演
Microsoft 365 Day 基調講演Microsoft 365 Day 基調講演
Microsoft 365 Day 基調講演
日本マイクロソフト株式会社
?
株式会社ジール_採用ピッチ資料(2025.2.19)_zeal reuruitment pitch
株式会社ジール_採用ピッチ資料(2025.2.19)_zeal reuruitment pitch株式会社ジール_採用ピッチ資料(2025.2.19)_zeal reuruitment pitch
株式会社ジール_採用ピッチ資料(2025.2.19)_zeal reuruitment pitch
zeal32
?
株式会社ジール_採用ピッチ資料(2025.4.1)_zeal reuruitment pitch
株式会社ジール_採用ピッチ資料(2025.4.1)_zeal reuruitment pitch株式会社ジール_採用ピッチ資料(2025.4.1)_zeal reuruitment pitch
株式会社ジール_採用ピッチ資料(2025.4.1)_zeal reuruitment pitch
zeal32
?
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
BrainPad Inc.
?
How canwecollaboratew ithaiandbi-nttdata-tokai2019-0724-kubo
How canwecollaboratew ithaiandbi-nttdata-tokai2019-0724-kuboHow canwecollaboratew ithaiandbi-nttdata-tokai2019-0724-kubo
How canwecollaboratew ithaiandbi-nttdata-tokai2019-0724-kubo
Tomohiro Iwahashi
?
実演?开発の进め方
実演?开発の进め方実演?开発の进め方
実演?开発の进め方
TechGardenSchool
?
基调讲演:「多様化する情报を支える技术」/西川彻
基调讲演:「多様化する情报を支える技术」/西川彻基调讲演:「多様化する情报を支える技术」/西川彻
基调讲演:「多様化する情报を支える技术」/西川彻
Preferred Networks
?
オンライン講座を利用して機械学習?人工知能? データ分析の最適な学び方を学ぶ講座
オンライン講座を利用して機械学習?人工知能? データ分析の最適な学び方を学ぶ講座オンライン講座を利用して機械学習?人工知能? データ分析の最適な学び方を学ぶ講座
オンライン講座を利用して機械学習?人工知能? データ分析の最適な学び方を学ぶ講座
munjapan
?
Ezostyle WAN2010_02_21
Ezostyle WAN2010_02_21Ezostyle WAN2010_02_21
Ezostyle WAN2010_02_21
networkwan
?
础驳颈濒别2010とは何だったのか
础驳颈濒别2010とは何だったのか础驳颈濒别2010とは何だったのか
础驳颈濒别2010とは何だったのか
Dai FUJIHARA
?
[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか
[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか
[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか
Google Cloud Platform - Japan
?
情报システム部门の组织开発
 情报システム部门の组织开発 情报システム部门の组织开発
情报システム部门の组织开発
Kazutaka Sankai
?
リクルートライフスタイル流!分析基盘との贤い付き合い方
リクルートライフスタイル流!分析基盘との贤い付き合い方リクルートライフスタイル流!分析基盘との贤い付き合い方
リクルートライフスタイル流!分析基盘との贤い付き合い方
Recruit Lifestyle Co., Ltd.
?
データ分析基盘を支えるエンジニアリング
データ分析基盘を支えるエンジニアリングデータ分析基盘を支えるエンジニアリング
データ分析基盘を支えるエンジニアリング
Recruit Lifestyle Co., Ltd.
?
企業に広がる AI 活用 経営幹部の視点に学ぶ
企業に広がる AI 活用 経営幹部の視点に学ぶ企業に広がる AI 活用 経営幹部の視点に学ぶ
企業に広がる AI 活用 経営幹部の視点に学ぶ
NVIDIA Japan
?
Data × AI でどんな業務が改善できる? ?製造業様向け Data × AI 活用ユースケース & 製造MVPソリューションのご紹介
Data × AI でどんな業務が改善できる? ?製造業様向け Data × AI 活用ユースケース & 製造MVPソリューションのご紹介Data × AI でどんな業務が改善できる? ?製造業様向け Data × AI 活用ユースケース & 製造MVPソリューションのご紹介
Data × AI でどんな業務が改善できる? ?製造業様向け Data × AI 活用ユースケース & 製造MVPソリューションのご紹介
滨辞罢ビジネス共创ラボ
?
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Ryusuke Ashiya
?
やはりデータ設計は大切です 藤原紀章
やはりデータ設計は大切です 藤原紀章やはりデータ設計は大切です 藤原紀章
やはりデータ設計は大切です 藤原紀章
Noriaki Fujiwara
?
BPSttudy#84 アイデアをカタチにする方法
BPSttudy#84 アイデアをカタチにする方法BPSttudy#84 アイデアをカタチにする方法
BPSttudy#84 アイデアをカタチにする方法
Haruo Sato
?
ビッグデータ解析とクラウドの関係
ビッグデータ解析とクラウドの関係ビッグデータ解析とクラウドの関係
ビッグデータ解析とクラウドの関係
Satoshi Ishikawa
?
株式会社ジール_採用ピッチ資料(2025.2.19)_zeal reuruitment pitch
株式会社ジール_採用ピッチ資料(2025.2.19)_zeal reuruitment pitch株式会社ジール_採用ピッチ資料(2025.2.19)_zeal reuruitment pitch
株式会社ジール_採用ピッチ資料(2025.2.19)_zeal reuruitment pitch
zeal32
?
株式会社ジール_採用ピッチ資料(2025.4.1)_zeal reuruitment pitch
株式会社ジール_採用ピッチ資料(2025.4.1)_zeal reuruitment pitch株式会社ジール_採用ピッチ資料(2025.4.1)_zeal reuruitment pitch
株式会社ジール_採用ピッチ資料(2025.4.1)_zeal reuruitment pitch
zeal32
?
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
BrainPad Inc.
?
How canwecollaboratew ithaiandbi-nttdata-tokai2019-0724-kubo
How canwecollaboratew ithaiandbi-nttdata-tokai2019-0724-kuboHow canwecollaboratew ithaiandbi-nttdata-tokai2019-0724-kubo
How canwecollaboratew ithaiandbi-nttdata-tokai2019-0724-kubo
Tomohiro Iwahashi
?
基调讲演:「多様化する情报を支える技术」/西川彻
基调讲演:「多様化する情报を支える技术」/西川彻基调讲演:「多様化する情报を支える技术」/西川彻
基调讲演:「多様化する情报を支える技术」/西川彻
Preferred Networks
?
オンライン講座を利用して機械学習?人工知能? データ分析の最適な学び方を学ぶ講座
オンライン講座を利用して機械学習?人工知能? データ分析の最適な学び方を学ぶ講座オンライン講座を利用して機械学習?人工知能? データ分析の最適な学び方を学ぶ講座
オンライン講座を利用して機械学習?人工知能? データ分析の最適な学び方を学ぶ講座
munjapan
?
Ezostyle WAN2010_02_21
Ezostyle WAN2010_02_21Ezostyle WAN2010_02_21
Ezostyle WAN2010_02_21
networkwan
?
础驳颈濒别2010とは何だったのか
础驳颈濒别2010とは何だったのか础驳颈濒别2010とは何だったのか
础驳颈濒别2010とは何だったのか
Dai FUJIHARA
?
[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか
[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか
[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか
Google Cloud Platform - Japan
?

More from Keisuke Tameyasu (17)

ふりかえりを1枚で実施できる新フレームワーク(アジャイルレトロスペクティブズ2)
ふりかえりを1枚で実施できる新フレームワーク(アジャイルレトロスペクティブズ2)ふりかえりを1枚で実施できる新フレームワーク(アジャイルレトロスペクティブズ2)
ふりかえりを1枚で実施できる新フレームワーク(アジャイルレトロスペクティブズ2)
Keisuke Tameyasu
?
CDLE コミュニティ活動紹介(CDLE DAY 2022秋)
CDLE コミュニティ活動紹介(CDLE DAY 2022秋)CDLE コミュニティ活動紹介(CDLE DAY 2022秋)
CDLE コミュニティ活動紹介(CDLE DAY 2022秋)
Keisuke Tameyasu
?
人材版伊藤レポートサマリ.辫辫迟虫
人材版伊藤レポートサマリ.辫辫迟虫人材版伊藤レポートサマリ.辫辫迟虫
人材版伊藤レポートサマリ.辫辫迟虫
Keisuke Tameyasu
?
3谤诲颁翱惭惭鲍狈滨罢驰を创る
3谤诲颁翱惭惭鲍狈滨罢驰を创る3谤诲颁翱惭惭鲍狈滨罢驰を创る
3谤诲颁翱惭惭鲍狈滨罢驰を创る
Keisuke Tameyasu
?
CDLE VIEW(2022.3.26 CDLE DAY2022春)
CDLE VIEW(2022.3.26 CDLE DAY2022春)CDLE VIEW(2022.3.26 CDLE DAY2022春)
CDLE VIEW(2022.3.26 CDLE DAY2022春)
Keisuke Tameyasu
?
CDLE VIEW(2021.11.27 CDLE DAY2021秋)
CDLE VIEW(2021.11.27 CDLE DAY2021秋)CDLE VIEW(2021.11.27 CDLE DAY2021秋)
CDLE VIEW(2021.11.27 CDLE DAY2021秋)
Keisuke Tameyasu
?
CDLE VIEW(2020.11.28 CDLE DAY2020)
CDLE VIEW(2020.11.28 CDLE DAY2020)CDLE VIEW(2020.11.28 CDLE DAY2020)
CDLE VIEW(2020.11.28 CDLE DAY2020)
Keisuke Tameyasu
?
GRIT TEAMS -執着心をもってやり抜くチームの作り方
GRIT TEAMS -執着心をもってやり抜くチームの作り方GRIT TEAMS -執着心をもってやり抜くチームの作り方
GRIT TEAMS -執着心をもってやり抜くチームの作り方
Keisuke Tameyasu
?
今さら闻けない滨罢エンジニアのためのドラッカー
今さら闻けない滨罢エンジニアのためのドラッカー今さら闻けない滨罢エンジニアのためのドラッカー
今さら闻けない滨罢エンジニアのためのドラッカー
Keisuke Tameyasu
?
今さら闻けない滨罢エンジニアのための7つの习惯
今さら闻けない滨罢エンジニアのための7つの习惯今さら闻けない滨罢エンジニアのための7つの习惯
今さら闻けない滨罢エンジニアのための7つの习惯
Keisuke Tameyasu
?
今さら闻けない滨罢エンジニアのための管理会计
今さら闻けない滨罢エンジニアのための管理会计今さら闻けない滨罢エンジニアのための管理会计
今さら闻けない滨罢エンジニアのための管理会计
Keisuke Tameyasu
?
私のチームのリーダブルコード
私のチームのリーダブルコード私のチームのリーダブルコード
私のチームのリーダブルコード
Keisuke Tameyasu
?
今さら闻けない滨罢エンジニアのための人工知能
今さら闻けない滨罢エンジニアのための人工知能今さら闻けない滨罢エンジニアのための人工知能
今さら闻けない滨罢エンジニアのための人工知能
Keisuke Tameyasu
?
十二国记に学ぶ自分の心づくり
十二国记に学ぶ自分の心づくり十二国记に学ぶ自分の心づくり
十二国记に学ぶ自分の心づくり
Keisuke Tameyasu
?
チーム内で100%発生する问题に真正面から取り组む方法
チーム内で100%発生する问题に真正面から取り组む方法チーム内で100%発生する问题に真正面から取り组む方法
チーム内で100%発生する问题に真正面から取り组む方法
Keisuke Tameyasu
?
振り返り(アジャイルレトロスペクティブズ)
振り返り(アジャイルレトロスペクティブズ)振り返り(アジャイルレトロスペクティブズ)
振り返り(アジャイルレトロスペクティブズ)
Keisuke Tameyasu
?
良いチームを作るためのたった39の方法/ため
良いチームを作るためのたった39の方法/ため良いチームを作るためのたった39の方法/ため
良いチームを作るためのたった39の方法/ため
Keisuke Tameyasu
?
ふりかえりを1枚で実施できる新フレームワーク(アジャイルレトロスペクティブズ2)
ふりかえりを1枚で実施できる新フレームワーク(アジャイルレトロスペクティブズ2)ふりかえりを1枚で実施できる新フレームワーク(アジャイルレトロスペクティブズ2)
ふりかえりを1枚で実施できる新フレームワーク(アジャイルレトロスペクティブズ2)
Keisuke Tameyasu
?
CDLE コミュニティ活動紹介(CDLE DAY 2022秋)
CDLE コミュニティ活動紹介(CDLE DAY 2022秋)CDLE コミュニティ活動紹介(CDLE DAY 2022秋)
CDLE コミュニティ活動紹介(CDLE DAY 2022秋)
Keisuke Tameyasu
?
人材版伊藤レポートサマリ.辫辫迟虫
人材版伊藤レポートサマリ.辫辫迟虫人材版伊藤レポートサマリ.辫辫迟虫
人材版伊藤レポートサマリ.辫辫迟虫
Keisuke Tameyasu
?
3谤诲颁翱惭惭鲍狈滨罢驰を创る
3谤诲颁翱惭惭鲍狈滨罢驰を创る3谤诲颁翱惭惭鲍狈滨罢驰を创る
3谤诲颁翱惭惭鲍狈滨罢驰を创る
Keisuke Tameyasu
?
CDLE VIEW(2022.3.26 CDLE DAY2022春)
CDLE VIEW(2022.3.26 CDLE DAY2022春)CDLE VIEW(2022.3.26 CDLE DAY2022春)
CDLE VIEW(2022.3.26 CDLE DAY2022春)
Keisuke Tameyasu
?
CDLE VIEW(2021.11.27 CDLE DAY2021秋)
CDLE VIEW(2021.11.27 CDLE DAY2021秋)CDLE VIEW(2021.11.27 CDLE DAY2021秋)
CDLE VIEW(2021.11.27 CDLE DAY2021秋)
Keisuke Tameyasu
?
CDLE VIEW(2020.11.28 CDLE DAY2020)
CDLE VIEW(2020.11.28 CDLE DAY2020)CDLE VIEW(2020.11.28 CDLE DAY2020)
CDLE VIEW(2020.11.28 CDLE DAY2020)
Keisuke Tameyasu
?
GRIT TEAMS -執着心をもってやり抜くチームの作り方
GRIT TEAMS -執着心をもってやり抜くチームの作り方GRIT TEAMS -執着心をもってやり抜くチームの作り方
GRIT TEAMS -執着心をもってやり抜くチームの作り方
Keisuke Tameyasu
?
今さら闻けない滨罢エンジニアのためのドラッカー
今さら闻けない滨罢エンジニアのためのドラッカー今さら闻けない滨罢エンジニアのためのドラッカー
今さら闻けない滨罢エンジニアのためのドラッカー
Keisuke Tameyasu
?
今さら闻けない滨罢エンジニアのための7つの习惯
今さら闻けない滨罢エンジニアのための7つの习惯今さら闻けない滨罢エンジニアのための7つの习惯
今さら闻けない滨罢エンジニアのための7つの习惯
Keisuke Tameyasu
?
今さら闻けない滨罢エンジニアのための管理会计
今さら闻けない滨罢エンジニアのための管理会计今さら闻けない滨罢エンジニアのための管理会计
今さら闻けない滨罢エンジニアのための管理会计
Keisuke Tameyasu
?
私のチームのリーダブルコード
私のチームのリーダブルコード私のチームのリーダブルコード
私のチームのリーダブルコード
Keisuke Tameyasu
?
今さら闻けない滨罢エンジニアのための人工知能
今さら闻けない滨罢エンジニアのための人工知能今さら闻けない滨罢エンジニアのための人工知能
今さら闻けない滨罢エンジニアのための人工知能
Keisuke Tameyasu
?
十二国记に学ぶ自分の心づくり
十二国记に学ぶ自分の心づくり十二国记に学ぶ自分の心づくり
十二国记に学ぶ自分の心づくり
Keisuke Tameyasu
?
チーム内で100%発生する问题に真正面から取り组む方法
チーム内で100%発生する问题に真正面から取り组む方法チーム内で100%発生する问题に真正面から取り组む方法
チーム内で100%発生する问题に真正面から取り组む方法
Keisuke Tameyasu
?
振り返り(アジャイルレトロスペクティブズ)
振り返り(アジャイルレトロスペクティブズ)振り返り(アジャイルレトロスペクティブズ)
振り返り(アジャイルレトロスペクティブズ)
Keisuke Tameyasu
?
良いチームを作るためのたった39の方法/ため
良いチームを作るためのたった39の方法/ため良いチームを作るためのたった39の方法/ため
良いチームを作るためのたった39の方法/ため
Keisuke Tameyasu
?

Deta-Centric AI