狠狠撸

狠狠撸Share a Scribd company logo
1
NVIDIAとRed Hatの
AI対応プラットフォーム
Shingo Kitayama
レッドハット株式会社
Solution Architect
Copyright ? 2022 Red Hat, Inc. Red Hat, and the Red Hat logo are trademarks or registered trademarksof Red Hat, Inc.
NVIDIA AI Enterprise with OpenShift
NVIDIA AI Enterprise
NVIDIAが認定、ライセンス、サポートを提
供する包括的なクラウドネイティブAIソフト
ウェアスイートです。
Red Hat OpenShiftとNVIDIA-Certified
Systems上で動作することが認定されてい
ます。
Red Hat OpenShift
Red Hatが提供するエンタープライズ対応
のコンテナプラットフォームです。
フルスタックの自律運用と開発者向けのセ
ルフサービス?プロビジョニングを提供して
おり、クラウドやオンプレミスなど様々な環
境に対応しています。
ref. https://resources.nvidia.com/en-us-nvidia-ai-enterprise/nvaie-red-hat-overview
AI活用におけるRed Hat OpenShiftの魅力
インフラリソースへの
セルフサービスアクセス
Self-Service Access to
Infrastructure Resources
MLOpsパイプラインの
安全な自動化
Securely Automate MLOps Pipelines
Kubernetesを活用した
アプリケーション開発
Kubernetes-Powered
Application Development
コンテナ化されたAIツールやイ
ンフラリソースを利用するため
のセルフサービスと一貫したク
ラウド体験
OpenShift GitOpsやPipelines
を活用した機械学習パイプライ
ンにおける学習/推論フェーズ
の自動化機能の拡張
GPUに最適化されたコンテナイ
メージを使って、ML/DLモデル
を容易に開発?デプロイ?スケー
ルできる環境を提供
インフラリソースへの
セルフサービスアクセス
Self-Service Access to Infrastructure Resources
NVIDIA AI Enterprise Software Suite
OpenShiftでのRDMAおよびGPU
Direct RDMAワークロードを有効化し、
ネットワーク関連のNVIDIAコンポーネン
ト管理を自動化します
NVIDIA Network Operator
GPUのプロビジョニングに必要な
NVIDIA Driver、Kubernetes Device
PluginなどのNVIDIAソフトウェアコン
ポーネント管理を自動化します
NVIDIA GPU Operator
AIのCloud-Native Deployment
に欠かせないインフラリソース管理
の完全自動化
Self-Service Access to
Infrastructure Resources
GPUリソースの取り扱い
Self-Service Access to
Infrastructure Resources
仮想化におけるGPUリソースの取り扱い OpenShiftにおけるGPUリソースの取り扱い
NVIDIA-Certified Systems
NVIDIA GPU
Hypervisor
vGPU vGPU
Guest VM
NVIDIA Driver
Applications
Guest VM
NVIDIA Driver
Applications
NVIDIA Virtualization Software
NVIDIA-Certified Systems
NVIDIA GPU
GPU Operator
NVIDIA
Container Runtime
Container
Applications
NVIDIA Driver
NVIDIA GPU
NVIDIA Kubernetes
Device Plugin
NVIDIA GPU
Monitoring
Container
Applications
GPUリソース管理の
完全自動化
互換性維持の
複雑化
NVIDIA GPU Operator
NVIDIA-Certified Systems
Self-Service Access to
Infrastructure Resources
NVIDIA コンテナランタイムと連携し、コンテナを介して
NVIDIAドライバを提供します (*詳細)
NVIDIA Driver
Kubernetesクラスタの各ノードにあるGPUの状態を管理し、
コンテナ起動時のGPUを割り当てます
NVIDIA Kubernetes Device Plugin
DCGM(Data Center GPU Manager)-exporterを利用して、
NVIDIA GPUデバイスの監視(ヘルスモニタリング、ポリ
シー、グループ管理など)を行います
NVIDIA GPU Monitoring
Operator Framework
Self-Service Access to
Infrastructure Resources
ref. https://docs.nvidia.com/datacenter/cloud-native/gpu-operator/openshift/install-gpu-ocp.html#installing-the-nvidia-gpu-operator-by-using-the-web-console
OpenShift Web UIの「Operator Hub」から数クリックで導入できます
OpenShift Web UIにおける
GPUリソースの可視化
1クリックインストール
MLOpsパイプラインの
安全な自動化
Securely Automate MLOps Pipelines
MLOpsを支えるRed Hatのサービス
Securely Automate
MLOps Pipelines
(OpenShift Pipelines)
KubernetesネイティブなCI/CDパイ
プライン作成のフレームワーク
(Red Hat AMQ Streams)
スケーラビリティに優れた分散メッ
セージキュー
(Red Hat OpenShift Data Science)
AI/MLツール運用の自動化?セルフ
サービス化したセット
(Red Hat Quay)
分散型コンテナイメージレジストリ
(OpenShift GitOps)
KubernetesネイティブなGitOps
ベースのCDツール
(Red Hat OpenShift Data Foundation)
コンテナ専用のソフトウェア?デファ
インド?ストレージ(SDS)
MLOpsのパイプライン
Securely Automate
MLOps Pipelines
どのような機械学習モデルを作るためにも、データの準備と収集、モデルの開発(学習)、モデルの展開と兆候の監視
(推論)というサイクルは一貫しています
推論フェーズ
(Serving)
学習フェーズ
(Training)
Step.1 | Model Development
Step.2 | ML model trainingpipelines
Step.3| ML models servingpipelines
Step.4 | MonitoringValidation
学習(Model Training)フェーズ
Securely Automate
MLOps Pipelines
Data Store
Model
Development
ML
Model
Model
Store
Model
Image
Test
Step.2 | ML model training pipelines
Step.1 | Model Development
Red Hat OpenShift上の
Jupyter notebooksを使
い機械学習モデルを構
築します
【OpenShift Pipelines】
イベント駆動の継続的インテグレーションによって、機械学習モデルをコン
テナイメージ化します
? Saving: デプロイ準備ができたモデルをModel Storeに保存
? Converting: モデルをコンテナイメージに変換
? Testing: モデルのイメージをテストして機能を確認
? Storing: コンテナレジストリに確認済みのコンテナイメージを保存
Image
Registry
OpenShift Pipelines by
推論(Model Serving)フェーズ
Securely Automate
MLOps Pipelines
Configuration
Repository
(Manifests)
Trigger
ML Service
Intelligent
App
Step.4 | Monitoring validation
Step.3 | ML models serving pipelines
PrometheusやGrafana、サード
パーティツールを使い、学習モデ
ルによる推論のパフォーマンスを
監視し、必要に応じて再トレーニ
ングやデプロイを行います
【OpenShift GitOps】
マニフェストを監視し、機械学習モデルを安全にデプロイします
? Configuring: Gitリポジトリ経由での構成設定
? Monitoring:設定用マニフェストファイルの変更差分を監視
? Triggering: MLサービス上のモデルを更新
? Deploying: EdgeやDatacenter、クラウドなどに展開
Monitor
drift
OpenShift GitOps by
Deploy
Kubernetesを活用した
アプリケーション開発
Kubernetes-Powered Application Development
OpenShiftのInstall Type
Kubernetes-Powered
Application Development
NVIDIA-Certified Systems
NVIDIA GPU
RHEL
NVIDIA-Certified Systems
OpenShift
NVIDIA GPU
RHEL / RHCOS
NVIDIA-Certified Systems
OpenShift
NVIDIA GPU
RHEL / RHCOS
Hypervisor (VMware)
NVIDIA AI Enterprise
物理マシン
OS/Hypervisor
仮想マシン
TensorFlow PyTorch
NVIDIA AI Enterprise
TensorFlow PyTorch
NVIDIA AI Enterprise
TensorFlow PyTorch
Container
Orchestrator
Container
Container Runtime(Podman)
1. Virtualization 2. Bare-Metal
N/A N/A
AI開発のコンテナサポート
Kubernetes-Powered
Application Development
NVIDIA-Certified Systems
OpenShift
NVIDIA GPU
RHEL / RHCOS
NVIDIA AI Enterprise
TensorFlow PyTorch
NVIDIA AI Enterprise
に含まれるサポート サービス開発の
ランタイム
Application Runtimes
Python Java
AI開発専用の
フレームワーク
AI and data science
frameworks:
- TensorFlow
- PyTorch
- NVIDIA TAO Toolkit
- NVIDIA Triton
Inference Server
- NVIDIA TensorRT
- NVIDIA RAPIDS
Red Hat OpenShift
に含まれるサポート
Application Streams:
- PHP
- Python
- Perl
- Node.js
- Ruby
- OpenJDK
- Quarkus
- MySQL / MariaDB
etc…
NVIDIA AI Enterprise 2.0のサポートOS
Kubernetes-Powered
Application Development
ref. https://docs.nvidia.com/ai-enterprise/latest/product-support-matrix/index.html
Install Type Hypervisor or Bare-Metal OS Guest OS Support
Virtualization VMware vSphere Hypervisor (ESXi)
Enterprise Plus Edition 7.0 Update 2 or 3
> Ubuntu 20.04 LTS
> Red Hat Enterprise Linux 8.4
> Red Hat OpenShift 4.9
Virtualization VMware vSphere 6.7
Bare-Metal Ubuntu 20.04 LTS
Bare-Metal Red Hat Enterprise Linux 8.4
Bare-Metal Red Hat OpenShift 4.9 w/Red Hat Linux CoreOS (RHCOS)
Install Typeが仮想化(Virtualization)でもベアメタル(Bare-Metal)でも、コンテナ自体は「Ubuntu(20.04 LTS)」また
は「RHEL(8.4 or RHCOS)」の上で展開されることがサポート要件
RHELの恩恵によるトータルサポート
Kubernetes-Powered
Application Development
OpenShift
RHEL / RHCOS
Container
UBI
Applications
Container
UBI
Applications
Container Platform
Operation System
Container
Base Image
Applications
Container
Base Image
Applications
Container
Orchestration
OS
Container Image
コンテナイメージとして展開されるUBIは、RHEL(Red Hat Enterprise Linux)のライフサイクルに基づいてサポートさ
れます。
Universal Base Image
Red Hatのコンテナ実行環境を利
用する場合、UBIの使用を完全に
サポート
OpenShift
ホストOSであるRHEL/RHCOSの
サポートを含む
RHEL
コンテナランタイムとしての稼働を
サポート
ref. https://access.redhat.com/articles/2726611
Conclusion
NVIDIA AI Enterprise with OpenShift
NVIDIAとRed HatのAI対応プラットフォーム
NVIDIA AI Enterprise
NVIDIA-Certified Systems
インフラリソースへの
セルフサービスアクセス
Self-Service Access to
Infrastructure Resources
MLOpsパイプラインの
安全な自動化
Securely Automate MLOps Pipelines
Kubernetesを活用した
アプリケーション開発
Kubernetes-Powered
Application Development
linkedin.com/company/red-hat
youtube.com/user/RedHatVideos
facebook.com/redhatinc
twitter.com/RedHat
22
Thank you
Red Hat is the world’s leading provider of enterprise open source
software solutions. Award-winning support, training, and consulting
services make Red Hat a trusted adviser to the Fortune 500.
https://www.redhat.com/en/partners/nvidia
Ad

Recommended

PDF
Osc fukuoka xAI Meetup
ru pic
?
PDF
Open Source x AI
Tsukasa Kato
?
PDF
クラウト?ネイティフ?なサーハ?ー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
?
PDF
GPU Container as a Serviceを実現するための最新OSS徹底比較 - OpenStack最新情報セミナー 2017年7月
VirtualTech Japan Inc.
?
PDF
GPU Container as a Service を実現するための最新OSS徹底比較
NTT Communications Technology Development
?
PPTX
Why Red Hat (comparing with Vmware).pptx
shubhamage1
?
PPTX
Why Red Hat (comparing with Vmware).pptx
shubhamage1
?
PDF
OpenShift Origin Minishift (Beta)
Naoya Hashimoto
?
PDF
GPU と PYTHON と、それから最近の NVIDIA
NVIDIA Japan
?
PDF
OpenShiftでJBoss EAP構築
Daein Park
?
PDF
Jetson Xavier NX クラウドネイティブをエッジに
NVIDIA Japan
?
PDF
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
?
PPTX
<インフラ管理者向け>チームでの础滨开発を支援する础滨开発プラットフォーム碍础惭翱狈翱贬础厂贬滨
Kamonohashi
?
PPTX
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
Kamonohashi
?
PDF
2013.06.20 oss
Ryo Fujita
?
PPTX
20220302冲罢别肠丑顿辞箩辞冲翱辫别苍厂丑颈蹿迟冲叠辞辞迟颁补尘辫冲1章概要
Airi Furukawa
?
PDF
Openshift 20200109
Yasushi Osonoi
?
PDF
GDLC11 oracle-ai
Hirokuni Uchida
?
PDF
生成础滨时代を支えるプラットフォームー狈痴滨顿滨础/エンタープライズ事业本部事业本部长/井﨑武士
Tak Izaki
?
PDF
Java-minishift-20191123
Yasushi Osonoi
?
PPTX
2016 06-30-deep-learning-archi
Daisuke Nagao
?
PPTX
【日商USA】インフラ担当者向け AIインフラとEdge AI 最新トレンド
Sojitz Tech-Innovation USA
?
PPTX
EnOcean-iot, Generative-AI, and RAG for LLM
Atomu Hidaka
?
PDF
NGINX & OpenShift webinar for Energy Sector
NGINX, Inc.
?
PDF
Open stack reference architecture v1 2
Dell TechCenter Japan
?
PDF
Watsonをささえる ハイパフォーマンスクラウドで はじめるDeep Learning
Atsumori Sasaki
?
PDF
NVIDIA 入門
Wataru Unno
?
PDF
第162回情报処理学会ハイパフォーマンスコンピューティング研究発表会
Hitoshi Sato
?
PDF
vmware-certification-tracks-diagram.pdf
GnanaKumarBitra1
?
PDF
vmware-learning-paths.pdf
GnanaKumarBitra1
?

More Related Content

Similar to NVIDIA_AI_Enterprise_for_Red_Hat_OpenShift.pdf (20)

PDF
GPU と PYTHON と、それから最近の NVIDIA
NVIDIA Japan
?
PDF
OpenShiftでJBoss EAP構築
Daein Park
?
PDF
Jetson Xavier NX クラウドネイティブをエッジに
NVIDIA Japan
?
PDF
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
?
PPTX
<インフラ管理者向け>チームでの础滨开発を支援する础滨开発プラットフォーム碍础惭翱狈翱贬础厂贬滨
Kamonohashi
?
PPTX
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
Kamonohashi
?
PDF
2013.06.20 oss
Ryo Fujita
?
PPTX
20220302冲罢别肠丑顿辞箩辞冲翱辫别苍厂丑颈蹿迟冲叠辞辞迟颁补尘辫冲1章概要
Airi Furukawa
?
PDF
Openshift 20200109
Yasushi Osonoi
?
PDF
GDLC11 oracle-ai
Hirokuni Uchida
?
PDF
生成础滨时代を支えるプラットフォームー狈痴滨顿滨础/エンタープライズ事业本部事业本部长/井﨑武士
Tak Izaki
?
PDF
Java-minishift-20191123
Yasushi Osonoi
?
PPTX
2016 06-30-deep-learning-archi
Daisuke Nagao
?
PPTX
【日商USA】インフラ担当者向け AIインフラとEdge AI 最新トレンド
Sojitz Tech-Innovation USA
?
PPTX
EnOcean-iot, Generative-AI, and RAG for LLM
Atomu Hidaka
?
PDF
NGINX & OpenShift webinar for Energy Sector
NGINX, Inc.
?
PDF
Open stack reference architecture v1 2
Dell TechCenter Japan
?
PDF
Watsonをささえる ハイパフォーマンスクラウドで はじめるDeep Learning
Atsumori Sasaki
?
PDF
NVIDIA 入門
Wataru Unno
?
PDF
第162回情报処理学会ハイパフォーマンスコンピューティング研究発表会
Hitoshi Sato
?
GPU と PYTHON と、それから最近の NVIDIA
NVIDIA Japan
?
OpenShiftでJBoss EAP構築
Daein Park
?
Jetson Xavier NX クラウドネイティブをエッジに
NVIDIA Japan
?
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
?
<インフラ管理者向け>チームでの础滨开発を支援する础滨开発プラットフォーム碍础惭翱狈翱贬础厂贬滨
Kamonohashi
?
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
Kamonohashi
?
2013.06.20 oss
Ryo Fujita
?
20220302冲罢别肠丑顿辞箩辞冲翱辫别苍厂丑颈蹿迟冲叠辞辞迟颁补尘辫冲1章概要
Airi Furukawa
?
Openshift 20200109
Yasushi Osonoi
?
GDLC11 oracle-ai
Hirokuni Uchida
?
生成础滨时代を支えるプラットフォームー狈痴滨顿滨础/エンタープライズ事业本部事业本部长/井﨑武士
Tak Izaki
?
Java-minishift-20191123
Yasushi Osonoi
?
2016 06-30-deep-learning-archi
Daisuke Nagao
?
【日商USA】インフラ担当者向け AIインフラとEdge AI 最新トレンド
Sojitz Tech-Innovation USA
?
EnOcean-iot, Generative-AI, and RAG for LLM
Atomu Hidaka
?
NGINX & OpenShift webinar for Energy Sector
NGINX, Inc.
?
Open stack reference architecture v1 2
Dell TechCenter Japan
?
Watsonをささえる ハイパフォーマンスクラウドで はじめるDeep Learning
Atsumori Sasaki
?
NVIDIA 入門
Wataru Unno
?
第162回情报処理学会ハイパフォーマンスコンピューティング研究発表会
Hitoshi Sato
?

More from GnanaKumarBitra1 (8)

PDF
vmware-certification-tracks-diagram.pdf
GnanaKumarBitra1
?
PDF
vmware-learning-paths.pdf
GnanaKumarBitra1
?
PPTX
How to create a Datacenter in vCenter 7.0.pptx
GnanaKumarBitra1
?
PPTX
How to Install and Configure vCenter 7.0 U3 on VMware Workstation VM.pptx
GnanaKumarBitra1
?
PPTX
How to Install and Configure ESXi 7.0 U3 on VMware Workstation VM.pptx
GnanaKumarBitra1
?
PDF
VMware DCV_ICM_Architectural Differences, Virtual Machines, Guest OS Install
GnanaKumarBitra1
?
PDF
VMware DCV_ICM_Basic Server Fundamentals
GnanaKumarBitra1
?
PDF
How to provide a Private Cloud Solution Architecture with HPE & VMware
GnanaKumarBitra1
?
vmware-certification-tracks-diagram.pdf
GnanaKumarBitra1
?
vmware-learning-paths.pdf
GnanaKumarBitra1
?
How to create a Datacenter in vCenter 7.0.pptx
GnanaKumarBitra1
?
How to Install and Configure vCenter 7.0 U3 on VMware Workstation VM.pptx
GnanaKumarBitra1
?
How to Install and Configure ESXi 7.0 U3 on VMware Workstation VM.pptx
GnanaKumarBitra1
?
VMware DCV_ICM_Architectural Differences, Virtual Machines, Guest OS Install
GnanaKumarBitra1
?
VMware DCV_ICM_Basic Server Fundamentals
GnanaKumarBitra1
?
How to provide a Private Cloud Solution Architecture with HPE & VMware
GnanaKumarBitra1
?
Ad

NVIDIA_AI_Enterprise_for_Red_Hat_OpenShift.pdf

  • 1. 1 NVIDIAとRed Hatの AI対応プラットフォーム Shingo Kitayama レッドハット株式会社 Solution Architect Copyright ? 2022 Red Hat, Inc. Red Hat, and the Red Hat logo are trademarks or registered trademarksof Red Hat, Inc.
  • 2. NVIDIA AI Enterprise with OpenShift NVIDIA AI Enterprise NVIDIAが認定、ライセンス、サポートを提 供する包括的なクラウドネイティブAIソフト ウェアスイートです。 Red Hat OpenShiftとNVIDIA-Certified Systems上で動作することが認定されてい ます。 Red Hat OpenShift Red Hatが提供するエンタープライズ対応 のコンテナプラットフォームです。 フルスタックの自律運用と開発者向けのセ ルフサービス?プロビジョニングを提供して おり、クラウドやオンプレミスなど様々な環 境に対応しています。 ref. https://resources.nvidia.com/en-us-nvidia-ai-enterprise/nvaie-red-hat-overview
  • 3. AI活用におけるRed Hat OpenShiftの魅力 インフラリソースへの セルフサービスアクセス Self-Service Access to Infrastructure Resources MLOpsパイプラインの 安全な自動化 Securely Automate MLOps Pipelines Kubernetesを活用した アプリケーション開発 Kubernetes-Powered Application Development コンテナ化されたAIツールやイ ンフラリソースを利用するため のセルフサービスと一貫したク ラウド体験 OpenShift GitOpsやPipelines を活用した機械学習パイプライ ンにおける学習/推論フェーズ の自動化機能の拡張 GPUに最適化されたコンテナイ メージを使って、ML/DLモデル を容易に開発?デプロイ?スケー ルできる環境を提供
  • 5. NVIDIA AI Enterprise Software Suite OpenShiftでのRDMAおよびGPU Direct RDMAワークロードを有効化し、 ネットワーク関連のNVIDIAコンポーネン ト管理を自動化します NVIDIA Network Operator GPUのプロビジョニングに必要な NVIDIA Driver、Kubernetes Device PluginなどのNVIDIAソフトウェアコン ポーネント管理を自動化します NVIDIA GPU Operator AIのCloud-Native Deployment に欠かせないインフラリソース管理 の完全自動化 Self-Service Access to Infrastructure Resources
  • 6. GPUリソースの取り扱い Self-Service Access to Infrastructure Resources 仮想化におけるGPUリソースの取り扱い OpenShiftにおけるGPUリソースの取り扱い NVIDIA-Certified Systems NVIDIA GPU Hypervisor vGPU vGPU Guest VM NVIDIA Driver Applications Guest VM NVIDIA Driver Applications NVIDIA Virtualization Software NVIDIA-Certified Systems NVIDIA GPU GPU Operator NVIDIA Container Runtime Container Applications NVIDIA Driver NVIDIA GPU NVIDIA Kubernetes Device Plugin NVIDIA GPU Monitoring Container Applications GPUリソース管理の 完全自動化 互換性維持の 複雑化
  • 7. NVIDIA GPU Operator NVIDIA-Certified Systems Self-Service Access to Infrastructure Resources NVIDIA コンテナランタイムと連携し、コンテナを介して NVIDIAドライバを提供します (*詳細) NVIDIA Driver Kubernetesクラスタの各ノードにあるGPUの状態を管理し、 コンテナ起動時のGPUを割り当てます NVIDIA Kubernetes Device Plugin DCGM(Data Center GPU Manager)-exporterを利用して、 NVIDIA GPUデバイスの監視(ヘルスモニタリング、ポリ シー、グループ管理など)を行います NVIDIA GPU Monitoring
  • 8. Operator Framework Self-Service Access to Infrastructure Resources ref. https://docs.nvidia.com/datacenter/cloud-native/gpu-operator/openshift/install-gpu-ocp.html#installing-the-nvidia-gpu-operator-by-using-the-web-console OpenShift Web UIの「Operator Hub」から数クリックで導入できます OpenShift Web UIにおける GPUリソースの可視化 1クリックインストール
  • 10. MLOpsを支えるRed Hatのサービス Securely Automate MLOps Pipelines (OpenShift Pipelines) KubernetesネイティブなCI/CDパイ プライン作成のフレームワーク (Red Hat AMQ Streams) スケーラビリティに優れた分散メッ セージキュー (Red Hat OpenShift Data Science) AI/MLツール運用の自動化?セルフ サービス化したセット (Red Hat Quay) 分散型コンテナイメージレジストリ (OpenShift GitOps) KubernetesネイティブなGitOps ベースのCDツール (Red Hat OpenShift Data Foundation) コンテナ専用のソフトウェア?デファ インド?ストレージ(SDS)
  • 12. 学習(Model Training)フェーズ Securely Automate MLOps Pipelines Data Store Model Development ML Model Model Store Model Image Test Step.2 | ML model training pipelines Step.1 | Model Development Red Hat OpenShift上の Jupyter notebooksを使 い機械学習モデルを構 築します 【OpenShift Pipelines】 イベント駆動の継続的インテグレーションによって、機械学習モデルをコン テナイメージ化します ? Saving: デプロイ準備ができたモデルをModel Storeに保存 ? Converting: モデルをコンテナイメージに変換 ? Testing: モデルのイメージをテストして機能を確認 ? Storing: コンテナレジストリに確認済みのコンテナイメージを保存 Image Registry OpenShift Pipelines by
  • 13. 推論(Model Serving)フェーズ Securely Automate MLOps Pipelines Configuration Repository (Manifests) Trigger ML Service Intelligent App Step.4 | Monitoring validation Step.3 | ML models serving pipelines PrometheusやGrafana、サード パーティツールを使い、学習モデ ルによる推論のパフォーマンスを 監視し、必要に応じて再トレーニ ングやデプロイを行います 【OpenShift GitOps】 マニフェストを監視し、機械学習モデルを安全にデプロイします ? Configuring: Gitリポジトリ経由での構成設定 ? Monitoring:設定用マニフェストファイルの変更差分を監視 ? Triggering: MLサービス上のモデルを更新 ? Deploying: EdgeやDatacenter、クラウドなどに展開 Monitor drift OpenShift GitOps by Deploy
  • 15. OpenShiftのInstall Type Kubernetes-Powered Application Development NVIDIA-Certified Systems NVIDIA GPU RHEL NVIDIA-Certified Systems OpenShift NVIDIA GPU RHEL / RHCOS NVIDIA-Certified Systems OpenShift NVIDIA GPU RHEL / RHCOS Hypervisor (VMware) NVIDIA AI Enterprise 物理マシン OS/Hypervisor 仮想マシン TensorFlow PyTorch NVIDIA AI Enterprise TensorFlow PyTorch NVIDIA AI Enterprise TensorFlow PyTorch Container Orchestrator Container Container Runtime(Podman) 1. Virtualization 2. Bare-Metal N/A N/A
  • 16. AI開発のコンテナサポート Kubernetes-Powered Application Development NVIDIA-Certified Systems OpenShift NVIDIA GPU RHEL / RHCOS NVIDIA AI Enterprise TensorFlow PyTorch NVIDIA AI Enterprise に含まれるサポート サービス開発の ランタイム Application Runtimes Python Java AI開発専用の フレームワーク AI and data science frameworks: - TensorFlow - PyTorch - NVIDIA TAO Toolkit - NVIDIA Triton Inference Server - NVIDIA TensorRT - NVIDIA RAPIDS Red Hat OpenShift に含まれるサポート Application Streams: - PHP - Python - Perl - Node.js - Ruby - OpenJDK - Quarkus - MySQL / MariaDB etc…
  • 17. NVIDIA AI Enterprise 2.0のサポートOS Kubernetes-Powered Application Development ref. https://docs.nvidia.com/ai-enterprise/latest/product-support-matrix/index.html Install Type Hypervisor or Bare-Metal OS Guest OS Support Virtualization VMware vSphere Hypervisor (ESXi) Enterprise Plus Edition 7.0 Update 2 or 3 > Ubuntu 20.04 LTS > Red Hat Enterprise Linux 8.4 > Red Hat OpenShift 4.9 Virtualization VMware vSphere 6.7 Bare-Metal Ubuntu 20.04 LTS Bare-Metal Red Hat Enterprise Linux 8.4 Bare-Metal Red Hat OpenShift 4.9 w/Red Hat Linux CoreOS (RHCOS) Install Typeが仮想化(Virtualization)でもベアメタル(Bare-Metal)でも、コンテナ自体は「Ubuntu(20.04 LTS)」また は「RHEL(8.4 or RHCOS)」の上で展開されることがサポート要件
  • 18. RHELの恩恵によるトータルサポート Kubernetes-Powered Application Development OpenShift RHEL / RHCOS Container UBI Applications Container UBI Applications Container Platform Operation System Container Base Image Applications Container Base Image Applications Container Orchestration OS Container Image コンテナイメージとして展開されるUBIは、RHEL(Red Hat Enterprise Linux)のライフサイクルに基づいてサポートさ れます。 Universal Base Image Red Hatのコンテナ実行環境を利 用する場合、UBIの使用を完全に サポート OpenShift ホストOSであるRHEL/RHCOSの サポートを含む RHEL コンテナランタイムとしての稼働を サポート ref. https://access.redhat.com/articles/2726611
  • 20. NVIDIAとRed HatのAI対応プラットフォーム NVIDIA AI Enterprise NVIDIA-Certified Systems インフラリソースへの セルフサービスアクセス Self-Service Access to Infrastructure Resources MLOpsパイプラインの 安全な自動化 Securely Automate MLOps Pipelines Kubernetesを活用した アプリケーション開発 Kubernetes-Powered Application Development
  • 21. linkedin.com/company/red-hat youtube.com/user/RedHatVideos facebook.com/redhatinc twitter.com/RedHat 22 Thank you Red Hat is the world’s leading provider of enterprise open source software solutions. Award-winning support, training, and consulting services make Red Hat a trusted adviser to the Fortune 500.