2. NVIDIA AI Enterprise with OpenShift
NVIDIA AI Enterprise
NVIDIAが認定、ライセンス、サポートを提
供する包括的なクラウドネイティブAIソフト
ウェアスイートです。
Red Hat OpenShiftとNVIDIA-Certified
Systems上で動作することが認定されてい
ます。
Red Hat OpenShift
Red Hatが提供するエンタープライズ対応
のコンテナプラットフォームです。
フルスタックの自律運用と開発者向けのセ
ルフサービス?プロビジョニングを提供して
おり、クラウドやオンプレミスなど様々な環
境に対応しています。
ref. https://resources.nvidia.com/en-us-nvidia-ai-enterprise/nvaie-red-hat-overview
12. 学習(Model Training)フェーズ
Securely Automate
MLOps Pipelines
Data Store
Model
Development
ML
Model
Model
Store
Model
Image
Test
Step.2 | ML model training pipelines
Step.1 | Model Development
Red Hat OpenShift上の
Jupyter notebooksを使
い機械学習モデルを構
築します
【OpenShift Pipelines】
イベント駆動の継続的インテグレーションによって、機械学習モデルをコン
テナイメージ化します
? Saving: デプロイ準備ができたモデルをModel Storeに保存
? Converting: モデルをコンテナイメージに変換
? Testing: モデルのイメージをテストして機能を確認
? Storing: コンテナレジストリに確認済みのコンテナイメージを保存
Image
Registry
OpenShift Pipelines by
15. OpenShiftのInstall Type
Kubernetes-Powered
Application Development
NVIDIA-Certified Systems
NVIDIA GPU
RHEL
NVIDIA-Certified Systems
OpenShift
NVIDIA GPU
RHEL / RHCOS
NVIDIA-Certified Systems
OpenShift
NVIDIA GPU
RHEL / RHCOS
Hypervisor (VMware)
NVIDIA AI Enterprise
物理マシン
OS/Hypervisor
仮想マシン
TensorFlow PyTorch
NVIDIA AI Enterprise
TensorFlow PyTorch
NVIDIA AI Enterprise
TensorFlow PyTorch
Container
Orchestrator
Container
Container Runtime(Podman)
1. Virtualization 2. Bare-Metal
N/A N/A
16. AI開発のコンテナサポート
Kubernetes-Powered
Application Development
NVIDIA-Certified Systems
OpenShift
NVIDIA GPU
RHEL / RHCOS
NVIDIA AI Enterprise
TensorFlow PyTorch
NVIDIA AI Enterprise
に含まれるサポート サービス開発の
ランタイム
Application Runtimes
Python Java
AI開発専用の
フレームワーク
AI and data science
frameworks:
- TensorFlow
- PyTorch
- NVIDIA TAO Toolkit
- NVIDIA Triton
Inference Server
- NVIDIA TensorRT
- NVIDIA RAPIDS
Red Hat OpenShift
に含まれるサポート
Application Streams:
- PHP
- Python
- Perl
- Node.js
- Ruby
- OpenJDK
- Quarkus
- MySQL / MariaDB
etc…
17. NVIDIA AI Enterprise 2.0のサポートOS
Kubernetes-Powered
Application Development
ref. https://docs.nvidia.com/ai-enterprise/latest/product-support-matrix/index.html
Install Type Hypervisor or Bare-Metal OS Guest OS Support
Virtualization VMware vSphere Hypervisor (ESXi)
Enterprise Plus Edition 7.0 Update 2 or 3
> Ubuntu 20.04 LTS
> Red Hat Enterprise Linux 8.4
> Red Hat OpenShift 4.9
Virtualization VMware vSphere 6.7
Bare-Metal Ubuntu 20.04 LTS
Bare-Metal Red Hat Enterprise Linux 8.4
Bare-Metal Red Hat OpenShift 4.9 w/Red Hat Linux CoreOS (RHCOS)
Install Typeが仮想化(Virtualization)でもベアメタル(Bare-Metal)でも、コンテナ自体は「Ubuntu(20.04 LTS)」また
は「RHEL(8.4 or RHCOS)」の上で展開されることがサポート要件
18. RHELの恩恵によるトータルサポート
Kubernetes-Powered
Application Development
OpenShift
RHEL / RHCOS
Container
UBI
Applications
Container
UBI
Applications
Container Platform
Operation System
Container
Base Image
Applications
Container
Base Image
Applications
Container
Orchestration
OS
Container Image
コンテナイメージとして展開されるUBIは、RHEL(Red Hat Enterprise Linux)のライフサイクルに基づいてサポートさ
れます。
Universal Base Image
Red Hatのコンテナ実行環境を利
用する場合、UBIの使用を完全に
サポート
OpenShift
ホストOSであるRHEL/RHCOSの
サポートを含む
RHEL
コンテナランタイムとしての稼働を
サポート
ref. https://access.redhat.com/articles/2726611