K8S GPU 配置
NVIDIA驱动安装
以下操作在Redhat 7.6上进行,已安装好k8s并使用docker作为contianer runtime
查看服务器的GPU信息
1 | yum install pciutils |
下载对应的驱动文件
到官网下载驱动
安装驱动
redhat/centos rpm离线包安装时,需要epel提供一些必要软件
1 | yum install -y epel-release |
安装nvidia-docker
1 | distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \ |
安装k8s-device-plugin
部署说明
官方文档
gpu-feature-discovery
k8s-device-plugin
部署文件
- 部署使用helm chart
1
2
3
4
5#templates/_helpers.tpl上可能有问题,部署前可以helm template .试试看
# 或者helm install ndp nvidia-device-plugin --dry-run
allowPrivilegeEscalation: false
capabilities:
drop: ["ALL"] - 需要最新版本helm
- 所需镜像
1
2
3
4k8s.gcr.io/nfd/node-feature-discovery:v0.11.0
nvcr.io/nvidia/gpu-feature-discovery:v0.6.1
k8s.gcr.io/nfd/node-feature-discovery:v0.11.0
nvcr.io/nvidia/k8s-device-plugin:v0.12.2开始安装
MIG_STRATEGY类型可查阅官网文档MIG_STRATEGY=none ./helm -n nvidia-device-plugin install \ ndp \ --set migStrategy=${MIG_STRATEGY} \ --set gfd.enabled=true \ nvidia-device-plugin