PVE vGPU
📂

PVE vGPU

如何在PVE上使用vGPU
已有一把嗦脚本
 
注意每行均为独立代码
apt update && apt upgrade -y apt install -y git build-essential pve-headers dkms jq cargo mdevctl unzip uuid
 
启动IOMMU
 
nano /etc/default/grub #intel GRUB_CMDLINE_LINUX_DEFAULT="quiet intel_iommu=on iommu=pt" #amd GRUB_CMDLINE_LINUX_DEFAULT="quiet amd_iommu=on iommu=pt"
update-grub
 
在引导时加载 VFIO 模块
nano /etc/modules #添加 vfio vfio_iommu_type1 vfio_pci vfio_virqfd
 
 
echo "options vfio_iommu_type1 allow_unsafe_interrupts=1" > /etc/modprobe.d/iommu_unsafe_interrupts.conf echo "options kvm ignore_msrs=1" > /etc/modprobe.d/kvm.conf echo "blacklist nouveau" >> /etc/modprobe.d/blacklist.conf
 
 
update-initramfs -u reboot
 
验证IOMMU是否开启
dmesg | grep -e DMAR -e IOMMU
 
 
 

安装驱动

 
mkdir vgpu cd vgpu #上传驱动文件,这里上传文件名为NVIDIA-Linux-x86_64-510.47.03-vgpu-kvm.run chmod +x NVIDIA-Linux-x86_64-510.47.03-vgpu-kvm.run ./NVIDIA-Linux-x86_64-510.47.03-vgpu-kvm.run -x cd NVIDIA-Linux-x86_64-510.47.03-vgpu-kvm/ sed -i 's|.open = nv_vgpu_vfio_open|.open_device = nv_vgpu_vfio_open|g' kernel/nvidia-vgpu-vfio/nvidia-vgpu-vfio.c sed -i 's|.release = nv_vgpu_vfio_close|.close_device = nv_vgpu_vfio_close|g' kernel/nvidia-vgpu-vfio/nvidia-vgpu-vfio.c ./nvidia-installer -dkms -s systemctl daemon-reload reboot
 
 
mdevctl types #执行为会出现一堆显卡,才为正常驱动
notion image
 
 
#生成uuid # -n 参数为数量 uuid -n 1
 
mdevctl start -u [uuid] -p [设备id] -t [生成类型] 实例: mdevctl start -u cf6af22c-2e4d-11ed-987f-738f4f5aecf0 -p 0000:01:00.0 -t nvidia-65
 
# uuid为上一步生成
#设备id:通过命令行 mdevctl types 输入后,第一行内容
notion image
#生成类型:通过命令行 mdevctl types 输入后,需要生成虚拟显卡类型
notion image
 
mdevctl define -a -u [uuid] 实例: mdevctl define -a -u cf6af22c-2e4d-11ed-987f-738f4f5aecf0
 
mdevctl list #可以查看并确认生成的内容
 
 

vGPU 分配

 

UI

nano /etc/pve/qemu-server/[虚拟机id].conf #添加下面,注意这里为固定00000000-0000-0000-0000-000000000,不需要更改为生成的uuid args: -uuid 00000000-0000-0000-0000-000000000[虚拟机id] 实例: nano /etc/pve/qemu-server/100.conf args: -uuid 00000000-0000-0000-0000-000000000100
并在WEBUI添加
notion image
 

 
进入系统后
开启远程桌面,因为安装驱动后控制台的VNC不可用
安装win驱动
注意虚拟机内驱动版本不可高于主机版本
实例中安装的版本为511.65_grid_win10_win11_server2016_server2019_server2022_64bit_international.exe
安装完重启电脑
并在N卡控制面板,填写授权服务器的地址
有时候填写完也需要重启