英伟达网卡怎么更换
更换英伟达(NVIDIA)网卡(即 NVIDIA 的以太网适配器,如 Mellanox 系列或 NVIDIA Spectrum 系列)需要根据你的具体使用场景和硬件环境来操作,以下是通用的更换步骤,适用于服务器或高性能计算环境中常见的 NVIDIA 网卡:
✅ 一、准备工作
-
确认当前网卡型号:
lspci | grep -i mellanox # 或 lspci | grep -i nvidia
示例输出:
04:00.0 Ethernet controller: Mellanox Technologies MT27800 Family [ConnectX-5] -
备份配置(如有重要设置):
- 检查网络配置文件(如
/etc/network/interfaces、/etc/netplan/*.yaml) - 如果使用
nvidia-ml-py3或 InfiniBand 配置,需记录 IB 地址、子网等
- 检查网络配置文件(如
-
获取新网卡驱动兼容性信息:
- 新网卡是否支持你当前 Linux 内核版本?
- 是否需要安装特定驱动(如
MLNX_OFED)?
-
关闭系统服务(避免热插拔问题):
sudo systemctl stop nvswitchd # 如果是 NVIDIA GPU/Switch 使用 sudo systemctl stop mlx4_core # Mellanox OFED 相关服务
✅ 二、物理更换步骤
- 断电并拔掉电源线
- 打开机箱,找到原网卡插槽(PCIe x8 或 x16)
- 拔出旧网卡(注意防静电,轻按卡扣释放)
- 插入新网卡(对准 PCIe 插槽,轻轻推入直到完全卡紧)
- 重新连接电源,开机
✅ 三、软件配置
-
检查设备识别:
lspci | grep -i mellanox
应显示新网卡型号。
-
安装最新驱动(推荐 MLNX_OFED):
# 下载 MLNX_OFED(官网:https://www.mellanox.com/products/infiniband-drivers/linux/mlnx_ofed) wget https://www.mellanox.com/downloads/ofed/MLNX_OFED-5.7-2.1.8.0/MLNX_OFED_LINUX-5.7-2.1.8.0-rhel8.5-x86_64.tgz tar -xzf MLNX_OFED_LINUX-5.7-2.1.8.0-rhel8.5-x86_64.tgz cd MLNX_OFED_LINUX-5.7-2.1.8.0-rhel8.5-x86_64/ sudo ./mlnxofedinstall --upstream-libs
-
重启网络服务:
sudo systemctl restart network # 或 sudo netplan apply # 如果使用 netplan
-
验证网卡状态:
ip a ibstat # 如果是 InfiniBand 网卡 ethtool <interface_name> # 如 eth0, ib0
⚠️ 注意事项
- 服务器环境:建议在维护窗口期操作,避免影响业务。
- 双网卡冗余:如果原网卡用于高可用(HA),请确保新网卡配置与原一致(IP、VLAN、bonding)。
- 固件升级:某些新网卡可能需要更新固件(使用
mlxupdate工具)。 - 许可证:部分高级功能(如 RDMA、RoCE)需额外授权。
🔍 常见问题排查
| 问题 | 解决方案 |
|---|---|
| 网卡未识别 | 检查 PCIe 插槽、BIOS 设置(启用 PCIe 设备)、驱动是否加载 |
| 网络不通 | 检查 IP、子网掩码、路由表;用 ping 和 tcpdump 排查 |
| InfiniBand 不工作 | 确认 iblinkinfo, ibstatus 正常;检查电缆和端口 |
如果你能提供更具体的网卡型号(如 ConnectX-5 / ConnectX-6 / Spectrum-3)或使用场景(如 AI 训练、HPC、虚拟化),我可以给出更精确的指导!









