Zu den Hauptinhalten
  • Bestellungen schnell und einfach aufgeben
  • Bestellungen anzeigen und den Versandstatus verfolgen
  • Profitieren Sie von exklusiven Prämien und Rabatten für Mitglieder
  • Erstellen Sie eine Liste Ihrer Produkte, auf die Sie jederzeit zugreifen können.

Dell PowerEdge 14G: ESXi возвращает сообщение «Failed to initialize NVML: Unknown Error» при запуске с видеокартой NVidia

Zusammenfassung: Чтобы устранить эту проблему, установите для параметра «Memory Mapped I/O Base» значение 512 ГБ

Dieser Artikel gilt für   Dieser Artikel gilt nicht für 

Symptome

Описание

В ходе установки видеокарты NVidia (например M10) на поддерживаемый сервер 14G (R740 и R740XD) после установки пакета драйверов VIB при попытке выполнения команды nvidia-smi может появиться следующая ошибка:

[root@localhost:~] nvidia-smi
Failed to initialize NVML: Unknown Error


SLN308065_en_US__1PSE2940error


В файле nvidia-bug-report.log в разделе /var/log/vmkernel.log отображаются события, похожие на представленные ниже.

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: loading NVIDIA UNIX x86_64 Kernel Module  384.73  Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: This is a 64-bit BAR mapped above 16 TB by the system
NVRM: BIOS or the VMware ESXi kernel. This PCI I/O region assigned
NVRM: to your NVIDIA device is not supported by the kernel.
NVRM: BAR1 is 256M @ 0x382fe00$



 


Решение

Оборудование работает исправно. Чтобы устранить эту проблему, установите для параметра Memory Mapped I/O Base значение 512 Гбайт (по умолчанию 56 Тбайт) или 12 Тбайт (если на сервере > 512 Гбайт ОЗУ).

SLN308065_en_US__2PSE2940biossetting


Эта проблема описана в руководстве пользователя оборудования для R740.

Memory Mapped I/O above 4 GB. Включение или отключение поддержки устройств PCIe, которым требуется большой объем памяти. Этот параметр включается только для 64-разрядных операционных систем. По умолчанию для этого параметра установлено значение «Включено».

Memory Mapped I/O above Base. Если установлено значение 12 ТБ, система сопоставит базу MMIO с 12 ТБ. Включите этот параметр для ОС, которой требуется 44-разрядная адресация PCIe.
Если установлено значение 512 Гбайт, система сопоставит базу MMIO с 512 Гбайт и снизит максимальную поддержку памяти до менее 512 Гбайт. Включите этот параметр только для проблемы 4 GPU DGMA. По умолчанию для этого параметра установлено значение 56 ТБ.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (страница 52)

 

SLN308065_en_US__3icon Обратите внимание, что объем системной памяти будет ограничен до 512 ГБ (если установлено значение 512 ГБ).

 

После изменения этого параметра и перезагрузки системы команда nvidia-smi должна выводить что-то похожее на следующее:

SLN308065_en_US__4PSE2940noerror

Ursache

-

Lösung

-

Betroffene Produkte

PowerEdge R740, PowerEdge R740XD, PowerEdge T640