Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

PowerEdge: vSphere'de Sanal Makineler ile GPU'lar kullanılırken PCI Geçişi "Module 'DevicePowerOn' power on failed" hatası veriyor

Summary: ESXi ana bilgisayarında PCI Aygıtı geçişi yapılandırıldıktan ve aygıtı VM'ye ekledikten sonra VM açılmıyor. %80'de takılı kalıyor ve ardından bir hatayla sonuçlanıyor 2022-04-22T03:04:15.771Z| vmx| | I005: PCIPassthru: total number of pages needed (4206594) exceeds limit (917504), failing 2022-04-22T03:04:15.771Z| vmx| | I005: Modül "DevicePowerOn" açılamadı. ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Instructions

PCI error.PNG


Ön Hazırlıklar

Ana bilgisayar BIOS'unuzun doğrudan geçiş için Nvidia GPU'yu etkinleştirmek üzere doğru şekilde yapılandırılması ve bu hızlandırılmış iş yüklerini çalıştırmak üzere yönlendiren sanal makinenin belirli gereksinimleri karşılaması gerekir. Bu bölümde tüm bu gereksinimler ve bilgiler yer alır.

Hangi Aygıtlar İçin Geçerlidir?

Bu makale yalnızca PCI aygıtı, boyutları toplam 16 GB'den fazla olan bellek bölgelerine eşlerken geçerlidir. vSphere altında geçiş aygıtlarını etkinleştirmek için 1010789 numaralı KB makalesinde yayımlanan talimatları izleyin. Kural olarak, 16 GB'den fazla bellek eşlemesi gerektiren kartlar üst düzey kartlardır. Sanal makinede geçiş modunda kullanımlarını etkinleştirmek için bu makaledeki talimatları takip edin.
 

Ana bilgisayar BIOS'u

Ana bilgisayar BIOS'unuzun, bu son teknoloji PCI aygıtlarının ihtiyacı olan büyük bellek bölgelerini desteklemek için yapılandırılması gerekir. Bunu etkinleştirmek için "memory mapped I/O above 4 GB" (4 GB üzerinde bellek eşlenmiş G/Ç) ana bilgisayar BIOS ayarını bulun ve etkinleştirin.

MMIO.png


Konuk İşletim Sistemi 

Not: Bu ayarlar yalnızca BIOS önyükleme modu UEFI olarak ayarlanmışsa gereklidir. Eski veya BIOS moduysa aşağıdaki ayarları yok sayabilirsiniz.

Bu büyük bellek eşlemelerine erişmek için Guest OS must boot with EFI (Konuk İşletim Sisteminin EFI ile önyüklemesi gerekir) VMware sitesine bağlanın. Diğer bir ifadeyle, VM'de EFI'yi etkinleştirmeniz ve ardından Konuk İşletim Sisteminin EFI yüklemesini yapmanız gerekir.
 

Ana Bilgisayar Sunucusunda PCI Aygıtı Kullanılabilirliğini Düzenleme

Yüklü bir PCI uyumlu GPU donanım aygıtı, hypervisor'a herhangi bir özel sürücü yüklenmeden başlangıçta sunucu önyükleme sırasında vSphere hypervisor'ı tarafından tanınır.

vSphere, tüm PCI aygıtlarını bu şekilde tanır. Üzerinde çalıştığınız ana bilgisayar sunucusunu seçip menü seçimlerini takip ederek vSphere Client aracında bulunan PCI aygıtlarının listesini görebilirsiniz.

" Aşağıdaki Şekil 2'de yer alan örnekte görüldüğü gibi listeyi görmek için " > Hardware > ", "PCI Devices" > , "Edit" öğelerini yapılandırın.

Belirli bir GPU aygıtı daha önce DirectPath G/Ç için etkinleştirilmemişse, NVIDIA aygıtı örneğinde görüldüğü gibi aygıt girişindeki onay kutusuna tıklayarak GPU aygıtını Doğrudan Yol G/Ç (geçiş) moduna geçirebilirsiniz.

image.png


VM Dosyasında Son Teknoloji Aygıtları Etkinleştirme

Yukarıdaki gereksinimler karşılandıktan sonra VM'nin VMX dosyasına ya doğrudan değiştirerek ya da bu özellikleri eklemek için vSphere Client kullanılarak iki giriş eklenmelidir. İlk giriş:

pciPassthru.use64bitMMIO="TRUE"

İkinci girişin belirtilmesi için basit bir hesaplama gerekir. VM'ye geçirmek istediğiniz tüm GPU aygıtlarının(*) GPU bellek boyutlarını özetleyin ve ardından ikinin kuvvetine yuvarlayın. Örneğin, 4 adet 16 GB A2 aygıtıyla geçişi kullanmak için değer şu şekilde olur: 32 + 32 = 64, ikinin kuvveti olarak 128'e yuvarlanır. Bu değeri ikinci girişte kullanın:

pciPassthru.64bitMMIOSizeGB="128"

VMX dosyasına yapılan bu iki değişiklikle birlikte, ana bilgisayar düzeyinde geçiş aygıtlarını etkinleştirmek ve VM'nize hangi aygıtların geçeceğini belirtmek için 1010789 numaralı VMware makalesindeki standart vSphere talimatlarını izleyin. VM, artık geçiş modundayken aygıtınızda doğru şekilde önyüklenecektir.
 

Kullanıcı Arabiriminde Son Teknoloji Aygıtları Etkinleştirme

Yine vSphere Client'ta sanal makineyi seçin ve seçenekleri kullanın.

" Ayarları > Düzenle VM Seçenekleri >Gelişmiş > Yapılandırma Parametreleri > Yapılandırmayı Düzenle"ye tıklayarak aşağıda gösterilen PCI ile ilgili seçeneklerin listesini bulabilirsiniz.

image.png


Basit bir yaklaşım kullanarak "64bitMMIOSizeGB" parametresinin değerini hesaplayın. Bu VM'ye geçişini yapmayı planladığınız son teknoloji PCI GPU aygıtlarının sayısını belirleyin. Bu, bir veya daha fazla GPU olabilir. Bu sayıyı 16 ile çarpın ve sonraki ikinin kuvvetine yuvarlayın.

Örneğin, bir VM'de iki GPU aygıtıyla geçiş modunu kullanmak için değer şu şekildedir: 4 x 16 = 64, ikinin kuvveti olarak 128'e yuvarlanır.
 

Sanal Makineye GPU Aygıtı Atama

Bu bölümde GPU aygıtının VM'ye atanması açıklanmıştır. GPU aygıtını atamadan önce sanal makineyi kapatın.

Bir PCI aygıtına sanal makine erişimi sağlamak için vSphere Client'ta sanal makineyi seçin, "Edit Settings" (Ayarları Düzenle) seçeneğini kullanın ve PCI Aygıt listesi için aşağı kaydırın. Aygıt zaten listede yoksa listeye eklemek için "Add New Device" (Yeni Aygıt Ekle) düğmesini kullanın. Eklendikten sonra sanal makine ayarlarınız, Şekil 7'de gösterilenlere benzer olmalıdır. Bu örnekte, ilgili giriş "PCI Device 0" (PCI Aygıtı 0) şeklindedir.

image.png


Bellek Ayırma

PCI aygıtı bir VM'ye atandığında, sanal makinenin VM'ye yönelik tam yapılandırılmış bellek boyutu için bir bellek ayırması olmalıdır. Bu işlem, vSphere istemcisinde VM'yi seçerek ve Reservation alanındaki değere erişip değeri değiştirmek için "Edit Settings > Virtual Hardware > Memory" seçeneği kullanılarak yapılır.

Son olarak, sanal makineyi açın. Sanal makineyi açtıktan sonra Konuk işletim sisteminde oturum açın ve GPU kartının mevcut olup olmadığını kontrol edin.

  • Linux sanal makinesinde şu komutu kullanın:
"lspci | grep nvidia"

Veya

  • Bir Windows işletim sisteminde, mevcut GPU aygıtlarını kontrol etmek için Denetim Masası'nın "Aygıt Yöneticisi"ni kullanın


GPU artık geçiş modunda uygulama kullanımına hazırdır.

Additional Information

Sorun Giderme

Yukarıdaki talimatları takip ettiyseniz ve VM'niz aygıtlar etkinken hâlâ doğru şekilde önyükleme yapmıyorsa bu bölümdeki materyal faydalı olabilir. Aşağıdaki önerileri denediyseniz ve hâlâ sorun yaşıyorsanız bizimle iletişime geçin; size yardımcı olabiliriz.
 

Eşleme Sorunu:
VM'nin vmware.log dosyasında aşağıdakine benzer bir hata alırsanız:

1 I120: PCIPassthru: 0000:82:00.0 : Device BAR 0 requested 64-bit memory address that exceeded MPN type (62105227100160)

BIOS ayarlarınız bu geçiş aygıtı türünü etkinleştirmek için ESXi gereksinimlerini karşılamıyor. ESXi 6.0 p4 ila ESXi 6.5 sürümleri, PCI aygıtlarıyla eşlenen belleğin 16 TB'nin altında olmasını gerektirir. BIOS'unuzun, ana bilgisayarın bellek adres alanı PCI bellek bölgelerinde ne kadar yüksek olduğunu kontrol etme özelliğini desteklemesi durumunda, bu sorunu geçici olarak çözmek mümkün olabilir. Örneğin bazı üreticilerin SuperMicro'da bu belleğin eşlenmiş yüksekliklerini değiştirmek için BIOS seçenekleri bulunur. SuperMicro sistemlerde MMIOHBase parametresi, varsayılan 56 TB değerinden daha düşük bir değere değiştirilebilir. Sugon sistemlerde de benzer (gizli) bir BIOS ayarı bulunur. BIOS'unuzun bu yeniden eşleştirme özelliğini destekleyip desteklemediğini öğrenmek için sistem satıcınıza başvurun. Başka bir çözüm, ESXi sürümünüzü 16 TB sınırlamasını kaldırmış olan 6.5 u1 veya üzeri bir sürüme güncelleştirmektir.

Yanlış Yapılandırma:
Aşağıdaki formun vmware.log dosyasında bir hata:

1 2016-07-07T09:18:37.624Z| vmx| I120: PCIPassthru: total number of pages needed (2097186) exceeds limit (917504), failing

Yukarıdaki "Ana Bilgisayar BIOS'u" bölümünde açıklandığı gibi ana bilgisayar BIOS'unuzun "4 GB üzerinde" eşlemelerini doğru şekilde etkinleştirmediğinizi veya VMX girişlerini doğru şekilde belirtmediğinizi gösterir.

Aygıt Kullanılamıyor:
Yukarıdaki tüm talimatları takip ettiyseniz ve VM'niz doğru şekilde önyüklenmişse ancak Konuk İşletim Sisteminizde nvidia-smi yardımcı programını çalıştırırken aşağıdakine benzer bir mesaj görüyorsanız:

1 Unable to determine the device handle for GPU 0000:13:00.0: Unknown Error

Size yardımcı olabilecek ek bilgiler bulmak için Nvidia ile doğrudan iletişime geçmenizi veya bu dizeyi kullanarak web araması gerçekleştirmenizi öneririz.

Article Properties


Affected Product

Servers, PowerEdge

Last Published Date

15 Dec 2022

Version

4

Article Type

How To