Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

PowerEdge: PCI-genomströmning "Module 'DevicePowerOn' power on failed" när GPU:er med virtuella maskiner används på vSphere

Summary: Den virtuella datorn startar inte efter att PCI-enhetens genomströmning har konfigurerats på ESXi-värden och enheten har lagts till i den virtuella datorn. Den fastnar vid 80 % och resulterar sedan i ett fel 2022-04-22T03:04:15.771Z| VMX| | I005: PCIPassthru: totalt antal sidor som behövs (4206594) överskrider gränsen (917504), misslyckas 2022-04-22T03:04:15.771Z| VMX| | I005: Strömmen till modulen "DevicePowerOn" misslyckades. ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Instructions

PCI-error.PNG


Förberedelser

Värd-BIOS måste konfigureras korrekt för att aktivera Nvidia GPU för genomströmning, och den virtuella maskin som är avsedd att köra dessa accelererade arbetsbelastningar måste uppfylla specifika krav. I det här avsnittet beskrivs alla dessa krav.

Vilka enheter?

Den här artikeln är bara relevant om PCI-enheten mappar minnesregioner vars totala storlek är större än 16 GB. Följ VMware KB 1010789 publicerade instruktioner för att aktivera genomströmningsenheter under vSphere. Kort som kräver mer än 16 GB minnesmappning är i regel avancerade kort. Du bör följa anvisningarna i den här artikeln för att aktivera dem för användning i genomströmningsläge på en virtuell dator.
 

Värd-BIOS

Din värd-BIOS måste konfigureras för att stödja de stora minnesregioner som behövs av dessa avancerade PCI-enheter. Aktivera detta genom att leta reda på värd-BIOS-inställningen för "minnesmappad I/O över 4 GB" och aktivera den.

MMIO.png


Gäst-OS 

Obs! Dessa inställningar behövs endast om ditt BIOS-startläge är inställt på UEFI, om det är Legacy eller BIOS-läge kan du ignorera nedanstående.

För att få åtkomst till dessa stora minnesmappningar måste du ansluta till VMware-platsen. Gästoperativsystemet måste starta med EFI. Det innebär att du måste aktivera EFI på den virtuella datorn och sedan göra en EFI-installation av gästoperativsystemet.
 

Redigera PCI-enhetens tillgänglighet på värdservern

En installerad PCI-kompatibel GPU-maskinvaruenhet identifieras initialt av vSphere-hypervisorn vid serverstart utan att ha några specifika drivrutiner installerade i hypervisor-programmet.

vSphere känner igen alla PCI-enheter på det här sättet. Du kan se listan över PCI-enheter som finns i vSphere Client-verktyget genom att välja den specifika värdserver som du arbetar på och följa menyalternativen."

Konfigurera" > "Hårdvara" > "PCI-enheter" > "Redigera" för att se listan, som visas i ett exempel i bild 2 nedan.

Om den specifika GPU-enheten inte tidigare har aktiverats för DirectPath I/O kan du placera GPU-enheten i Direct Path I/O-läge (genomströmning) genom att klicka på kryssrutan på enhetsposten som visas i NVIDIA-enhetsexemplet.

image.png


Aktivera avancerade enheter i VM-filen

När ovanstående krav är uppfyllda måste två poster läggas till i den virtuella datorns VMX-fil, antingen genom att ändra filen direkt eller genom att använda vSphere-klienten för att lägga till dessa funktioner. Den första posten är:

pciPassthru.use64bitMMIO="SANT"

För att ange den andra posten krävs en enkel beräkning. Summera GPU-minnesstorlekarna för alla GPU-enheter (*) som du tänker skicka till den virtuella datorn och avrunda sedan uppåt till nästa upphöjning av två. Om du till exempel vill använda genomströmning med 4 A2-enheter på 16 GB blir värdet: 32 + 32 = 64, avrundat uppåt till nästa potens av två för att ge 128. Använd det här värdet i den andra posten:

pciPassthru.64bitMMIOSizeGB="128"

Med dessa två ändringar i VMX-filen följer du VMware KB 1010789 vSphere-standardinstruktionerna för att aktivera genomströmningsenheter på värdnivå och för att ange vilka enheter som ska skickas till den virtuella datorn. Den virtuella datorn bör nu starta korrekt med enheten i genomströmningsläge.
 

Aktivera avancerade enheter i användargränssnittet

I vSphere-klienten igen väljer du den virtuella maskinen och använder alternativen."

Edit Settings > , VM Options >, Advanced > Configuration Parameters > Edit Configuration" för att komma till listan över PCI-relaterade alternativ som visas nedan.

image.png


Vi beräknar värdet för parametern "64bitMMIOSizeGB" med hjälp av en enkel metod. Räkna antalet avancerade PCI GPU-enheter som du tänker skicka till den här virtuella datorn. Det kan vara en eller flera grafikprocessorer. Multiplicera det talet med 16 och avrunda det uppåt till nästa potens av två.

Om du till exempel vill använda genomströmningsläge med två GPU-enheter på en virtuell dator blir värdet: 4 * 16 = 64, avrundat uppåt till nästa tvåpotens för att ge 128.
 

Tilldela en GPU-enhet till en virtuell maskin

I det här avsnittet beskrivs tilldelningen av GPU-enheten till den virtuella datorn. Stäng av den virtuella datorn innan du tilldelar GPU-enheten till den.

För att ge en virtuell maskin åtkomst till en PCI-enhet går du till vSphere Client, väljer den virtuella maskinen, använder alternativet "Edit Settings" och bläddrar ner till listan över PCI-enheter. Om din enhet inte redan finns med där, använd knappen "Lägg till ny enhet" för att lägga till den i listan. När du har lagt till inställningarna för den virtuella datorn bör de se ut ungefär som de som visas i bild 7. I det här exemplet är den relevanta posten "PCI-enhet 0".

image.png


Minnesreservation

När PCI-enheten tilldelas till en virtuell dator måste den virtuella datorn ha en minnesreservation för den fullständigt konfigurerade minnesstorleken för den virtuella datorn. Detta görs i vSphere-klienten genom att välja VM med hjälp av "Edit Settings > Virtual Hardware > Memory" för att komma åt och ändra värdet i reservationsområdet.

Slå slutligen på den virtuella maskinen. När du har slagit på den virtuella maskinen loggar du in på gästoperativsystemet och kontrollerar att GPU-kortet finns.

  • På en virtuell Linux-dator använder du kommandot
"lspci | grep nvidia"

Eller

  • I ett Windows-operativsystem använder du "Enhetshanteraren" från Kontrollpanelen för att kontrollera tillgängliga GPU-enheter


GPU:n är nu klar för programanvändning i genomströmningsläge.

Additional Information

Felsökning

Om du har följt anvisningarna ovan och den virtuella datorn fortfarande inte startar korrekt med enheterna aktiverade kan materialet i det här avsnittet vara till hjälp. Om du har provat förslagen nedan och fortfarande har problem, kontakta oss så kan vi hjälpa dig.
 

Mappningsproblem:
Om du ser ett fel som liknar följande i den virtuella datorns vmware.log-fil:

1 I120: PCIPassthru: 0000:82:00.0 : Enhet BAR 0 begärde 64-bitars minnesadress som överskred MPN-typen (62105227100160)

BIOS-inställningarna uppfyller inte ESXi-kraven för aktivering av den här typen av passthrough-enhet. ESXi 6.0 p4 till ESXi 6.5 kräver att minnet som mappas för PCI-enheter är kortare än 16 TB. Det kan vara möjligt att kringgå det här problemet om BIOS stöder möjligheten att styra hur högt upp i värdens minnesadressutrymme PCI-minnesområden mappas. Vissa tillverkare, till exempel SuperMicro, har BIOS-alternativ för att ändra hur högt minnet mappas. På SuperMicro-system kan MMIOHBase-parametern ändras till ett lägre värde från standardvärdet på 56 TB. Sugon-system har också en liknande (dold) BIOS-inställning. Fråga systemleverantören för att ta reda på om BIOS har stöd för den här ommappningsfunktionen. En annan lösning är att uppdatera din ESXi-version till 6.5 u1 eller högre, vilket har tagit bort begränsningen på 16 TB.

Felaktig konfiguration:
Ett fel i den vmware.log filen i följande formulär:

1 2016-07-07T09:18:37.624Z| VMX| I120: PCIPassthru: totalt antal sidor som behövs (2097186) överskrider gränsen (917504), misslyckas

Indikerar att du inte har aktiverat mappningar över 4 GB korrekt i värd-BIOS enligt beskrivningen i avsnittet "Värd-BIOS" ovan, eller att VMX-posterna inte har angetts korrekt.

Det går inte att använda enheten:
Om du har följt alla ovanstående instruktioner och den virtuella datorn har startat korrekt, men du ser ett meddelande som liknar följande när du kör nvidia-smi-verktyget i gästoperativsystemet:

1 Det gick inte att fastställa enhetshandtaget för GPU 0000:13:00.0: Okänt fel

Vi föreslår att du kontaktar Nvidia direkt eller gör en webbsökning med hjälp av den här strängen för att hitta ytterligare information som kan vara till hjälp.

Article Properties


Affected Product

Servers, PowerEdge

Last Published Date

15 Dec 2022

Version

4

Article Type

How To