Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

Technologia Intel Cluster-On-Di (COD) w oprogramowaniu VMware ESXi

Summary: Intel Cluster on Die, COD, VMware ESXi, wiele węzłów NUMA na gniazdo procesora,

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Wprowadzenie

    W systemach z obsługą NUMA kanały pamięci są rozmieszczone w procesorach. Wszystkie operacje związane z pamięcią wymagają operacji snoop w celu zachowania spójności danych w pamięci podręcznej. Snooping służy do sondowania zawartości pamięci podręcznej zarówno na procesorach lokalnych, jak i zdalnych w celu znalezienia kopii żądanych danych znajdujących się w dowolnej pamięci podręcznej.  Jeśli funkcja NUMA jest wyłączona (przeplot węzła jest włączony w systemie BIOS), tryb snoop jest wyłączany automatycznie.

        W mikroarchitekturze Intel Haswell dostępne są trzy typy trybu snoop. Serwery Dell 13. generacji (13G) obsługują wszystkie trzy tryby szpiegowania, takie jak:

1) Wczesny szpieg

2) Szpiegowanie w domu

3) Klaster na matrycy

W tym blogu omawiamy tryb snoop Cluster-On-Die (COD) w odniesieniu do VMware ESXi. Na tym blogu omówiono następujące aspekty.

  • Podstawy ChZT
  • Wymagania wstępne umożliwiające włączenie ChZT zarówno ze sprzętu, jak i z punktu widzenia VMware ESXi
  • Kilka opcji wiersza poleceń w oprogramowaniu ESXi, które pokazują różnicę na liście NUMA z włączoną i wyłączoną funkcją COD.

Zanim przejdziemy do szczegółów COD, konieczne jest zrozumienie typów procesorów w oparciu o liczbę rdzeni w mikroarchitekturze procesorów Intel Haswell.

Firma Intel sklasyfikowała architekturę procesora Haswell do następujących typów:

1) LCC - niska liczba rdzeni [4 -8 rdzeni]

2) MCC - średnia liczba rdzeni [10 - 12 rdzeni]

3) HCC - Wysoka liczba rdzeni [14-18 rdzeni]

                   UWAGA: Ta liczba rdzeni różni się w zależności od mikroarchitektury Intel.

 

Co to jest tryb Cluster-On-Die (COD)?

COD to nowy tryb snoop wprowadzony z rodziny procesorów Intel Haswell, która ma 10 lub więcej rdzeni. W przypadku kategorii procesorów MCC i HCC firma Intel zainstalowała dwa kontrolery pamięci w jednym gnieździe procesora, podczas gdy procesor LCC ma tylko jeden kontroler pamięci. Każdy kontroler pamięci w gnieździe procesora działa jako jeden agent domowy [HA].

Na serwerach z obsługą COD każdy procesor logicznie dzieli gniazdo na 2 węzły NUMA Każdy węzeł NUMA ma połowę całkowitej liczby rdzeni fizycznych i połowę pamięci podręcznej ostatniego poziomu (LLC) z jednym agentem głównym. Termin klaster jest tworzony, gdy rdzenie procesora i odpowiedni kontroler pamięci są zgrupowane razem i utworzone jako klaster na kości gniazda. Każdy agent główny korzysta z dwóch kanałów pamięci i widzi żądania z mniejszej liczby rdzeni logicznych procesora, zapewniając w ten sposób większą przepustowość pamięci i niskie opóźnienia. Ten tryb pracy jest używany głównie do optymalizacji obciążeń roboczych NUMA. Systemy operacyjne wyświetlają liczbę węzłów NUMA poprzez odczyt tabel ACPI SRAT.

Graficzna reprezentacja ChZT jest następująca: -
SLN315049_en_US__1COD_Disabled
SLN315049_en_US__2COD_Enabled.jpg
 

Na drugim obrazku widać, że pojedyncza kość procesora jest podzielona na dwa logiczne węzły, gdy włączony jest ChZT. 

Wymagania wstępne:

W tej sekcji omówiono wymagania wstępne zarówno z punktu widzenia sprzętu, jak i VMware ESXi.

Sprzęt:

  • Moduł COD można włączyć tylko w przypadku procesora Intel Haswell-EP z co najmniej 10 rdzeniami.
  • Pamięć musi być zapełniona na alternatywnych kanałach pamięci (CH0, CH2, CH1 i CH3). Na przykład serwer R730, R730xd, R630 i T630 ma 4 kanały pamięci na gniazdo.SLN315049_en_US__3Memory_Population

              Weźmy przykład, aby lepiej zrozumieć powyższy warunek wstępny. W przypadku serwera, na którym zapełniono tylko dwa moduły pamięci na kanał, należy zapełnić następujące gniazda dla określonego kanału

  • A1 i A3 

 Z 4 modułami pamięci,

  • A1, A3 i B1, B3

 Z 8 modułami pamięci,

  • A1, A3, B1, B3 i A2, A4, B2, B4

UWAGA: Aby włączyć COD, należy wypełnić co najmniej dwa moduły pamięci.

  • Token Cluster On Die musi być włączony w ustawieniach systemu BIOS.
SLN315049_en_US__4BIOS_Settings
 
  • Wsparcie VMware dla COD rozpoczęło się od vSphere 6.0 na początku, a teraz jest obsługiwane również w ESXi 5.5 U3b. Szczegółowe informacje można znaleźć w 2142499 bazy wiedzy VMware. 
Jak sprawdzić status COD w VMware ESXi?

VMware ESXi odczytuje ACPI SRAT (System Resource Affinity Tables) i SLIT (System Locality Information Tables) w celu identyfikacji i mapowania dostępnych zasobów sprzętowych. Obejmuje to również mapowanie węzłów NUMA. W tej sekcji omówiono kilka opcji wiersza poleceń, z których użytkownicy mogą skorzystać, aby wyświetlić stan COD z VMware ESXi.

  • esxtop udostępnia opcję wyświetlania wypełnionych węzłów NUMA. Po wprowadzeniu polecenia esxtop naciśnij "m", aby wyświetlić szczegóły węzłów NUMA w następujący sposób.

Poniższe zrzuty ekranu dotyczą systemu z dwoma gniazdami procesorów i 128 GB pamięci systemowej. W domyślnej konfiguracji bez włączonego COD, esxtop wyświetli dwa węzły NUMA z 64 GB przydzielonymi na węzeł NUMA. Na poniższej ilustracji przedstawiono dane wyjściowe polecenia esxtop w VMware ESXi z wyłączonym dorszem. 
SLN315049_en_US__5esxtop_COD_Disabled

Przy włączonym ChZT esxtop wyświetla cztery węzły NUMA zamiast dwóch, ponieważ pojedyncza kość gniazda procesora jest podzielona na dwa.

SLN315049_en_US__6esxtop_COD_Enabled.jpg
esxcli udostępnia kilka opcji wiersza polecenia, które umożliwiają wyświetlanie liczby węzłów NUMA uwidocznionych ze sprzętu.
SLN315049_en_US__7esxcli

Korzyści

W trybie COD system operacyjny widzi dwa węzły NUMA na gniazdo. COD ma najlepsze lokalne opóźnienie. Każdy agent główny widzi żądania z mniejszej liczby wątków, potencjalnie oferując większą przepustowość pamięci. Tryb COD ma obsługę bitów w katalogu pamięci. Ten tryb jest najlepszy w przypadku obciążeń roboczych zoptymalizowanych pod kątem standardu NUMA. Zapoznaj się z blogiem opublikowanym przez zespół HPC firmy Dell, w którym szczegółowo opisano różne tryby podsłuchiwania. 

Odniesienia

Baza wiedzy VMware z obsługą Intel COD Kliknięcie tego hiperłącza powoduje wyświetlenie strony spoza witryny Dell Technologies.

Cause

Nie dotyczy

Resolution

Nie dotyczy

Article Properties
Article Number: 000147278
Article Type: Solution
Last Modified: 11 Dec 2024
Version:  8
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.