Ce blog permet de comprendre pourquoi la transition s’est produite pour passer d’un disque secteur de 512 octets à un disque secteur de 4096 octets. Le blog donne également des réponses à la question de savoir pourquoi un disque secteur de 4096 octets (4K) devrait être choisi pour l’installation du système d’exploitation. Le blog explique d’abord la disposition des secteurs pour comprendre la nécessité de la migration, puis donne le raisonnement derrière la migration et enfin il couvre les avantages d’un lecteur de secteur de 4K par rapport à un disque de secteur de 512 octets.
Un secteur est l’unité de stockage minimale d’un disque dur. Il s’agit d’une subdivision d’une piste sur un disque dur. La taille de secteur est un facteur important dans la conception du système d’exploitation, car elle représente l’unité atomique des opérations d’E/S sur un disque dur. Sous Linux, vous pouvez vérifier la taille du secteur du disque à l’aide de la commande « fdisk -l ».
Figure 1 : Taille de secteur de disque sous Linux
Comme le montre la Figure 1, les secteurs logique et physique font 512 octets de long pour ce système Linux.
La disposition sectorielle est structurée comme suit :
Chaque secteur stocke une quantité fixe de données utilisateur, généralement 512 octets pour les disques durs. Mais en raison d’une meilleure intégrité des données à des densités plus élevées et de fonctionnalités de correction d’erreurs robustes, les nouveaux disques durs stockent désormais 4 096 octets (4 Ko) dans chaque secteur.
Le nombre de bits stockés sur une longueur de voie donnée est appelé densité surfacique. L’augmentation de la densité surfacique est une tendance dans le secteur des lecteurs de disque, non seulement parce qu’elle permet de stocker des volumes de données plus importants dans le même espace physique, mais aussi parce qu’elle améliore la vitesse de transfert à laquelle ce support peut fonctionner. Avec l’augmentation de la densité surfacique, le secteur consomme désormais une quantité de plus en plus réduite d’espace sur la surface du disque dur. Cela pose problème, car la taille physique des secteurs sur les disques durs a diminué, mais pas les défauts des supports. Si les données d’un secteur de disque dur consomment de plus petites surfaces, la correction des erreurs devient difficile. En effet, des défauts de média de même taille peuvent endommager un pourcentage plus élevé des données du disque dont la zone est réduite pour un secteur que celui du disque dont la zone est grande pour un secteur.
Il existe deux approches pour résoudre ce problème. La première approche consiste à investir plus d’espace disque dans les octets ECC pour garantir la fiabilité continue des données. Mais si nous investissons plus d’espace disque dans les octets ECC, cela se traduira par une réduction de l’efficacité du format de disque. L’efficacité du format de disque est définie comme (nombre d’octets de données utilisateur X 100) / nombre total d’octets sur le disque. Un autre inconvénient est que plus il y a de bits ECC, plus le contrôleur de disque nécessite de puissance de traitement pour traiter l’algorithme ECC.
La deuxième approche consiste à augmenter la taille du bloc de données et à augmenter légèrement les octets ECC pour chaque bloc de données. Avec l’augmentation de la taille des blocs de données, la quantité de surcharge requise pour chaque secteur pour stocker les informations de contrôle telles que l’écart, la synchronisation, la section de marque d’adresse, etc. diminuerait. Pour chaque secteur, le nombre d’octets ECC augmente, mais le nombre global d’octets ECC requis pour un disque diminue, car la taille du secteur est plus grande. La réduction de la quantité globale d’espace utilisée pour le code de correction d’erreur améliore l’efficacité du format. L’augmentation du nombre d’octets ECC pour chaque secteur permet d’utiliser des algorithmes de correction d’erreurs plus efficaces et plus puissants. Ainsi, la transition vers une taille de secteur plus grande présente deux avantages : une fiabilité améliorée et une plus grande capacité de disque.
Du point de vue du débit, la taille de bloc idéale doit être à peu près égale à la taille caractéristique d’une transaction de données classique. Force est de constater que la taille moyenne des fichiers dépasse aujourd’hui 512 octets. De nos jours, les applications des systèmes modernes utilisent les données dans des blocs volumineux, bien supérieurs à la taille de secteur traditionnelle de 512 octets. Des blocs de taille trop petite entraînent une surcharge de transaction trop importante. Alors que dans le cas de grandes tailles de blocs, chaque transaction transfère une grande quantité de données inutiles.
La taille d’une transaction standard dans les systèmes de base de données relationnelles est de 4 Ko. Le consensus dans l’industrie des disques durs a été que les tailles de blocs physiques de 4K-Block fourniraient un bon compromis. Elle correspond également à la taille de pagination utilisée par les systèmes d’exploitation et les processeurs.
Figure-3 : Amélioration de l’efficacité du format sur un disque 4K
Format de secteur de 512 octets | 4 096 octets formulaire de secteur | |
Écart, synchronisation et marque d’adresse | 15 octets | 15 octets |
Données utilisateur | 512 octets | 4 096 octets |
Error-correcting code (Code de correction d’erreur) | 50 octets | 100 octets |
Total | 577 octets | 4 211 octets |
Efficacité du format | 88,7 % | 97.3% |
Tableau 1 : Amélioration de l’efficacité du format sur un disque 4K
Comme nous le voyons sur la figure 2, les secteurs de 4K sont 8 fois plus grands que les secteurs traditionnels de 512 octets. Par conséquent, pour la même charge utile de données, il faut 8 fois moins de sections d’espace, de synchronisation et de marque d’adresse et 4 fois moins de section de code de correction d’erreur. La réduction de la quantité d’espace utilisée pour le code de correction d’erreur et d’autres sections autres que des données améliore l’efficacité du format pour le format 4K. L’amélioration de l’efficacité du format, illustrée à la Figure 3 et au Tableau 1, offre un gain de 8,6 % pour un disque à secteur de 4 Ko par rapport à un disque à secteur de 512 octets.
Figure 4 : Effet d’un défaut de support sur la densité du disque
Comme le montre la Figure 4, l’effet d’un défaut de support sur un disque ayant une densité aréolaire plus élevée est plus important que sur le disque doté d’un disque ayant une densité aréolaire plus faible. À mesure que la densité aréolaire augmente, nous avons besoin de plus d’octets ECC pour conserver le même niveau de capacité de correction d’erreur. Le format 4K offre suffisamment d’espace pour étendre le champ ECC de 50 à 100 octets afin de prendre en charge les nouveaux algorithmes ECC. La couverture ECC améliorée améliore la capacité à détecter et à corriger les erreurs de données traitées au-delà de la longueur de défaut de 50 octets associée au format de secteur de 512 octets.
Les disques de données 4K sont pris en charge sur Windows Server 2012, mais en tant que disque de démarrage, ils ne sont pris en charge qu’en mode UEFI. Pour Linux, les disques durs 4K nécessitent un minimum de RHEL 6.1 et SLES 11 SP2. Les disques de démarrage 4K ne sont pris en charge qu’en mode UEFI sous Linux. La prise en charge des disques 4K est disponible dans les versions 2.6.31 et ultérieures du noyau. Les cartes PERC H330, H730, H730P, H830, FD33xS et FD33xD prennent en charge des lecteurs de disque de taille de bloc de 4K, ce qui vous permet d’utiliser efficacement l’espace de stockage. Les disques 4K peuvent être utilisés sur les serveurs Dell PowerEdge prenant en charge les cartes PERC ci-dessus.
La taille physique de chaque secteur du disque est devenue plus petite en raison de l’augmentation des densités surfaciques dans les lecteurs de disque. Si le nombre de disques défectueux n’évolue pas au même rythme, nous nous attendons à ce que davantage de secteurs soient corrompus et nous avons besoin d’une forte capacité de correction des erreurs pour chaque secteur. Les lecteurs de disque dotés de secteurs physiques plus grands et d’octets ECC pour chaque secteur fournissent des algorithmes de protection et de correction des données améliorés. Le format 4K permet d’obtenir de meilleures efficacités de format et améliore la fiabilité et la capacité de correction des erreurs. Cette transition se traduira par de meilleures expériences utilisateur. Par conséquent, le lecteur 4K doit être choisi pour l’installation du système d’exploitation.