此博客有助於了解為什麼會發生從 512 位元組扇區磁碟到 4096 位元組扇區磁碟的過渡。該博客還回答了為什麼應選擇4096位元組(4K)扇區磁碟進行操作系統安裝。該博客首先解釋了扇區佈局以瞭解遷移的需求,然後給出了遷移背後的原因,最後它涵蓋了 4K 扇區驅動器超過 512 位元組扇區驅動器的好處。
磁區是硬碟驅動器的最小儲存單位。它是硬碟驅動器上磁軌的細分。磁區大小是作業系統設計的重要因素,因為它代表硬碟機上 I/O 作業的原子單位。在 Linux 中,您可以使用「fdisk -l」命令檢查磁碟磁區的大小。
圖 1:Linux 中的磁碟磁區大小
如圖 1 所示,此 Linux 系統的邏輯扇區和物理扇區的長度均為 512 位元組。
扇區佈局結構如下:
每個扇區存儲固定數量的用戶數據,傳統上硬碟驅動器為512位元組。但是,由於在更高密度下具有更好的數據完整性和強大的糾錯功能,現在較新的HDD在每個磁區中存儲4096位元組(4K)。
存儲在給定軌道長度上的位數稱為面密度。增加面密度是磁碟驅動器行業的一種趨勢,不僅因為它允許在同一物理空間中存儲更多的數據,而且還提高了該介質可以運行的傳送速率。隨著磁面密度的增加,該扇區現在在硬碟表面上消耗的空間越來越少。這會產生問題,因為硬碟上的磁區實體大小已縮小,但媒體缺陷卻沒有。如果硬碟磁區中的資料消耗的區域較小,則糾錯變得困難。這是因為相同大小的媒體缺陷可能會比磁區面積較大的磁碟中損壞更高比例的資料。
有兩種方法可以解決此問題。第一種方法是在ECC位元組上投入更多的磁碟空間,以確保持續的數據可靠性。但是,如果我們在ECC位元組上投入更多的磁碟空間,這將導致磁碟格式效率降低。磁碟格式效率定義為(用戶數據位元組數 X 100)/磁碟上的位元組總數。另一個缺點是包含的 ECC 位越多,磁碟控制器需要更多的處理能力來處理 ECC 演演演算法。
第二種方法是增加數據塊的大小,並略微增加每個數據塊的ECC位元組。隨著數據塊大小的增加,每個扇區存儲控制資訊(如間隙、同步、位址標記部分等)所需的開銷量將減少。對於每個扇區,ECC 位元組將會增加,但由於磁區較大,磁碟所需的總體 ECC 位元組會減少。減少用於糾錯碼的總空間量可提高格式效率,並增加每個扇區的 ECC 位元組,從而能夠使用更高效、更強大的糾錯演演演算法。因此,轉換為更大的磁區大小有兩個好處:更高的可靠性和更大的磁碟容量。
從輸送量的角度來看,理想的塊大小應大致等於典型數據事務的特徵大小。我們必須承認,今天的平均檔大小超過512位元組。如今,現代系統中的應用程式會以大型區塊的方式使用資料,遠比傳統的 512 位元組磁區大小大。太小的塊大小會導致過多的事務開銷。而在大塊大小的情況下,每個事務都會傳輸大量不必要的數據。
關係數據基礎系統中標準事務的大小為 4K。硬碟驅動器行業的共識是,4K-Block的物理塊大小將提供一個很好的折衷方案。它也對應作業系統和處理器使用的分頁大小。
圖 3:4K 磁碟格式效率提升
512 位元組磁區格式 | 4096 位元組磁區形式 | |
間隙、同步和地址標記 | 15 位元組 | 15 位元組 |
使用者資料 | 512 位元組 | 4096 位元組 |
糾錯碼 | 50 位元組 | 100 位元組 |
合計 | 577 位元組 | 4211 位元組 |
格式效率 | 88.7% | 97.3% |
表 1:4K 磁碟格式效率提升
如圖 2 所示,4K 扇區是傳統 512 位元組扇區的 8 倍。因此,對於相同的數據有效負載,需要減少 8 倍的差距、同步和地址標記部分,以及減少 4 倍的糾錯代碼部分。減少糾錯碼和其他非數據部分使用的空間量可提高 4K 格式的格式效率。格式效率改善如圖 3 和表 1 所示,4K 磁區磁碟的格式效率比 512 位元組磁區磁碟增益 8.6%。
圖 4:媒體缺陷對磁碟密度的影響
如圖4所示,介質缺陷對面密度較高的磁碟的影響大於面密度較低的磁碟。隨著面密度的增加,我們需要更多的ECC位元組來保持相同級別的糾錯能力。4K 格式提供了足夠的空間,可以將 ECC 欄位從 50 位元組擴展到 100 位元組,以適應新的 ECC 演演演演算法。增強的 ECC 覆蓋範圍提高了檢測和糾正處理數據錯誤的能力,這些錯誤超出了與 512 位元組扇區格式關聯的 50 位元組缺陷長度。
Windows Server 2012 支援 4K 資料磁碟,但開機磁碟僅在 UEFI 模式中受支援。若為 Linux,4K 硬碟至少需要 RHEL 6.1 和 SLES 11 SP2。只有在 Linux 的 UEFI 模式中才支援 4K 開機磁碟機。內核版本 2.6.31 及更高版本提供對 4K 驅動器的內核支援。PERC H330、H730、H730P、H830、FD33xS 及 FD33xD 卡支援 4K 區塊大小的磁碟機,可讓您有效運用儲存空間。4K 磁碟可用於支援上述 PERC 卡的 Dell PowerEdge 伺服器。
由於磁碟驅動器的面密度增加,磁碟上每個扇區的物理大小已變小。如果磁碟缺陷的數量沒有以相同的速率縮放,那麼我們預計會有更多的扇區被破壞,我們需要為每個扇區提供強大的糾錯能力。具有較大實體磁區及每個磁區較多 ECC 位元組的磁碟機,可提供增強的資料保護和修正演算法。4K 格式有助於實現更好的格式效率,並提高可靠性和糾錯能力。此轉換將帶來更好的用戶體驗,因此應選擇 4K 驅動器進行作業系統安裝。