Den här bloggen hjälper dig att förstå varför övergången skedde från en sektordisk på 512 byte till en sektordisk på 4 096 byte. Bloggen ger också svar på varför 4096 byte (4K) sektordisk bör väljas för OS-installation. Bloggen förklarar först om sektorlayout för att förstå behovet av migrering, sedan ger den resonemang bakom migreringen och slutligen täcker den fördelarna med 4K-sektorenhet över 512 byte sektorenhet.
En sektor är den minsta lagringsenheten på en hårddisk. Det är en underavdelning av ett spår på en hårddisk. Sektorstorleken är en viktig faktor i utformningen av operativsystemet eftersom den representerar atomenheten för I/O-åtgärder på en hårddisk. I Linux kan du kontrollera storleken på disksektorn med kommandot "fdisk -l".
Bild 1: Disksektorns storlek i Linux
Som du ser i bild 1 är både den logiska och den fysiska sektorn 512 byte långa för det här Linux-systemet.
Sektorindelningen är uppbyggd på följande sätt:
Varje sektor lagrar en fast mängd användardata, vanligtvis 512 byte för hårddiskar. Men tack vare bättre dataintegritet med högre densiteter och robusta felkorrigeringsfunktioner lagrar nyare hårddiskar nu 4 096 byte (4K) i varje sektor.
Antalet bitar som lagras på en given spårlängd betecknas som ytdensitet. Att öka ytdensiteten är en trend inom hårddiskindustrin, inte bara för att det gör att större mängder data kan lagras i samma fysiska utrymme, utan också för att det förbättrar överföringshastigheten med vilken mediet kan fungera. I och med ökningen av ytdensiteten har sektorn nu förbrukat en allt mindre mängd utrymme på hårddiskens yta. Detta skapar ett problem eftersom den fysiska storleken på sektorerna på hårddiskarna har krympt men inte mediedefekter. Om data i en hårddisksektor förbrukar mindre områden blir felkorrigering en utmaning. Det beror på att mediedefekter av samma storlek kan skada en större andel av data på disken som har liten yta för en sektor än disken som har stor area för en sektor.
Det finns två sätt att lösa detta problem. Det första sättet är att investera mer diskutrymme i ECC-byte för att säkerställa fortsatt datatillförlitlighet. Men om vi investerar mer diskutrymme i ECC-byte kommer det att leda till mindre effektivitet i diskformatet. Diskformatets effektivitet definieras som (antal byte användardata X 100) / totalt antal byte på disken. En annan nackdel är att ju fler ECC-bitar som ingår, desto mer processorkraft kräver diskstyrenheten för att bearbeta ECC-algoritmen.
Den andra metoden är att öka storleken på datablocket och öka ECC-byte något för varje datablock. Med ökningen av datablockens storlek skulle mängden omkostnader som krävs för varje sektor för att lagra kontrollinformation som mellanrum, synkronisering, adressmarkeringssektion etc. minska. För varje sektor ökar ECC-byte, men det totala antalet ECC-byte som krävs för en disk minskar på grund av större sektor. Genom att minska det totala utrymmet som används för felkorrigeringskod förbättras formateffektiviteten, och antalet ECC-byte för varje sektor ger möjlighet att använda effektivare och kraftfullare felkorrigeringsalgoritmer. Övergången till en större sektorstorlek har därför två fördelar: förbättrad tillförlitlighet och större diskkapacitet.
Ur ett dataflödesperspektiv bör den idealiska blockstorleken vara ungefär lika med den karakteristiska storleken för en typisk datatransaktion. Vi måste erkänna att den genomsnittliga filstorleken idag är mer än 512 byte. Nu för tiden använder program i moderna system data i stora block, mycket större än den traditionella sektorstorleken på 512 byte. För små blockstorlekar orsakar för mycket transaktionskostnader. Vid stora blockstorlekar överför varje transaktion en stor mängd onödig data.
Storleken på en standardtransaktion i relationsdatabassystem är 4K. Konsensus inom hårddiskindustrin har varit att fysiska blockstorlekar på 4K-Block skulle ge en bra kompromiss. Det motsvarar också växlingsstorleken som används av operativsystem och processorer.
Figur-3: Formateffektivitetsförbättring i 4K-disk
Sektorformat på 512 byte | 4096 byte sektor format | |
Mellanrum, synkning och adressmarkering | 15 byte | 15 byte |
Användardata | 512 byte | 4096 byte |
Felkorrigeringskod | 50 byte | 100 byte |
Summa | 577 byte | 4 211 byte |
Formateffektivitet | 88,7 % | 97.3% |
Tabell 1: Formateffektivitetsförbättring i 4K-disk
Som vi ser i figur 2 är 4K-sektorerna 8 gånger så stora som traditionella 512 byte-sektorer. För samma datanyttolast behöver man därför 8 gånger mindre gap-, synkroniserings- och adressmarkeringssektioner och 4 gånger mindre felkorrigeringskodsektion. Genom att minska mängden utrymme som används för felkorrigeringskod och andra avsnitt som inte är data förbättras formateffektiviteten för 4K-format. Förbättrad formateffektivitet visas i figur-3 och tabell-1. Det finns en ökning med 8,6 % formateffektivitet för 4K-sektordisk jämfört med 512 byte sektordisk.
Figur-4: Mediedefekters effekt på diskdensiteten
Som visas i figur-4 är effekten av mediedefekter på en skiva med högre ytdensitet större än på en skiva med en skiva med lägre ytdensitet. När ytdensiteten ökar behöver vi fler ECC-byte för att behålla samma nivå av felkorrigeringsförmåga. 4K-formatet ger tillräckligt med utrymme för att utöka ECC-fältet från 50 till 100 byte för att rymma nya ECC-algoritmer. Den förbättrade ECC-täckningen förbättrar möjligheten att upptäcka och korrigera bearbetade datafel utöver den defektlängd på 50 byte som är associerad med sektorformatet på 512 byte.
4K-datadiskar stöds på Windows Server 2012 men som startdisk stöds endast i UEFI-läge. För Linux kräver 4K-hårddiskar minst RHEL 6.1 och SLES 11 SP2. 4K-startenheter stöds endast i UEFI-läge i Linux. Kärnstöd för 4K-enheter finns i kernelversion 2.6.31 och senare. PERC H330-, H730-, H730P-, H830-, FD33xS- och FD33xD-kort har stöd för 4K-blocklagringsenheter, vilket gör att du kan använda lagringsutrymmet effektivt. 4K-diskar kan användas på Dell PowerEdge-servrar med stöd för PERC-kort ovan.
Den fysiska storleken på varje sektor på disken har blivit mindre till följd av ökad ytdensitet i diskenheter. Om antalet diskdefekter inte ökar i samma takt förväntar vi oss att fler sektorer skadas och att vi behöver en stark felkorrigeringskapacitet för varje sektor. Diskenheter med större fysiska sektorer och fler ECC-byte för varje sektor ger förbättrat dataskydd och korrigeringsalgoritmer. 4K-formatet bidrar till bättre formateffektivitet och förbättrar tillförlitligheten och felkorrigeringsförmågan. Den här övergången kommer att resultera i bättre användarupplevelser, därför bör 4K-enheten väljas för OS-installation.