Denne bloggen bidrar til å forstå hvorfor overgangen skjedde fra 512 byte sektor disk til 4096 byte sektor disk. Bloggen gir også svar på hvorfor 4096 byte (4K) sektordisk bør velges for OS-installasjon. Bloggen forklarer først om sektoroppsett for å forstå behovet for migrering, deretter gir den begrunnelse bak migreringen, og til slutt dekker den fordelene med 4K-sektorkjøring over 512 byte sektorstasjon.
En sektor er minste lagringsenhet for en harddisk. Det er en underinndeling av et spor på en harddisk. Sektorstørrelsen er en viktig faktor i utformingen av operativsystemet fordi den representerer atomenheten for I / O-operasjoner på en harddisk. I Linux kan du sjekke størrelsen på disksektoren ved å bruke kommandoen "fdisk -l".
Figur 1: Disksektorstørrelsen i Linux
Som vist i figur 1 er både de logiske og fysiske sektorene 512 byte lange for dette Linux-systemet.
Sektoroppsettet er strukturert som følger:
Hver sektor lagrer en fast mengde brukerdata, tradisjonelt 512 byte for harddisker. Men på grunn av bedre dataintegritet ved høyere tettheter og robuste funksjoner for feilkorrigering, lagrer nyere harddisker nå 4096 byte (4K) i hver sektor.
Antall biter lagret på en gitt banelengde betegnes som arealtetthet. Økende arealtetthet er en trend i diskstasjonsindustrien, ikke bare fordi det gjør det mulig å lagre større datamengder i samme fysiske rom, men det forbedrer også overføringshastigheten som mediet kan operere med. Med økningen i arealtettheten har sektoren nå forbrukt en mindre og mindre mengde plass på harddiskoverflaten. Dette skaper et problem fordi den fysiske størrelsen på sektorene på harddisker har krympet, men mediefeil har ikke. Hvis dataene i en harddisksektor bruker mindre områder, blir feilretting utfordrende. Dette skyldes at mediefeil av samme størrelse kan skade en høyere prosentandel av dataene på disken, som har lite område for en sektor enn disken som har stort område for en sektor.
Det er to tilnærminger for å løse dette problemet. Den første tilnærmingen er å investere mer diskplass i ECC-byte for å sikre fortsatt datapålitelighet. Men hvis vi investerer mer diskplass til ECC-byte, vil dette føre til mindre diskformateffektivitet. Diskformateffektivitet er definert som (antall brukerdatabyte X 100) / totalt antall byte på disken. En annen ulempe er at jo flere ECC-biter som er inkludert, krever diskkontrolleren mer prosessorkraft for å behandle ECC-algoritmen.
Den andre tilnærmingen er å øke størrelsen på datablokken og øke ECC-bytene litt for hver datablokk. Med økningen av datablokkstørrelsen vil mengden overhead som kreves for hver sektor for å lagre kontrollinformasjon som gap, synkronisering, adressemerkeseksjon etc. reduseres. For hver sektor vil ECC-byte øke, men den totale ECC-byten som kreves for en disk, reduseres på grunn av større sektor. Reduksjon av den totale mengden plass som brukes til feilkorrigeringskode, forbedrer formateffektiviteten, og økte ECC-byte for hver sektor gir mulighet til å bruke mer effektive og kraftige feilkorrigeringsalgoritmer. Dermed har overgang til en større sektorstørrelse to fordeler: forbedret pålitelighet og større diskkapasitet.
Fra et gjennomstrømningsperspektiv bør den ideelle blokkstørrelsen være omtrent lik den karakteristiske størrelsen til en typisk datatransaksjon. Vi må erkjenne at den gjennomsnittlige filstørrelsen i dag er mer enn 512 byte. Nå om dagen bruker applikasjoner i moderne systemer data i store blokker, mye større enn den tradisjonelle sektorstørrelsen på 512 byte. For små blokkstørrelser forårsaker for mye transaksjonskostnader. Mens i tilfelle av store blokkstørrelser, overfører hver transaksjon en stor mengde unødvendige data.
Størrelsen på en standard transaksjon i relasjonsdata Basesystemer er 4K. Konsensus av mening i harddiskindustrien har vært at fysiske blokkstørrelser på 4K-blokk ville gi et godt kompromiss. Det tilsvarer også personsøkingsstørrelse som brukes av operativsystemer og prosessorer.
Figur 3: Formateffektivitetsforbedring på 4K-disk
512 byte sektorformat | 4096 byte sektor format | |
Gap, synkronisering og adressemerke | 15 bytes | 15 bytes |
Brukerdata | 512 bytes | 4096 byte |
Feilretting av kode | 50 bytes | 100 bytes |
Totalt | 577 bytes | 4211 bytes |
Formateffektivitet | 88,7 % | 97.3% |
Tabell 1: Formateffektivitetsforbedring på 4K-disk
Som vi ser i figur 2, er 4K-sektorer 8 ganger så store som tradisjonelle 512 byte. Derfor, for samme datanyttelast, trenger man 8 ganger mindre gap-, synkroniserings- og adressemerkeseksjoner og 4 ganger mindre feilkorrigeringskodeseksjon. Hvis du reduserer mengden plass som brukes til feilkorrigeringskode og andre deler som ikke er data, forbedrer du formateffektiviteten for 4K-format. Formateffektivitetsforbedring er vist i figur 3 og tabell 1, det er en gevinst på 8.6% formateffektivitet for 4K-sektordisk over 512byte sektordisk.
Figur 4: Effekt av mediefeil på disktetthet
Som vist i figur 4, er effekten av mediefeil på disk med høyere arealtetthet mer enn disken med disken med lavere arealtetthet. Etter hvert som arealtettheten øker, trenger vi flere ECC-byte for å beholde samme nivå av feilkorrigeringsevne. 4K-formatet gir nok plass til å utvide ECC-feltet fra 50 til 100 byte for å imøtekomme nye ECC-algoritmer. Den forbedrede ECC-dekningen forbedrer muligheten til å oppdage og korrigere behandlede datafeil utover feillengden på 50 byte som er knyttet til sektorformatet på 512 byte.
4K-datadisker støttes på Windows Server 2012, men som oppstartsdisk støttes bare i UEFI-modus. For Linux krever 4K-harddisker minst RHEL 6.1 og SLES 11 SP2. 4K-oppstartstasjoner støttes bare i UEFI-modus i Linux. Kjernestøtte for 4K-stasjoner er tilgjengelig i kjerneversjon 2.6.31 og nyere. PERC H330-, H730-, H730P-, H830-, FD33xS- og FD33xD-kort støtter diskstasjoner i 4K-blokkstørrelse, noe som gjør at du kan bruke lagringsplassen effektivt. 4K-disker kan brukes på Dell PowerEdge-servere som støtter over PERC-kort.
Den fysiske størrelsen på hver sektor på disken har blitt mindre som et resultat av økning i arealtettheter i diskstasjoner. Hvis antall diskfeil ikke skaleres i samme takt, forventer vi at flere sektorer blir ødelagt, og vi trenger sterk feilrettingsevne for hver sektor. Diskstasjoner med større fysiske sektorer og flere ECC-byte for hver sektor gir forbedret databeskyttelse og algoritmer for korrigering. 4K-formatet bidrar til å oppnå bedre formateffektivitet og forbedrer påliteligheten og feilkorrigeringsevnen. Denne overgangen vil resultere i bedre brukeropplevelser, derfor bør 4K-stasjonen velges for OS-installasjon.