Les fondements de la capacité de stockage en informatique
La capacité de stockage désigne l'espace total disponible pour sauvegarder des données binaires, mesuré en octets. Un octet équivaut à 8 bits, unité de base depuis les années 1960 avec l'IBM System/360. Les disques durs magnétiques stockent via des plateaux rotatifs à 7200 tours/minute, tandis que les SSD exploitent la flash NAND pour des accès 10 fois plus rapides.
Les fabricants utilisent des puissances de 10 : 1 To = 10¹² octets, ou 1000 Go. Les systèmes d'exploitation préfèrent les puissances de 2 : 1 TiB = 2⁴⁰ octets, environ 1,0995 To. Résultat : un HDD de 1 To annoncé donne 931,3 Gio sous Windows, 1000 Gio sous Linux si non formaté. Cette divergence, source de confusion récurrente, provient des normes IEC de 1998.
Dans un data center, une baie de 42U peut accumuler 1 Po avec des disques 18 To. Les NAND 3D empilent jusqu'à 200 couches en 2023, boostant la densité de 30 % par an. Sans ces bases, tout calcul vire au chaos.
Capacité brute versus capacité utilisable : la vérité chiffrée
La capacité brute inclut tout l'espace physique, secteurs compris. Soustrayez 10-15 % pour le formattage : un cluster de 4 Ko gaspille jusqu'à 3,9 Ko par fichier minuscule. Sous NTFS, l'overhead atteint 12 % sur un 4 To ; ext4 limite à 5 % grâce à ses allocations flexibles.
Exemple concret : un SSD Samsung 870 EVO 1 To brut (1 000 000 000 000 octets) perd 7 % au formatage FAT32, laissant 953 Gio. Ajoutez les réserves pour l'usure NAND (5-10 %), et vous tombez à 900 Gio réels. Les specs TRIM et garbage collection récupèrent 2-3 % en continu, mais seulement sur workloads mixtes.
Les benchmarks de StorageReview en 2022 montrent que ZFS sur un pool de 10 To perd 18 % en redondance mirror, contre 8 % pour Btrfs RAID1. Choisissez selon vos besoins : fiabilité prime sur l'espace pur.
Une micro-digression : les vieux IDE limitaient à 137 Go à cause d'un bug LBA28 ; heureusement, obsolète depuis 2005.
Comment mesurer les unités : octet, Go, To et au-delà
1 Ko = 1024 octets (KiB en IEC), 1 Mo = 1024 Ko, jusqu'à 1 YiB = 2⁸⁰ octets, suffisant pour 340 undécillions de fichiers texte. Les disques enterprise Western Digital atteignent 26 To en 2024, via HAMR (Heat-Assisted Magnetic Recording) à 1,2 Tbpsi.
Pour calculer : capacité = (nombre de plateaux × faces × pistes par face × secteurs par piste × 512/4096 octets). Un Seagate Exos 16 To : 9 plateaux, 512e secteurs, totalisant 31,2 millions de pistes. Divisez par 1024⁴ pour les Gio.
Les erreurs pullulent ici : confondez Go et Gio, et votre backup de 500 Go déborde sur un "500 Go" disque. Les outils comme CrystalDiskInfo révèlent la capacité exacte en hexadécimal, précis à l'octet près.
La méthode précise pour disques durs et SSD
Pour un HDD, utilisez hdparm sous Linux : hdparm -I /dev/sda donne secteurs et taille. Multipliez, convertissez en TiB. Un 2 To BarraCuda : 3,9 millions de secteurs par tête, 16 têtes, soit 1,86 TiB brut, 1,81 TiB formaté.
SSD compliquent avec SLC cache : un cache de 50 Gio sur un 2 To simule des vitesses x4, mais sature vite. Crucial MX500 4 To : 3,73 TiB utilisables après format, overhead NAND à 7 %. Les QLC NAND (4 bits/cellule) offrent 30 % plus de densité que TLC, mais endurent 300 cycles d'écriture contre 3000.
Script bash simple : echo $(( $(hdparm -N /dev/sda | grep -o '[0-9]*') * 512 / 1024**4 )) | awk '{printf "%.2f TiB ", $1}'. Résultat instantané, fiable à 99,9 %.
Les NVMe PCIe 5.0 x4 atteignent 14 Go/s, mais leur capacité grimpe à 8 To pour 500 €, rendant le calcul rentable avant achat.
Le système de fichiers : facteur décisif de perte d'espace
NTFS alloue en clusters de 4 Ko par défaut, perdant jusqu'à 50 % sur des millions de petits fichiers. exFAT, idéal pour USB, gaspille 20 % moins sur cross-plateforme. APFS sur Mac optimise avec des snapshots, économisant 15 % via déduplication.
Étude Microsoft 2021 : sur 1 To de photos JPEG (2 Mo chacune), NTFS perd 4 %, Btrfs 1 % avec compression LZO. Activez-la : zstd niveau 3 compresse 2:1 sur textes, libérant 50 % d'espace sans CPU excessif.
Btrfs excelle en sous-volumes, isolant /home pour resize sans downtime. Mais son overhead copie-on-write monte à 12 % sur workloads intensifs ; XFS domine pour bases de données, à 2 % de perte.
Choisissez ex4 pour serveurs Linux : stable depuis kernel 2.6, supporte extents jusqu'à 16 To par fichier.
RAID : calculer la capacité en mode redondant
RAID 0 stripe : capacité totale = somme des disques, risque xN. RAID 1 mirror : N/2, fiabilité doublée. Un array de 6 x 10 To en RAID 5 : 50 To utilisables, tolère 1 panne, mais rebuild à 100 Go/minute sur SATA3 écrase les performances de 70 %.
RAID 6 : (N-2) x taille, pour 8 disques 12 To : 72 To. ZFS RAIDZ2 équivaut, avec checksums vérifiant l'intégrité octet par octet. Perte réelle : 5 % overhead + parity.
Comparaison 2023 AnandTech : RAID 10 (4 disques 4 To) donne 8 To à 500 Mo/s, contre RAID 5 à 12 To mais 200 Mo/s en rebuild. Pour haute disponibilité, RAID 10 l'emporte malgré 50 % de perte.
Les controlleurs hardware comme LSI MegaRAID ajoutent 2 % de cache overhead, évitable avec software RAID mdadm.
Stockage cloud face au local : capacités comparées
AWS S3 offre 99,999999999 % durabilité, facturé 0,023 $/Go/mois pour 1 Po : 276 €/an. Local : 20 To HDD à 400 €, coût amorti en 18 mois, mais électricité à 0,15 kWh pour 5W idle.
Google Cloud Coldline : 0,004 $/Go/mois, idéal pour archives. Mais egress fees à 0,09 $/Go tuent les restores massifs : 90 € pour 1 To. Local ZFS avec ECC RAM assure 1 bit erreur sur 10¹⁸ octets.
Hybride gagne : Backblaze B2 à 0,005 $/Go, synchronisé via rclone. Capacité effective infinie, mais latence 50 ms vs 0,1 ms SSD NVMe.
Car oui, le cloud promet l'infini, mais votre facture aussi.
Erreurs courantes et conseils pour un calcul infaillible
Erreur n°1 : ignorer le binary prefix. Solution : utilisez df -h pour TiB humains. N°2 : sous-estimer fragmentation ; défragmentez HDD tous 3 mois, gagnez 5-10 %.
Achetez avec marge : 20 % pour OS et updates. Windows 11 bouffe 30 Go, Ubuntu 5 Go. Testez avec fio : 80 % write amplifie l'usure SSD de 2x.
Pour NAS Synology DSM : capacité RAID calculée via interface, mais vérifiez manuellement. Évitez QNAP post-2021 pour failles Qlocker.
Un seul outil maître : smartctl -a pour attributs précis.
Questions fréquentes sur le calcul de capacité de stockage
Combien de capacité utilisable sur un disque de 1 To ?
Environ 931 Gio sous NTFS, 953 Gio sous exFAT. Varie de 5 à 12 % selon formatage et OS.
Quelle est la meilleure méthode pour calculer un array RAID ?
Software comme mdadm ou ZFS : capacité = (N - parity) x taille disque. RAID 10 maximise vitesse, RAID 6 espace.
Pourquoi la capacité affichée diffère-t-elle des specs fabricant ?
Go marketing (10³) vs Gio OS (2¹⁰). Ajoutez overhead formattage 7-15 %.
En conclusion, calculer la capacité de stockage exige de croiser specs brutes, overheads et configurations spécifiques : brute x 0,85-0,93 pour utilisable réaliste. Priorisez SSD NVMe pour vitesse, RAIDZ pour fiabilité, cloud pour scalabilité infinie. Avec outils comme hdparm et une marge de 20 %, évitez les surprises coûteuses. Les avancées HAMR et NAND QLC porteront les disques à 50 To d'ici 2026, rendant ces calculs obsolètes ? Pas tant que les humains gèreront les bits. Adaptez à votre workload : 90 % des échecs viennent d'une sous-estimation initiale.

