Voor opslag van gebruikersdata gebruiken we MooseFS, een gedistribueerd bestandssysteem. Van elk bestand worden meerdere kopieën bewaard op verschillende fysieke servers. Echt een briljant systeem, waar we later vast nog eens wat over schrijven.
Elke MooseFS chunk staat nu op een traditionele harddisk - maar niet lang meer. Binnen een paar weken stappen we over naar SSD: 20x Samsung 850 Pro van 1 TB.
Het was een interessante zoektocht naar de ideale SSD voor ons.
De goedkoopste SSD van 500 GB heb je voor zo'n 100 euro, de duurdere enterprise SSD's kosten ver boven de 1000 euro per stuk.
Voor ons is performance geen issue, voor ons doel zijn alle SSD's snel genoeg. Waar wij op moeten letten zijn twee dingen: levensduur en datacorruptie.
Levensduur
De verwachte levensduur van een SSD wordt voornamelijk bepaald door het aantal geschreven bytes.
De durability van een SSD wordt uitgedrukt in TBW (terabytes written) of DWPD (disk writes per day). De TBW is een totaal voor de levensduur van de SSD, de DWPD is gedurende de garantieperiode.
Je kunt ze naar elkaar omrekenen. Een disk van 1 TB met een DWPD van 1.0 en een garantieperiode van 5 jaar heeft een TBW van 365 * 5 * 1 = 1825.
Als je veel schrijft, is het slimmer om een drive te nemen met een grote TBW, anders moet je 'm snel weer vervangen.
Daarmee kun je SSD's vergelijken, bijvoorbeeld:
- Samsung 850 EVO - 150 TBW (280 euro ex btw)
- Samsung 850 Pro - 300 TBW (350 euro ex btw)
- Samsung PM863 - 1.400 TBW (425 euro ex btw)
- Samsung SM863 - 6.160 TBW (475 euro ex btw)
Echter, bij een consumer SSD is het geen garantie, bij een enterprise SSD wel. Dus wat zegt het getal echt?
Bij techreport.com hebben ze een 18 maanden durend experiment gedaan met consumer SSD's. Daar bleek dat de Samsung 840 Pro met garantie tot 73 TBW pas na 2400 TB overleed.
Wij schrijven nu op elke chunk gemiddeld 10 MB/s. Dat betekent zo'n 0,8 TB per dag. Als de Samsung 850 Pro het net zo goed doet als de 840 Pro dan kunnen we daar ruim 8 jaar mee vooruit.
Daarnaast kunnen we de hoeveelheid data die geschreven wordt nog flink verminderen door onze software slimmer te maken.
Tot slot hebben we door de overvloedige redundantie van MooseFS geen downtime als een schijf kapot gaat.
Wat dit betreft kunnen we dus gerust voor consumer SSD's gaan.
Data corruptie
Elke SSD heeft geavanceerde foutcontrole (ECC) om spontane datacorruptie te detecteren en corrigeren. Soms blijkt een fout niet corrigeerbaar, of erger nog, niet gedetecteerd.
Enterprise SSD's hebben een veel hogere standaard voor foutdetectie en -correctie dan consumer SSD's.
Maar hebben wij dat nodig? Opnieuw kwam MooseFS ons te hulp. Die controleert ook of de gelezen data klopt met controlegegevens die op een andere machine staan.
Ook wat dit betreft dus geen reden om dure enterprise SSD's te kopen.
Conclusie
Daarom hebben we gekozen voor consumer SSD's, en wel de Samsung 850 Pro. De snelheid van deze SSD is top en de voorloper had een lange levensduur.
Komende weken nemen we ze in gebruik. We zijn benieuwd!