Redundantie is cruciaal voor de beschikbaarheid van netwerken en it-systemen. In de huidige economie zijn de schadeposten fors bij uitval van applicaties, data en systemen. Hoe bereik je de ultieme redundantie?
1. Zorg voor fysiek gescheiden infrastructuur
De noodzaak voor een redundante fysieke infrastructuur wordt nogal eens onderschat. Veel organisaties gaan er, vaak ten onrechte, vanuit dat er door gebruik te maken van twee verschillende infrastructuurleveranciers automatisch sprake is van redundantie. ‘Wat ze zich daarbij niet realiseren is dat de verbindingen van die leveranciers best eens in dezelfde geul kunnen liggen. De kans dat beide verbindingen beschadigd raken door graafwerkzaamheden of een andere calamiteit wordt daarmee groter dan wanneer de infrastructuren daadwerkelijk volledig fysiek van elkaar gescheiden zijn’, zegt Rudi de Visser, senior solution architect bij Eurofiber. Ook bestaat het risico dat de twee verschillende leveranciers op hetzelfde moment onderhoud aan de verbinding plegen, waardoor de verbinding tijdelijk moet worden onderbroken.
2. Voer actieve netwerkapparatuur dubbel uit
Redundantie wordt bereikt door het dupliceren van componenten zodat er een back-up beschikbaar is wanneer er iets uitvalt. Bij uitval van een van de componenten worden de activiteiten naadloos door een andere component overgenomen. ‘Als een organisatie kiest voor een redundante infrastructuur en een twin datacenter met synchrone replicatie toepast (waarbij het ene datacenter dus zou kunnen uitvallen en het andere het dan automatisch overneemt), is het noodzakelijk om ook de netwerkswitches en routers dubbel uit te voeren. Als dat niet gebeurt, vormt de actieve netwerkapparatuur het single point of failure.’
Ook de hardware in de it-omgeving kan dubbel worden uitgevoerd. Voor servers zijn er hot-swappable componenten beschikbaar (waar bij vervangen van componenten de computer niet hoeft te worden uitgeschakeld). Opslagschijven kunnen zo worden geconfigureerd dat data wordt verspreid over meerdere drives, zoals bij het gebruik van raid. In zulke gevallen gaat de data niet verloren als er een schijf uitvalt. Servers kunnen worden geclusterd en er kan gebruik worden gemaakt van load balancing. Ook is virtualisatie een goede manier om te zorgen voor redundantie.
3. Zorg voor fail-over procedures
Componenten kunnen redundant worden uitgevoerd door middel van redundantieprotocollen om zo elkaars activiteiten te kunnen overnemen. Tijdens het inregelen van redundantie is het belangrijk om dit te testen door het simuleren van de mogelijke fouten in een netwerk, zodat de fail-over goed wordt getest. Het is zaak om in kaart te brengen wat de meest voorkomende fouten zijn waarop de apparatuur moet kunnen reageren. Bovendien moet worden vastgelegd hoe fouten worden gerapporteerd naar een managementsysteem, zodat storingen kunnen worden opgelost en fouten kunnen worden hersteld.
4. Voer overige randapparatuur eveneens dubbel uit
Een computerruimte maakt gebruik van koeling, energie en andere systemen. Ook deze systemen moeten dubbel worden uitgevoerd om optimale redundantie te bereiken. Dat betekent dat de stroomvoorziening aangesloten moet zijn op een ups (een batterij die de stroomlevering overneemt tijdens het opstarten van het noodstroomaggregaat) en noodstroomaggregaat die mogelijk nog een back-up heeft. Op die manier kan een organisatie stroomuitval doorstaan zonder uitval van de it-systemen.
5. Voer het datacenter dubbel uit
Een twin datacenter met synchrone replicatie is de ultieme vorm van redundantie. Twee volledig gelijke it-omgevingen, in geografisch gescheiden datacenterlocaties ondergebracht, die de data direct synchroniseren. De gebruikers ondervinden bij een storing in een van de datacenters geen verlies van belangrijke gegevens en merken niets van de uitval. Het andere datacenter neemt de workload namelijk geruisloos over. Uiteraard hoort tussen de beide datacenters een fysiek gescheiden infrastructuur te lopen voor optimale redundantie.
6. Bekijk de redundantie van het externe datacenter
Het Uptime Institute heeft een tier-normering bepaald voor datacenters die iets zegt over de beschikbaarheid en maximale downtime. In die normering ligt de redundantie van de apparatuur van het datacenter verscholen. Zo beschikken tier-1 en tier-2 datacenters niet over redundant uitgevoerde apparatuur. Bij een tier-3 datacenter is alle apparatuur (koeling, noodstroomaggregaat, ups’en) redundant uitgevoerd. De beschikbaarheid is 99,982 procent waarbij de maximale downtime 1,6 uur per jaar bedraagt. Een tier-4 datacenter heeft alle apparatuur standaard dubbel uitgevoerd en daarnaast ook nog eens gebackupt, waardoor een beschikbaarheid van 99,995 gegarandeerd kan worden met een maximale downtime van 0,4 uur per jaar.
De Visser: ‘Niet voor iedere organisatie is optimale redundantie noodzakelijk. Hoe dat voor een organisatie is, is afhankelijk van hoeveel downtime kost voor een bedrijf. Hoeveel medewerkers kunnen hun werk niet doen, hoeveel klanten kunnen niet geholpen worden, hoeveel omzet loopt het bedrijf mis, wat betekent downtime voor de reputatie van de onderneming, kunnen er schadeclaims worden verwacht? Deze risico-inschatting bepaalt uiteindelijk hoe belangrijk redundantie voor een organisatie is.’