lunes, mayo 02, 2016

Datacenter Tier-IV y 2N+1? Aclarando conceptos

Cuando presentas un Datacenter como un lugar para alojar datos críticos de empresa, la primera pregunta es siempre... ¿Qué certificación tiene?¿Es un tier-II, III o IV? La pregunta es lógica, ya que en el fondo, se quiere conocer su disponibilidad de servicio anual (Tier-III es de 99,982% o 3 nueves, mientras que un tier-IV es de 99,991% o 4 nueves). La disponibilidad tiene una componente que controlas, que el tiempo en el que un sistema no presta el servicio para el que se diseñó porque está "en mantenimiento". Este estado no forma parte de las características de un tier-III o IV, y es una de las diferencias fundamentales con los tier-I o II, no hay "maintenance downtime".  
Antes de seguir, es interesante conocer lo que implica añadir "nueves" al porcentaje de disponibilidad. Si "dos nueves" son 3 días, 15 horas, 40 minutos de interrupción anual, "tres nueves" (tier-III) son 8 horas, 46 minutos, "cuatro nueves" (tier-IV) son 52 minutos, 36 segundos, "cinco nueves" 5 minutos, 15 segundos o "seis nueves" tan sólo 32 segundos anuales de no disponibilidad.
Por otro lado, ¿Qué significa disponer de redundancia "N", "N+1", "2N+1", etc.? N es el número de elementos que proporcionan servicio y capacidad. Lo entenderemos mejor con un ejemplo: un almacén de helados. Ahí N sería el número de neveras en los que se almacenan cajas de helados. Tenemos 50 neveras de 20 cajas de capacidad, es decir, capacidad máxima = 1.000 cajas, y N = 50. Si se estropea una nevera, tendremos que trasladar las cajas a otra que no esté llena, pero si no tenemos espacio vacío (100% de capacidad), se estropearán. Así, introducimos en el almacén una nevera vacía como estrategia (N+1) ante esa eventualidad (nevera que falla). También podríamos disponer de toda la infraestructura redundada al 100% (2N), o incluso, la máxima redundancia, 2N+1. Como se ve, a mayor redundancia, más coste (más neveras) ya que hemos ido pasando de 50 neveras (N) a 51 (N+1), de ahí a 100 (2N) o 101 (2N+1). Evidentemente la ocupación es otra variable en el diseño de la disponibilidad del servicio, ya que la capacidad real la dará lo que estimemos prudente ocupar, si el 100% de la capacidad total o la que se diseñe..
Dicho esto, la clasificación de un Datacenter según el Uptime Institute es como sigue:

Características Tier I Tier II Tier III Tier IV
Redundancia N N+1 N+1 2N+1
Número líneas electricas 1 1 1 x Activo / 1 x Pasivo 2 Activas
Personal Permanente Ninguno 1 solo turno 1 por cada turno 24 x 7 x 365
Puntos únicos de fallo Muchos Muchos Algunos Sólo por incendio o fallo humano
Tolerancia a fallos no planificados No No No Si
Interrupción servicio por mantenimiento anual 2 de mas de 12 horas 1.5 de más de 12 horas 0 0
Interrupción anual de servicio 2 cortes de más de 4 horas 1 corte de más de 4 horas 0 cortes de más de 4 horas 0 cortes de más de 4 horas
Tiempo anual de servicio de mantenimiento 28.8 horas 22 horas 1.6 horas 0.8 horas
Disponibilidad del Servicio 99,671% 99,749% 99,982% 99,991%

No hay comentarios: