Currently Being Moderated

Vuelvo a la carga con mi tema preferido, el rendimiento.

 

La semana pasada publicamos el primer benchmark de rendimiento con nuestros equipos en configuración Cluster-Mode para entorno SAN, siguiendo el benchmark SPC-1.

 

Esta misma tecnología es la que utilizamos para batir el record de rendimiento NFS hace unos meses (lo conté aquí en noviembre).

 

Como ya hemos adelantado, desde la versión 8.1 de Data ONTAP, el software que da vida a nuestras cabinas, tenemos la primera, y por el momento la única, solución de almacenamiento unificado de propósito general y con arquitectura scale-out del mercado.

 

La parte NAS ya la contamos, y rompimos los records con ella. Ahora toca la parte SAN, donde hemos empezado algo más modestamente, pero con unos resultados más que interesantes.

 

El benchmark publicado es de 250K iops, con un equipo de 6 controladoras FAS6240. Es verdad que hay valores mayores publicados, pero todos sabemos que en esto del rendimiento hay que mirar mucho más que el número final. Esta tabla que he tomado prestada de mi compañero Dimitris resume los benchmarks más relevantes:

 

tabla.jpg

 

Lo primero a tener en cuenta es la latencia, no es lo mismo proporcionar 250K iops con 3 ms de latencia o con 7, de ahí el tener una columna normalizando el valor de iops a 3 ms.

 

Que el valor sea 3, o 5, o 10, dependerá de las necesidades de cada entorno/aplicación. Estos 3 ms es una referencia para un tiempo de servicio muy bueno cuando hablamos de disco … estábamos hablando de construir sistemas de alto rendimiento, ¿no? 7 ms es bastante lento, y desde luego 10 ms es en muchos casos el umbral que fijamos para considerar un servicio malo.

 

Lo otro a tener en cuenta es el coste de la solución. Una de las cosas buenas del benchmark SPC-1 es que los fabricantes estamos obligados a proporcionar el precio de lista de la solución, dando una idea aproximada de cuanto costaría un equipo como ese.

 

El resto de costes son los de espacio físico y consumos eléctricos, que a parte de las controladoras, vienen dadas por el número de discos. Resulta interesante ver que utilizamos menos de la mitad de discos que el siguiente fabricante. En parte esto es por que utilizamos tarjetas FlashCache para acelerar el rendimiento, pero es que hace años que construimos muchos de nuestros sistemas así, y como se puede ver, tampoco los hacen prohibitivamente caros.

 

Finalmente, ¿adivináis quien es el único fabricante que no utiliza RAID 1+0 en el benchmark? Y lo más importante, ¿cuántas de vuestras cabinas productivas siguen utilizando RAID 1+0 para un porcentaje relevante de vuestros datos? No muchas imagino, así que habría que revisar todos los benchmarks de esos fabricantes para ver cuánto rinden esos mismos equipos con el RAID-5 que la mayoría utilizan en configuraciones productivas.

 

Bueno, pues parece que Cluster-Mode funciona, y muy bien !

 

Esta primera versión soporta hasta 6 nodos en configuraciones con servicios SAN, para configuraciones NAS se llega hasta 24 nodos, y como vimos en el benchmark de rendimiento NAS, el crecimiento crece linealmente con el número de nodos, así que si alguien necesita más rendimiento, tranquilos, llegará.

 

En la práctica, si no se es responsable de “Los Alamos National Lab”, u otros sitios de tamaño extra grande, de los que alguno tenemos en España, el rendimiento de 6 de nuestros nodos de gama alta es más que suficiente para la mayoría de entornos. De hecho, muchos de nuestros clientes tienen suficientes con los equipos de gama media.

 

Como ya hemos dicho, la gran aportación de nuestra tecnología Cluster-Mode no es el proporcionar más rendimiento que antes. Lo novedoso es la capacidad de tener “operaciones no disruptivas”, permitiendo que podamos mover los servicios de un hardware a otro, realizar actualizaciones o incluso renovaciones tecnológicas completas, sin interrumpir el servicio de datos, y manteniendo nuestras aplicaciones funcionando… adiós las noches y fines de semana realizando migraciones de datos, adiós a las paradas planificadas para realizar un upgrade.

 

Para los que no estuvisteis, en nuestro evento anual NetApp Innovation realizamos una demo en vivo (está grabada en este video) de como son estas operaciones no disruptivas, moviendo un servicio en caliente desde un rack a otro, y apagando el primero al final del proceso, una renovación tecnológica completa de un servicio SAN, en aquel caso para máquinas virtuales.

 

Si queréis más información os dejo unos enlaces:

 

-Recovery Monkey (Blog de Dimitris Krekoukias)

-Artículo en The Register

-Benckmarks SPC-1 publicados

 

Saludos

Comments

Filter Blog

By date:
By tag: