banner
Hogar / Blog / Profundice en la reducción del consumo de energía del servidor
Blog

Profundice en la reducción del consumo de energía del servidor

Jun 17, 2023Jun 17, 2023

Hoy vamos a hablar sobre el consumo de energía del servidor. Específicamente, existen algunos pasos sencillos para reducir la energía en una cantidad bastante significativa. A medida que avanzamos hacia los servidores de la era 2022 y más allá, el TDP y el consumo de energía de los chips aumentan a medida que los chips y los sistemas se vuelven más densos. Además, muchas empresas tienen objetivos de sostenibilidad, por lo que ahorrar energía significa ahorrar dinero y alcanzar esos objetivos de sostenibilidad antes. Teniendo en cuenta este contexto, existen algunas formas relativamente sencillas de reducir el consumo de energía en el centro de datos sin tener que ser un arquitecto a gran escala con control total sobre el entorno. Hoy cubriremos algunos de ellos.

Notaremos rápidamente que Intel patrocina esto y proporciona las CPU Xeon Platinum junto con las cargas de trabajo que ejecutamos para parte de esto en nuestro artículo Dejemos de dejar el rendimiento en la mesa con instancias AWS EC2 M6i. Además, Inspur proporcionó el Inspur NF5280M6 que revisamos junto con el NF5180M6 que revisaremos en marzo. Ya teníamos las fuentes de alimentación HPE en el laboratorio. Este tipo de prueba requiere muchos suministros, por lo que necesitábamos ayuda aquí. Como siempre, estamos escribiendo este artículo de forma independiente y ninguna empresa los revisa antes de su publicación.

También tenemos una versión en video de esto:

Como siempre, sugerimos abrir esto en una nueva ventana, pestaña o aplicación de YouTube para una mejor experiencia de visualización.

Un área que hemos analizado antes es la sabiduría convencional sobre la eficiencia del servidor 1U frente a 2U. Cuando analizamos esto en 2018, en Pruebas de sabiduría convencional en consumo de energía de 1U frente a 2U, utilizamos un Dell EMC PowerEdge R640 de 1U y un R740xd de 2U. Las plataformas de prueba no eran idénticas, por lo que vimos que el R640 tenía un menor consumo de energía. La cuestión era que las configuraciones importan, por lo que conseguir plataformas idénticas iba a ser clave.

Esta vez, rehacemos la prueba utilizando el Inspur NF5280M6 junto con el NF5180M6. Estamos equipando procesadores idénticos, CPU Intel Xeon Platinum 8362. Se trata de los procesadores Intel Xeon Scalable “Ice Lake” de 3ª Generación que cuentan con 32 núcleos cada uno. Le pedimos a Intel estos SKU porque encajan bien en las licencias actuales de VMware y Microsoft. La ventaja de los dos sistemas Inspur es que las placas base son prácticamente idénticas. Hay algunos encabezados diferentes en cada uno, pero los eliminamos para obtener cifras más confiables.

Luego ejecutamos nuestras cargas de trabajo de aceleración, incluidas las cargas de trabajo AVX-512 HPC, Tensorflow y nuestra carga de trabajo de WordPress de aceleración web criptográfica, y notamos las diferencias entre las dos plataformas. También encontramos la joya de que las plataformas Inspur tienen un sensor para el consumo de energía del ventilador, por lo que pudimos rastrear el consumo de energía en la PDU, las fuentes de alimentación y también en el ventilador (también hay sensores de CPU y memoria, pero eran similares entre los dos). plataformas.)

Las cargas de trabajo que estamos ejecutando son similares a las que ejecutamos y muestran los aceleradores integrados de Ice Lake, además la carga de trabajo 1 está instalando Tensorflow. Vamos a profundizar más en las cargas de trabajo en la siguiente sección, pero así es como se veían en el NF5280M6 que revisamos:

Aquí está el mismo conjunto en el NF5180M6 que tendremos una revisión formal en marzo. El rendimiento fue casi idéntico entre los sistemas como esperábamos, sin variaciones significativas en nuestras series de ejecuciones. El consumo de energía, sin embargo, fue diferente.

Lo importante aquí, y quizás lo más interesante, son las lecturas de consumo de energía del ventilador entre los dos servidores. El servidor 1U está en azul, el 2U está en negro.

Lo que encontramos esta vez fue que terminamos usando entre un 0,1% y un 1,1% menos de consumo total de energía del sistema en la plataforma 2U en comparación con la plataforma 1U, únicamente debido a los ventiladores. Intercambiamos componentes entre los sistemas para usar las mismas CPU, RAM, SSD, NIC y fuentes de alimentación. Las placas base eran los mismos modelos, salvo algunos encabezados despoblados. Efectivamente, debido a la forma en que Inspur y muchos otros proveedores construyen servidores en estos días, pudimos aislar los cambios de manera efectiva solo en el delta de enfriamiento.

La conclusión clave es que, de hecho, vimos un delta notable en el consumo de energía, especialmente a medida que aumentó el consumo de energía. Esto variará según los modelos y configuraciones del servidor, pero tiene mucho sentido. Si busca eficiencia, puede que valga la pena optar por sistemas 2U de menor densidad. Esto será más importante más adelante en 2022 y más allá a medida que aumenten los TDP de los chips. Muchas organizaciones podrán optar por chasis 2U menos densos para aprovechar estas eficiencias, ya que es posible que los presupuestos de energía a nivel de rack no sean capaces de manejar configuraciones de 1U en el compartimiento superior. Esta es también una de las razones por las que nos hemos centrado mucho más en la refrigeración líquida en STH. En los sistemas de GPU 8x que probamos, el porcentaje de energía dedicada a la refrigeración continúa aumentando hasta el punto de que vemos que el 20% de la energía del sistema se destina a refrigeración.

A continuación, echemos un vistazo a las fuentes de alimentación y por qué la alimentación también es importante.

En 2019, ejecutamos un artículo simplemente agregando máquinas virtuales y viendo si podíamos obtener una mejor eficiencia energética usando las PSU 80Plus Platinum frente a las Titanium. Probamos las PSU HPE ProLiant 800W 80Plus Platinum y Titanium y básicamente agregamos las mismas máquinas virtuales al servidor para generar una pequeña carga incremental en cada una.

En ralentí, no hubo una diferencia apreciable entre ambos. A medida que nos acercamos a la mitad de las fuentes de alimentación nominales, vimos aproximadamente un delta de 1,5 a 2 % en términos del consumo total de energía en la PDU.

Esto no es enorme, pero es fácil. Otra implicación es que es necesario seleccionar fuentes de alimentación del tamaño adecuado para las cargas de trabajo esperadas. Obtener fuentes de alimentación de 2 kW para un servidor que utiliza entre 100 y 500 W no lo sitúa en las bandas de eficiencia de muchas fuentes de alimentación modernas. En nuestros dos servidores de prueba que utilizamos para estos, vimos una cifra de consumo de energía aproximadamente un 0,3 % mejor al utilizar las fuentes de alimentación de 1,3 kW frente a las fuentes de alimentación Inspur de 1,6 kW. Ambas son fuentes de alimentación de eficiencia de nivel Platino, por lo que la diferencia está en la eficiencia energética en los niveles nominales.

Como nota rápida aquí, también se puede pasar de 120 V a 208 V o más y obtener también ganancias en eficiencia energética. Probamos esto en 2015 y vimos una ventaja de eficiencia energética de aproximadamente el 2 % al pasar a 208 V más altos, y generalmente hay otro 0,25 % aproximadamente que se aplica a 220-240 V más altos.

La clave aquí es que pasar a racks de mayor voltaje y fuentes de alimentación de mayor eficiencia puede generar hasta un 3-4% en términos de ahorro en el consumo de energía.

Aun así, dejemos de lado los detalles pequeños y miremos hacia el futuro en términos de cómo los aceleradores cambian el juego y por qué algunas comparaciones actuales en realidad no son óptimas.