El NLHPC aumenta el rendimiento de la investigación con AMD

El Laboratorio Nacional de HPC de Chile duplicó su rendimiento de investigación científica por vatio con las CPU AMD EPYC™ y las GPU AMD Instinct™.

La computación de alto rendimiento está impulsando la investigación académica en todo el mundo. Un país de Sudamérica que desempeña un papel destacado es Chile, a través de su Laboratorio Nacional de HPC (NLHPC, alojado en el Centro de Modelamiento Matemático (CMM) de la Universidad de Chile). Como toda institución que depende de la financiación pública, el NLHPC necesita el mejor rendimiento que pueda obtener y, al mismo tiempo, mantenerse dentro de los objetivos nacionales de sostenibilidad. Las CPU AMD EPYC™ y las GPU AMD Instinct™ proporcionaron todo lo que NLHPC necesitaba en su implementación de HPC más reciente.

El equipo de AMD ha sido muy proactivo a la hora de darnos a conocer los últimos avances en su tecnología.
Ginés Guerrero, Director Ejecutivo, NLHPC

«Llevamos 15 años proporcionando recursos informáticos a la comunidad científica de Chile», afirma Ginés Guerrero, Director Ejecutivo del NLHPC. «La Universidad de Chile es el socio principal, pero otras 44 universidades están actualmente asociadas con nosotros, dando cabida a prácticamente todos los investigadores científicos de Chile. Estamos financiados por la Agencia Nacional de Investigación y Desarrollo (ANID) del país». La amplia gama de sus cargas de trabajo hace que los requisitos informáticos del NLHPC sean especialmente complejos. «El número y la diversidad de usuarios es todo un reto. Nuestros 500 usuarios proceden de 40 áreas de investigación diferentes, como la química cuántica, la bioinformática, la astronomía, la nanotecnología y la física».

Doble rendimiento por vatio

«Una de las cargas de trabajo más intensas está relacionada con la lucha contra el cambio climático y el descubrimiento de nuevos materiales», afirma Guerrero. «Por ejemplo, los investigadores están estudiando materiales fotovoltaicos que capten la energía solar de forma más eficiente. La astronomía también es algo importante en Chile. Tenemos uno de los mejores cielos para estudiar las estrellas. Tenemos muchos telescopios muy importantes financiados internacionalmente. En astrocomputación, estudiamos la formación de galaxias. Se han escrito muchos trabajos sobre los agujeros negros supermasivos y sobre las imágenes obtenidas por los telescopios. Entre ellos, ALeRCE (Automatic Learning for the Rapid Classification of Events), que es un broker astronómico que maneja todas las imágenes de los telescopios. Hay que analizarlas en tiempo real, para que ALeRCE pueda enviar alertas de cualquier cambio, como supernovas».

Con las CPU AMD EPYC, obtuvimos cuatro veces más rendimiento con LINPACK con solo el doble de energía».
Ginés Guerrero, Director Ejecutivo, NLHPC

«Como Laboratorio Nacional de Computación en Chile, debemos mantenernos al día con lo que está sucediendo en hardware HPC», dice Guerrero. «El equipo de AMD ha sido muy proactivo en darnos a conocer los últimos avances en su tecnología. Cuando empezamos a estudiar las CPU AMD EPYC de 4ª generación, el equipo nos puso al día sobre las capacidades AVX-512 de la CPU. También nos preocupaba cambiar de GPU, ya que llevábamos mucho tiempo utilizando nuestro proveedor anterior. Así que el equipo de AMD nos puso en contacto con ingenieros de EE.UU. para que nos ayudaran con una transición sin problemas una vez que empezáramos a integrar las GPU de AMD en nuestro sistema».

NLHPC probó procesadores AMD EPYC de 4ª generación y GPU AMD Instinct MI210. «Cuando instalamos los servidores y realizamos las pruebas, nos sorprendieron los resultados», afirma Guerrero. Durante el proceso de licitación, el rendimiento fue el factor clave, pero la eficiencia energética jugó un papel importante. «Nuestras pruebas fueron muy diversas. Compilamos al menos 100 cargas de trabajo. Todos los usuarios dijeron que el rendimiento era mucho mejor con las CPU AMD EPYC, y también empleamos el benchmark LINPACK. Cuando lo ejecutamos con la arquitectura anterior, vimos que el rendimiento era hasta un 60 por ciento inferior al máximo teórico. Con el clúster actual potenciado por CPU AMD EPYC de 4ª generación, obtuvimos más del 100 por cien del máximo teórico. La energía que necesitaba el clúster anterior también era el doble que la del nuevo para obtener los mismos resultados. Con las CPU AMD EPYC, obtuvimos cuatro veces más rendimiento con LINPACK con solo el doble de energía».

Impulsar el progreso científico de Chile

«Con las CPU AMD EPYC, muchas de nuestras cargas de trabajo podían ejecutarse de inmediato», afirma Guerrero. «Pero en cuanto recompilábamos las aplicaciones con GNU Complier Collection o AMD Optimizing C/C++ Compiler, obteníamos un rendimiento muy superior al del código de nuestro compilador anterior. Con las GPU AMD Instinct, era necesario utilizar software nuevo. Así que desplegamos los contenedores que proporcionaba el AMD Infinity Hub. Las plataformas disponibles con el software AMD ROCm™ fueron la mejor opción para esta conversión.»

En la lista Top 500 de todos los superordenadores del mundo, está claro que los procesadores AMD están ganando terreno.
Ginés Guerrero, Director Ejecutivo, NLHPC

El nuevo clúster de NLHPC ejecuta 27 servidores Lenovo ThinkSystem SR645 V3 con CPU duales AMD EPYC 9754 de 4ª generación de 128 núcleos y 768 GB de memoria cada uno, lo que supone un total de 6.912 núcleos para nodos de cálculo y acceso. Sus dos servidores GPU Lenovo ThinkSystem SR675 V3 funcionan con CPU duales AMD EPYC 9224 de 4ª generación de 24 núcleos y seis GPU AMD Instinct MI210 cada uno, lo que supone 12 aceleradores. Se utilizó el sistema de refrigeración por agua Neptune de Lenovo para mantener las temperaturas de funcionamiento de la CPU y la GPU durante las cargas de trabajo intensivas de IA.

«Lo más importante para nosotros es poder contribuir a que Chile avance científicamente», dice Guerrero. «Cuantos más recursos podamos ofrecer, mayor impacto tendrá en toda la comunidad». Los comentarios de los científicos chilenos han sido abrumadoramente positivos. «Un usuario que ejecutaba el modelo Weather Research & Forecasting (WRF) nos dijo que su carga de trabajo se ejecutaba mucho más rápido que antes. El modelo Nanoscale Molecular Dynamics (NAMD) fue otra aplicación de software que mostró un gran rendimiento».

Hacia un futuro de investigación brillante con AMD

El nuevo clúster está mejorando la forma en que los investigadores despliegan sus cargas de trabajo. «Si tenemos muchos núcleos en un servidor, podemos ejecutar tareas de memoria compartida», afirma Guerrero. «Con las CPU AMD EPYC, ahora podemos utilizar 256 núcleos en una sola tarea. La mayoría de nuestros usuarios no utilizan MPI. Lanzan tareas de memoria compartida. Si tienen más de 200 núcleos en un servidor, pueden utilizar 200 unidades de cálculo. Esto era imposible cuando sólo teníamos servidores con 40 núcleos como nuestras CPU anteriores. Es una gran ventaja». Los aceleradores AMD Instinct de NLHPC también ofrecen un mayor rendimiento por vatio. «Con las GPU AMD Instinct MI210, podemos ejecutar más operaciones de coma flotante por segundo con más eficiencia energética. La mayoría de nuestros usuarios emplean esa tecnología para dinámica molecular».

AMD ha hecho un trabajo sensacional. La arquitectura es impecable. Esto supone un avance general para que la sociedad disponga de una mejor computación».
Ginés Guerrero, Director Ejecutivo, NLHPC

«Suelo utilizar una frase que se traduce del español como ‘si no computas no compites’», dice Guerrero. «Si no invertimos en computación y avanzamos, seremos menos competitivos a nivel mundial». En Chile, hay un concurso que otorga 7 millones de dólares para la compra de infraestructura que utilice más GPUs para cargas de trabajo emergentes como la IA, y por supuesto, participaremos en este concurso. «Hoy en día, con la IA, se está viendo que los países invierten enormes cantidades de dinero para aumentar la capacidad de cómputo. Esto tiene un impacto para la industria, para el Estado, para la investigación y para todos los ciudadanos. EE.UU., Europa y China son los líderes, pero en América Latina aún queda mucho por hacer y estamos trabajando incansablemente para asegurar que se avance».

Guerrero ve un futuro brillante a la relación entre NLHPC y AMD para llevar a cabo esta próxima fase. «En la lista Top 500 de todos los superordenadores del mundo, está claro que los procesadores AMD están ganando terreno», afirma Guerrero. «Cada vez están más ahí. Si miras lo que está pasando a nivel mundial, deberías plantearte integrar la tecnología de AMD porque los resultados que hemos obtenido son muy positivos. AMD ha hecho un trabajo sensacional. La arquitectura es impecable. Esto supone un avance general para que la sociedad disponga de una mejor computación. La colaboración entre el NLHPC y el equipo de ingeniería de AMD ha sido clave para ofrecer la mejor solución con más rendimiento y la mejor eficiencia energética. Ha sido realmente increíble».

 

Noticia original en amd.com.