Segundo Workshop de Administradores HPC

Fecha: 17 de abril 2020
Hora de inicio: 10:00 hrs.

Segundo Workshop de Administradores HPC: Instalación, configuración y administración básica del gestor de recursos Slurm

Formación

Este curso se enmarca dentro una serie de eventos de capacitación para administradores de recursos HPC que estamos realizando como Laboratorio Nacional de Computación de Alto Rendimiento de Chile (NLHPC). Después del primer curso que realizamos, solicitamos rellenar una encuesta de satisfacción. En base a sus respuestas se vio que había una clara preferencia de que el siguiente curso estuviera enfocado en la instalación y configuración del sistema gestor de recursos Slurm. Este será el contenido que se verá en el evento del día 17 de abril de 10:00 a 12:00 hrs. (hora chilena) a través de la plataforma de streaming Zoom.

Los contenidos que revisaremos serán los siguientes:

  • Software
    • ¿Qué es un gestor de recursos?
    • Instalación y configuración del gestor de recursos Slurm.
      • Particiones.
      • QOS.
      • Nodos.
      • Recursos.
      • HA.
      • BD.
  • Uso y administración de gestor de recursos Slurm
    • Uso básico de Slurm:
      • Uso del comando srun y sus parámetros.
      • Uso del comando sbatch.
        • Script básico.
        • Encolar, monitorear, cancelar y otras tareas básicas.
    • Administrando SLURM:
      • Monitoreo de tareas.
      • Definición y uso de accounts.
      • Definición y uso de assoc.
      • Reservando recursos.
      • Asignación de prioridades.
      • Extensión de tiempos de trabajos.
      • Asignación de QOS y particiones.
      • Documentación y otros recursos.
  • Monitoreo de utilización de recursos:
    • Pestat.
    • Subutilización de recursos y cancelación automatizada.
    • Ejemplos.
  • Troubleshooting:
    • Monitoreo de logs.
    • Desactivar firewall y SELinux.
    • Sincronización de hora entre nodos.
    • Problemas típicos con tareas en SLURM.

La duración total del curso será de 2 horas con un break de 15 minutos. Para poder seguir el curso y los comandos que ejecutará el profesor se requieren conocimientos de Linux intermedio-avanzado y conocimientos de lenguaje bash script.

A este curso asistieron 108 personas. Hubo asistentes de muy diversos países: Chile, Colombia, Costa Rica, México, Estados Unidos, España, Venezuela, Argentina, Brasil, Alemania y Uruguay