(EN) Example computer-implemented methods, computer-readable media, and computer systems are described for performing a computing node health check. In some aspects, a routine health check of a plurality of computing nodes of a computer system is performed. A computing job is assessed. A first set of computing nodes are allocated from the plurality of computing nodes to the computing job. A prior-job-execution diagnosis is performed on the first set of computing nodes. Whether the first set of computing nodes are all healthy is determined. In response to determining that the first set of computing nodes are healthy, the job is executed. The job is monitored while the job is running. Whether the job fails or succeeds is determined. In response to determining that the job fails, a post-job-execution diagnosis is performed on an exit code of the job. A result of the post-job-execution diagnosis is output via a user interface of the computer system.
(FR) L'invention concerne des procédés implémentés par ordinateur, des supports lisibles par ordinateur et des systèmes informatiques donnés à titre d'exemple permettant de réaliser un contrôle de l'état de nœuds de calcul. Selon certains aspects, un contrôle d'état habituel d'une pluralité de nœuds de calcul d'un système informatique est réalisé. Une tâche de calcul est évaluée. Un premier ensemble de nœuds de calcul parmi la pluralité de nœuds de calcul sont attribués à la tâche de calcul. Un diagnostic d'exécution de tâche préalable est réalisé sur le premier ensemble de nœuds de calcul. Il est déterminé si le premier ensemble de nœuds de calcul sont tous sains. À la suite de la détermination que le premier ensemble de nœuds de calcul sont sains, la tâche est exécutée. La tâche est surveillée pendant que la tâche est exécutée. Il est déterminé si la tâche échoue ou réussit.
À la suite de la détermination que la tâche échoue, un diagnostic de post-exécution de tâche est effectué sur un code de sortie de la tâche. Un résultat du diagnostic de post-exécution de tâche est transmis par le biais d'une interface utilisateur du système informatique.