Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2017074506 - PROCÉDÉ ET SYSTÈME PERMETTANT D'ATTRIBUER DES TÂCHES À UN ENSEMBLE DE NŒUDS DE CALCUL SUR LA BASE D'UN CONTRÔLE D'ÉTAT DU MATÉRIEL

Numéro de publication WO/2017/074506
Date de publication 04.05.2017
N° de la demande internationale PCT/US2016/029956
Date du dépôt international 29.04.2016
CIB
G06F 11/07 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
11Détection d'erreurs; Correction d'erreurs; Contrôle de fonctionnement
07Réaction à l'apparition d'un défaut, p.ex. tolérance de certains défauts
G06F 9/48 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
9Dispositions pour la commande par programme, p.ex. unités de commande
06utilisant des programmes stockés, c. à d. utilisant un moyen de stockage interne à l'équipement de traitement de données pour recevoir ou conserver les programmes
46Dispositions pour la multiprogrammation
48Lancement de programmes; Commutation de programmes, p.ex. par interruption
CPC
G06F 11/0709
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
11Error detection; Error correction; Monitoring
07Responding to the occurrence of a fault, e.g. fault tolerance
0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
0706the processing taking place on a specific hardware platform or in a specific software environment
0709in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
G06F 11/0715
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
11Error detection; Error correction; Monitoring
07Responding to the occurrence of a fault, e.g. fault tolerance
0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
0706the processing taking place on a specific hardware platform or in a specific software environment
0715in a system implementing multitasking
G06F 11/0751
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
11Error detection; Error correction; Monitoring
07Responding to the occurrence of a fault, e.g. fault tolerance
0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
0751Error or fault detection not based on redundancy
G06F 11/0781
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
11Error detection; Error correction; Monitoring
07Responding to the occurrence of a fault, e.g. fault tolerance
0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
0766Error or fault reporting or storing
0781Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level
G06F 11/079
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
11Error detection; Error correction; Monitoring
07Responding to the occurrence of a fault, e.g. fault tolerance
0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
079Root cause analysis, i.e. error or fault diagnosis
G06F 11/0793
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
11Error detection; Error correction; Monitoring
07Responding to the occurrence of a fault, e.g. fault tolerance
0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
0793Remedial or corrective actions
Déposants
  • SAUDI ARABIAN OIL COMPANY [SA]/[SA]
  • ARAMCO SERVICES COMPANY [US]/[US] (AG)
Inventeurs
  • BADDOURAH, Majdi A.
  • AL-TURKI, Ali A.
Mandataires
  • BRUCE, Carl E.
Données relatives à la priorité
14/927,26129.10.2015US
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) METHOD AND SYSTEM FOR ALLOCATING JOBS TO A SET OF COMPUTING NODES BASED ON A HARDWARE HEALTH CHECK
(FR) PROCÉDÉ ET SYSTÈME PERMETTANT D'ATTRIBUER DES TÂCHES À UN ENSEMBLE DE NŒUDS DE CALCUL SUR LA BASE D'UN CONTRÔLE D'ÉTAT DU MATÉRIEL
Abrégé
(EN)
Example computer-implemented methods, computer-readable media, and computer systems are described for performing a computing node health check. In some aspects, a routine health check of a plurality of computing nodes of a computer system is performed. A computing job is assessed. A first set of computing nodes are allocated from the plurality of computing nodes to the computing job. A prior-job-execution diagnosis is performed on the first set of computing nodes. Whether the first set of computing nodes are all healthy is determined. In response to determining that the first set of computing nodes are healthy, the job is executed. The job is monitored while the job is running. Whether the job fails or succeeds is determined. In response to determining that the job fails, a post-job-execution diagnosis is performed on an exit code of the job. A result of the post-job-execution diagnosis is output via a user interface of the computer system.
(FR)
L'invention concerne des procédés implémentés par ordinateur, des supports lisibles par ordinateur et des systèmes informatiques donnés à titre d'exemple permettant de réaliser un contrôle de l'état de nœuds de calcul. Selon certains aspects, un contrôle d'état habituel d'une pluralité de nœuds de calcul d'un système informatique est réalisé. Une tâche de calcul est évaluée. Un premier ensemble de nœuds de calcul parmi la pluralité de nœuds de calcul sont attribués à la tâche de calcul. Un diagnostic d'exécution de tâche préalable est réalisé sur le premier ensemble de nœuds de calcul. Il est déterminé si le premier ensemble de nœuds de calcul sont tous sains. À la suite de la détermination que le premier ensemble de nœuds de calcul sont sains, la tâche est exécutée. La tâche est surveillée pendant que la tâche est exécutée. Il est déterminé si la tâche échoue ou réussit. À la suite de la détermination que la tâche échoue, un diagnostic de post-exécution de tâche est effectué sur un code de sortie de la tâche. Un résultat du diagnostic de post-exécution de tâche est transmis par le biais d'une interface utilisateur du système informatique.
Également publié en tant que
SA518391422
Dernières données bibliographiques dont dispose le Bureau international