Processing

Please wait...

Settings

Settings

Goto Application

1. WO1997027541 - FAULT-TOLERANT PROCESSING METHOD

Publication Number WO/1997/027541
Publication Date 31.07.1997
International Application No. PCT/GB1997/000222
International Filing Date 24.01.1997
IPC
G06F 11/20 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
11Error detection; Error correction; Monitoring
07Responding to the occurrence of a fault, e.g. fault tolerance
16Error detection or correction of the data by redundancy in hardware
20using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
CPC
G06F 11/2028
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
11Error detection; Error correction; Monitoring
07Responding to the occurrence of a fault, e.g. fault tolerance
16Error detection or correction of the data by redundancy in hardware
20using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
202where processing functionality is redundant
2023Failover techniques
2028eliminating a faulty processor or activating a spare
G06F 11/2038
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
11Error detection; Error correction; Monitoring
07Responding to the occurrence of a fault, e.g. fault tolerance
16Error detection or correction of the data by redundancy in hardware
20using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
202where processing functionality is redundant
2038with a single idle spare processing component
G06F 11/2041
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
11Error detection; Error correction; Monitoring
07Responding to the occurrence of a fault, e.g. fault tolerance
16Error detection or correction of the data by redundancy in hardware
20using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
202where processing functionality is redundant
2041with more than one idle spare processing component
G06F 11/2097
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
11Error detection; Error correction; Monitoring
07Responding to the occurrence of a fault, e.g. fault tolerance
16Error detection or correction of the data by redundancy in hardware
20using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
2097maintaining the standby controller/processing unit updated
Applicants
  • HEWLETT-PACKARD COMPANY [US]/[US] (AllExceptUS)
  • FLEMING, Roger, Alan [GB]/[GB] (UsOnly)
Inventors
  • FLEMING, Roger, Alan
Agents
  • YENNADHIOU, Peter
Priority Data
9601585.426.01.1996GB
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) FAULT-TOLERANT PROCESSING METHOD
(FR) PROCEDE DE TRAITEMENT A TOLERANCE DE PANNES
Abstract
(EN)
A recovery unit in a software fault-tolerant system has primary and secondary processing units (I, II) running replicate application processes (24). Input messages sent to the recovery unit are received at the primary unit (I) and in due course processed by the primary process (24) to produce application messages; however, these application messages produced by the primary process (24) are not normally output from the primary unit (I) as the recovery-unit output messages. Instead, these application messages are logged from the primary unit (I) to the secondary unit (II) together with state update information. The secondary process (24) run by secondary unit (II) uses this update information to update its own state so as to track the state of the primary process. The secondary unit (II) outputs the application messages logged to it from the primary unit (I) as the recovery-unit output messages. Should the primary unit (I) fail, the secondary unit (II) takes over the role of the primary. Furthermore, in the absence of an operative secondary unit (II) (due either to its failure or to its promotion to the primary unit), the primary unit becomes responsible for outputting its own application messages as the recovery-unit output messages. Configurations with multiple secondaries are also possible.
(FR)
Cette invention concerne une unité de récupération utilisée dans un système de logiciel à tolérance de pannes, laquelle unité comprend des unités de traitement (I, II) primaire et secondaire qui effectuent des processus (24) d'applications parallèles. Les messages d'entrée envoyés à l'unité de récupération sont reçus au niveau de l'unité primaire (I), puis traités en temps voulu à l'aide du processus primaire (24) de manière que des messages d'application soient produits. Toutefois, les messages d'application obtenus à l'aide du processus primaire (24) ne sont pas envoyés par l'unité primaire (I) selon le procédé classique sous forme de messages de sortie de l'unité de récupération. Au lieu de cela, les messages d'application sont chargés depuis l'unité primaire (I) dans l'unité secondaire (II) conjointement avec des informations de remise à jour de l'état. Le processus secondaire (24) exécuté par l'unité secondaire (II) utilise ces informations de remise à jour afin de remettre à jour son propre état et de pouvoir ainsi suivre l'état du processus primaire. L'unité secondaire (II) émet sous forme de messages de sortie de l'unité de récupération, les messages d'application qu'elle a reçus de l'unité primaire (I). Dans le cas d'une défaillance de l'unité primaire (I), l'unité secondaire (II) prend le relais de celle-ci. En outre, lors de l'absence d'une unité secondaire opérationnelle (II) (que ce soit à cause de sa défaillance ou de sa promotion en qualité d'unité primaire), l'unité primaire devient responsable de l'émission de ses propres messages d'application qui représentent des messages de sortie de l'unité de récupération. Des configurations faisant appel à plusieurs secondaires sont également possibles.
Latest bibliographic data on file with the International Bureau