(EN) Runtime load balancing of work across a clustered computing system involves servers calculating, and clients utilizing, current service performance grades of each instance in the system. A performance grade for an instance is based on performance metrics for that instance, where the computation used may vary by policy. Examples of possible policies include: (a) using estimated bandwidth as a performance grade, (b) using spare capacity as a performance grade, or (c) using response time as a performance grade. Clients distribute work requests across servers in the system as the requests arrive. Work requests can be distributed according to performance grades, and/or flags associated with the performance grades. Automatically and intelligently directing work requests to the best server instances, based on real-time service performance metrics, minimizes the need to manually relocate work within the clustered system.
(FR) L'invention porte un procédé d'équilibrage de charges d'exécution du travail dans un système de calcul en grappes selon lequel des serveurs calculent, et des clients utilisent, des niveaux de performance de service courants pour chaque instance du système. Un niveau de performance pour une instance est basé sur une métrique de performance pour cette instance, le calcul utilisé pouvant varier selon la politique. Des exemples de politiques possibles comprennent: (a) l'utilisation d'une largeur de bande estimée comme niveau de performance; (b) l'utilisation de la capacité de réserve comme niveau de performance; ou (c) l'utilisation du temps de réponse comme niveau de performance. Les clients distribuent les demandes de travail entre les serveurs du système au fur et à mesure qu'elles arrivent. Les demandes de travail peuvent être distribuées en fonction des niveaux de performance et/ou de fanions associés aux niveaux de performance. En dirigeant automatiquement et intelligemment les demandes de travail vers les meilleurs instances serveur, sur la base d'une métrique de performance de service en temps réel, on parvient à minimiser le besoin de réattribution manuelle du travail au sein du système en grappes.