Processing

Please wait...

PATENTSCOPE will be unavailable a few hours for maintenance reason on Tuesday 25.01.2022 at 12:00 PM CET
Settings

Settings

Goto Application

1. WO2022001086 - EFFICIENT GPU RESOURCE ALLOCATION OPTIMIZATION METHOD AND SYSTEM

Publication Number WO/2022/001086
Publication Date 06.01.2022
International Application No. PCT/CN2021/071213
International Filing Date 12.01.2021
IPC
G06F 9/50 2006.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
9Arrangements for program control, e.g. control units
06using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
46Multiprogramming arrangements
50Allocation of resources, e.g. of the central processing unit
Applicants
  • 苏州浪潮智能科技有限公司 INSPUR SUZHOU INTELLIGENT TECHNOLOGY CO., LTD. [CN]/[CN]
Inventors
  • 王斌 WANG, Bin
Agents
  • 北京集佳知识产权代理有限公司 UNITALEN ATTORNEYS AT LAW
Priority Data
202010601888.X29.06.2020CN
Publication Language Chinese (zh)
Filing Language Chinese (ZH)
Designated States
Title
(EN) EFFICIENT GPU RESOURCE ALLOCATION OPTIMIZATION METHOD AND SYSTEM
(FR) PROCÉDÉ ET SYSTÈME D'OPTIMISATION EFFICACE DE L'ATTRIBUTION DE RESSOURCES DE GPU
(ZH) 一种高效的GPU资源分配优化方法和系统
Abstract
(EN) An efficient GPU resource allocation optimization method and system. The method comprises: invoking an allocation interface for GPUs; acquiring GPU resources and data information needed for GPU allocation, the data information comprising a physical topology diagram structure, a NUMA packet structure, and operation information; determining a GPU topology communication factor according to a GPU static topology diagram in physical topology diagrams; determining a GPU fragmentation factor according to the NUMA packet structure and the operation information by adding a correction during GPU fragment computation; and performing weighted computation on the obtained communication factor and the obtained fragmentation factor to determine a target function value, the minimum target function value corresponding to an optimal GPU resource allocation scheme. The allocation of GPU resources in the present invention can guarantee the computational performance of GPUs, can significantly reduce generation of GPU resource fragments, and can ensure that each scheduling operation can use an optimal configuration of currently available CPU resources.
(FR) L'invention concerne un procédé et un système d'optimisation efficace de l'attribution de ressources de GPU. Le procédé comprend les étapes consistant à : appeler une interface d'attribution pour des GPU ; acquérir des ressources de GPU et des informations de données nécessaires pour une attribution de GPU, les informations de données comprenant une structure de diagramme de topologie physique, une structure de paquet NUMA et des informations d'opération ; déterminer un facteur de communication de topologie de GPU selon un diagramme de topologie statique de GPU figurant dans des diagrammes de topologie physique ; déterminer un facteur de fragmentation de GPU selon la structure de paquet NUMA et les informations d'opération par ajout d'une correction pendant un calcul de fragments de GPU ; et effectuer un calcul pondéré sur le facteur de communication obtenu et le facteur de fragmentation obtenu pour déterminer une valeur de fonction cible, la valeur de fonction cible minimale correspondant à un système d'attribution de ressources de GPU optimal. L'attribution de ressources de GPU selon la présente invention peut garantir la performance de calcul des GPU, peut réduire de manière significative la génération de fragments de ressources de GPU, et peut assurer que chaque opération de planification peut utiliser une configuration optimale de ressources de CPU actuellement disponibles.
(ZH) 一种高效的GPU资源分配优化方法和系统,方法包括调用GPU的分配接口,获取GPU分配所需的GPU资源和数据信息;数据信息包括物理拓扑图结构、NUMA分组结构和作业信息。根据物理拓扑图中GPU静态拓扑图,确定GPU拓扑通信因子;根据NUMA分组结构和作业信息,通过在GPU碎片计算时增加修正,确定GPU碎片化因子。将得到的通信因子和碎片化因子做加权计算,确定目标函数值;目标函数值最小时为GPU资源最优分配方案。本发明对GPU资源的分配不仅能够保证GPU的计算性能,而且还能极大减小GPU资源碎片产生,保证每个调度作业都能使用当前可用GPU资源的最优配置。
Related patent documents
Latest bibliographic data on file with the International Bureau