Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2017000639) SYSTÈME ET PROCÉDÉ DE GESTION DE RESSOURCES DE STOCKAGE
Document

说明书

发明名称 0001   0002   0003   0004   0005   0006   0007   0008   0009   0010   0011   0012   0013   0014   0015   0016   0017   0018   0019   0020   0021   0022   0023   0024   0025   0026   0027   0028   0029   0030   0031   0032   0033   0034   0035   0036   0037   0038   0039   0040   0041   0042   0043   0044   0045   0046   0047   0048   0049   0050   0051   0052   0053   0054   0055   0056   0057   0058   0059   0060   0061   0062   0063   0064   0065   0066   0067   0068   0069   0070   0071   0072   0073   0074   0075   0076   0077   0078   0079   0080   0081   0082   0083   0084   0085   0086   0087   0088   0089   0090   0091   0092   0093   0094   0095   0096   0097   0098   0099   0100   0101   0102   0103   0104   0105   0106   0107   0108   0109   0110   0111   0112   0113   0114   0115   0116   0117   0118   0119   0120   0121   0122   0123   0124   0125   0126   0127   0128   0129   0130   0131   0132   0133   0134   0135   0136   0137   0138   0139   0140   0141   0142   0143   0144   0145   0146   0147   0148   0149   0150   0151   0152   0153   0154   0155   0156  

权利要求书

1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17  

附图

0001   0002   0003   0004   0005   0006   0007  

说明书

发明名称 : 一种存储资源管理的系统及方法

技术领域

[0001]
本申请涉及但不限于存储技术。

背景技术

[0002]
数据中心对存储容量需求呈几何级数增长,而相关技术的刀片服务器使用本地存储已经不能满足市场需求,为此诞生了机柜式服务器,服务器上只保留少量存储存放版本和日志,而把存储资源独立出来作为一个资源池来统一管理,所有服务器可以共享存储资源池。
[0003]
SAS(Serial Attached SCSI,串行连接SCSI,其中SCSI(Small Computer System Interface,小型计算机系统接口))是存储网络中使用最广泛的一种硬盘连接技术,以串行通讯为协议基础架构,采用SCSI-3扩展指令集,综合了相关技术的并行SCSI和串行连接技术的优势,并能兼容SATA(Serial Advanced Technology Attachment,串行高级技术附件)设备。SAS具备相关技术的硬盘通道技术里面的最高接口速率,SAS3.0标准的速率达到12Gb/s,SAS特有的宽端口技术,使得传输带宽得到成倍的提升,以12Gbps SAS通道为例,4*SAS宽端口带宽可达48Gbps。
[0004]
当多个SAS设备需要互相通信时,必须通过SAS expander(扩展器)连接。SAS expander具有多个SAS端口,根据功能分为SAS switch(交换)和JBOD(Just Bundle of Disk,简单硬盘簇),其中JBOD只是做硬盘扩展,把多个硬盘连在一起组成一个大的逻辑硬盘。SAS Switch连接多个JBOD形成一个SAS交换域,通过SAS Switch就可以管理整个SAS交换域。
[0005]
图1为相关技术的SAS Zoning原理图,图1所示是一个典型的机柜服务器系统,机柜内置JBOD,多个server服务器通过SAS switch连接JBOD。
[0006]
机柜服务器系统具有以下特点:1、传输隔离:隔离server和存储资源,防止非法访问;2、访问控制:限制每个server可以访问的存储资源,如图1中,每个server只能访问JBOD的部分硬盘;3、灵活的资源分配:如果某个 server需要更多的资源,可以分配新的硬盘。为此,ANSI(American National Standards Institute,美国国家标准学会)T10技术委员会提出了SAS zoning区域技术,类似于以太网的VLAN(Virtual Local Area Network,虚拟局域网)技术,SAS switch和JBOD组成的SAS交换域划分为不同的ZONE(分区),不同ZONE之间互不可见。图1中,server1和多个硬盘划分为ZONE1,server1只能访问ZONE1中的硬盘,如果需要更多的硬盘,只需要把新的硬盘加入到ZONE1即可。SAS zoning具体是通过SAS expander中的ZPT表(Zoning Permission Table,分区权限表)来控制不同ZONE之间是否可以通信。
[0007]
机柜服务器系统中存在两个通信平面,分别是数据平面和管理平面。数据平面采用带内通道(SAS)互联,目前的组网通常采用多路径冗余设计,网络中至少有两个交换节点,JBOD内有两个SAS expander连接硬盘的两个端口,每个交换节点与server和JBOD交叉互联,server上运行主机多路径软件来实现多条IO(Input/Output,输入/输出)路径的链路冗余和负载均衡。管理平面通常分为带内管理和带外管理,带内管理使用HBA(Host Bus Adapter,主机总线适配器)管理SAS expander,通过SES(SCSI Enclosure Services,SCSI箱体服务)协议实现箱体管理,带外管理通道有eth(以太网)、UART(Universal Asynchronous Receiver/Transmitter,通用异步收发传输器或异步收发传输器)或I2C(Inter-Integrated Circuit,两线式串行总线)等。由于HBA的硬件成本昂贵,因此交换节点通常采用带外管理。图1显示的是管理客户端5,例如为一台PC(Personal Computer,个人计算机)通过带外通道连接其中一个SAS switch,在管理客户端5上提供web GUI(Graphical User Interface,图形用户界面),通过图形化界面管理server使用的存储资源。
[0008]
图2是相关技术的机柜服务器系统管理平面示意图,图2所示的为一种常见的管理平面,HBA24,JBOD42均与SAS Switch32连接,BMC21,BMC31和BMC41(Board Management Controller,基板管理控制器)提供带外监管、固件管理和传感器23,传感器33,传感器43管理等。服务器节点板2上的BMC21负责传感器23功能,通过与BIOS22(Basic Input Output System,基本输入输出系统)进行数据交换,获取单板的系统信息,接收来自BIOS22的系统事件,上报给RMC1(Rack Management Controller,机柜管 理板)。交换节点板3的BMC31只负责传感器33管理,SAS Switch32通过带外通道直接与RMC1通信。存储节点板4的BMC41只负责传感器43功能,JBOD42只有带内通道连接交换节点板3。
[0009]
发明内容
[0010]
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
[0011]
本文提供一种存储资源管理的系统及方法,可以直接获取JBOD存储资源,提高传递效率。
[0012]
一种存储资源管理的系统,包括:
[0013]
机柜管理板RMC,设置为:根据接收到的自我监测分析和报告技术SMART信息、串行连接小型计算机系统接口SAS拓扑信息以及硬盘信息中的一种或多种,管理存储资源;
[0014]
与所述RMC连接的服务器节点板,设置为:获取所述SMART信息,并上报至所述RMC;
[0015]
与所述RMC连接的交换节点板,设置为:获取所述SAS拓扑信息,并上报至所述RMC;
[0016]
与所述RMC连接的存储节点板,设置为:获取所述硬盘信息,并上报至所述RMC,其中所述存储节点板包括:与所述RMC连接的第一基板管理控制器BMC、与所述第一BMC连接的简单硬盘簇JBOD,其中所述第一BMC设置为:管理从所述JBOD获取的硬盘信息。
[0017]
可选地,所述服务器节点板包括:与所述RMC连接的第二基板管理控制器BMC,所述第二BMC设置为:分别带外管理与所述第二BMC连接的主机总线适配器HBA、基本输入输出系统BIOS以及温度传感器,其中,所述第二BMC设置为:管理所述HBA记录的所述SMART信息中的温度信息。
[0018]
可选地,所述交换节点板包括:与所述RMC连接的第三基板管理控制器BMC,所述第三BMC设置为:分别带外管理与所述第三BMC连接的串行连接小型计算机系统接口交换SAS Switch以及温度传感器,其中,所述第 三BMC设置为:管理从所述SAS Switch获取的SAS拓扑信息。
[0019]
可选地,所述SAS拓扑信息包括所述HBA连接SAS Switch的端口号Port ID、所述SAS的地址。
[0020]
可选地,所述硬盘信息包括硬盘的端口信息、容量、设备类型以及接口类型。
[0021]
可选地,所述RMC还设置为:在获取第一硬盘的分配请求后,解析所述分配请求中所述第一硬盘的端口及容量信息;根据所述第一硬盘的端口及所述容量信息,将所述第一硬盘的端口加入到,与所述第一硬盘容量匹配的伙伴硬盘分区,其中所述伙伴硬盘分区为与服务器节点板分区预先建立一一对应关系的分区。
[0022]
可选地,所述RMC还设置为:在所述第一硬盘已分配之后,获取一删除分配请求,根据所述删除分配请求,将所述第一硬盘退出伙伴硬盘分区。
[0023]
可选地,所述第一BMC还设置为:获取到第二硬盘拔出事件,将所述第二硬盘拔出事件上报给所述RMC,由所述RMC进行第二硬盘信息的删除。
[0024]
可选地,所述第一BMC还设置为:获取到第二硬盘插入事件,将所述第二硬盘分配给预设默认分区,并将所述插入事件上报给所述RMC。
[0025]
一种存储资源管理的方法,应用于如上述任一项所述的存储资源管理的系统中,所述包括:
[0026]
服务器节点板获取自我监测分析和报告技术SMART信息,并上报至机柜管理板RMC;
[0027]
交换节点板获取串行连接小型计算机系统接口SAS拓扑信息,并上报至所述RMC;
[0028]
存储节点板获取硬盘信息,并上报至所述RMC;
[0029]
所述RMC根据从所述服务器节点板接收到的所述SMART信息、从所述交换节点板接收到的所述SAS拓扑信息,以及从所述存储节点板接收到的所述硬盘信息中的一种或多种,管理存储资源。
[0030]
可选地,所述SAS拓扑信息包括所述HBA连接SAS Switch的端口号Port ID、所述SAS的地址。
[0031]
可选地,所述硬盘信息包括硬盘的端口信息、容量、设备类型以及接口 类型。
[0032]
可选地,所述方法还包括:所述RMC在获取第一硬盘的分配请求后,解析所述分配请求中所述第一硬盘的端口及容量信息;根据所述第一硬盘的端口及所述容量信息,将所述第一硬盘的端口加入到,与所述第一硬盘容量匹配的伙伴硬盘分区,其中所述伙伴硬盘分区为与服务器节点板分区预先建立一一对应关系的分区。
[0033]
可选地,所述方法还包括:所述RMC在所述第一硬盘已分配之后,获取一删除分配请求,根据所述删除分配请求,将所述第一硬盘退出伙伴硬盘分区。
[0034]
可选地,所述方法还包括:所述第一BMC获取到第二硬盘拔出事件,将所述第二硬盘拔出事件上报给所述RMC,由所述RMC进行第二硬盘信息的删除。
[0035]
可选地,所述方法还包括:所述第一BMC获取到第二硬盘插入事件,将所述第二硬盘分配给预设默认分区,并将所述插入事件上报给所述RMC。
[0036]
可选地,所述方法还包括:所述RMC发送查询第三硬盘运行状态的命令给所述第二BMC;
[0037]
所述RMC接收到由所述第二BMC反馈所述HBA中的SMATR信息,并根据所述SMATR信息中的所述第三硬盘实际温度,调控整体的散热系统;
[0038]
所述RMC接收到由所述第二BMC反馈所述HBA中的SMATR信息,并根据所述SMATR信息中的所述第三硬盘的运行状态,判断所述第三硬盘是否发生故障;
[0039]
所述RMC在所述第三硬盘发生故障之后,告警并隔离。
[0040]
本发明实施例的方案中,RMC通过直接分别从服务器节点板、交换节点板及存储节点板获取自我监测分析和报告技术SMART信息、串行连接小型计算机系统接口SAS拓扑信息以及硬盘信息进行管理,本发明实施例对相关技术的机柜服务器系统的管理平面进行了优化,使用第一BMC实现带外资源管理和分配,并且通过存储节点板的第一BMC管理JBOD,可以直接获取JBOD存储资源,简化了SAS Switch的软件复杂度,提高了传递效率。
[0041]
在阅读并理解了附图和详细描述后,可以明白其他方面。
[0042]
附图概述
[0043]
图1为相关技术的SAS Zoning原理图;
[0044]
图2为相关技术的机柜服务器系统管理平面示意图;
[0045]
图3为本发明实施例的一种机柜服务器系统管理平面示意图;
[0046]
图4为本发明实施例存储资源分配示意图;
[0047]
图5为本发明实施例的另一种机柜服务器系统管理平面示意图;
[0048]
图6为本发明实施例存储资源管理状态机;
[0049]
图7为本发明实施例的存储资源管理的方法的步骤示意图。

本发明的实施方式

[0050]
下文将结合附图及具体实施方式进行详细描述。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
[0051]
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0052]
本发明实施例针对相关技术中SAS Switch32直接和RMC1连接,再将交换节点板3中的BMC31和RMC1连接,只能从交换节点板3中的BMC31获取到传感器43信息,并不能获取到资源管理信息的问题,还有相关技术中通过SAS switch32转发JBOD42给RMC1,不仅效率差,而且条件要求较高的问题。
[0053]
本发明实施例提供一种存储资源管理的系统及方法,将BMC分别与JBOD和HBA连接,就可得到资源管理信息以及传感器信息,实现了直接获取资源,进行管理,并且减少了RMC的软件复杂度,而且通过BMC转发JBOD安全可靠,效率高。
[0054]
图3为本发明实施例的一种机柜服务器系统管理平面示意图,图4为本发明实施例存储资源分配示意图,如图3和图4所示,本发明实施例提供的 存储资源管理的系统,包括:
[0055]
机柜管理板RMC31,设置为:根据接收到的自我监测分析和报告技术SMART信息、串行连接小型计算机系统接口SAS拓扑信息以及硬盘信息中的一种或多种,管理存储资源;
[0056]
与所述RMC31连接的服务器节点板32,设置为:获取所述SMART信息,并上报至所述RMC31;
[0057]
与所述RMC31连接的交换节点板33,设置为:获取所述SAS拓扑信息,并上报至所述RMC31;
[0058]
与所述RMC31连接的存储节点板34,设置为:获取所述硬盘信息,并上报至所述RMC31,其中所述存储节点板34包括:与所述RMC连接的第一基板管理控制器BMC341、与所述第一BMC341连接的简单硬盘簇JBOD342,其中所述第一BMC341设置为:管理从所述JBOD342获取的硬盘信息。
[0059]
本发明实施例中,RMC31通过直接分别从服务器节点板32、交换节点板33及存储节点板34获取自我监测分析和报告技术SMART信息、串行连接小型计算机系统接口SAS拓扑信息以及硬盘信息进行管理,比起相关技术的的图2中RMC1获取JBOD42的硬盘信息(RMC1对JBOD42的管理需要SAS switch32进行带外到带内的转换,在获取存储资源信息时,SAS switch32需要先解析带外管理命令,转换成SCSI命令发送给JBOD42,并且对SAS switch32软件要求较高,很多功能需要特殊定制)的问题来说,本发明实施例对相关技术的机柜服务器系统的管理平面进行了优化,使用第一BMC341实现带外资源管理和分配,并且通过存储节点板的第一BMC341管理JBOD342,可以直接获取JBOD342存储资源,简化了SAS Switch的软件复杂度,提高了传递效率。
[0060]
如图3所示,本实施例的所述存储节点板34还包括:与所述第一BMC341连接的温度传感器343,其中所述存储节点板34可以配置一块或者多块。图3中仅示出一块存储节点板34,以及该存储节点板34的结构和连接关系。
[0061]
可选地,上述存储节点板34上的JBOD342以及SAS expander自动拓扑发现SAS交换域中的所有硬盘的信息,包括连接SAS expander的Port ID、SAS地址、设备类型、接口类型、容量、硬盘序列号等。
[0062]
可选地,上述简单硬盘簇JBOD342包括串行连接小型计算机系统接口扩展器SAS expander以及硬盘。
[0063]
可选地,分别与所述第一BMC341连接的JBOD342和温度传感器343均是通过带外管理连接,其中所述带外管理连接包括但不限于以太网、UART(Universal Asynchronous Receiver/Transmitter,通用异步收发传输器或异步收发传输器)、I2C(Inter-Integrated Circuit,两线式串行总线),具体的连接对应取决于HBA、SAS switch以及SAS expander芯片能力,并且上述与所述RMC31连接的服务器节点板32,交换节点板33以及存储节点板34均通过以太网进行连接。
[0064]
可选地,上述SAS拓扑信息包括所述HBA324连接SAS Switch332的端口号Port ID、所述SAS的地址。上述硬盘信息包括硬盘的端口信息、容量、设备类型以及接口类型。
[0065]
可选地,上述的SMART(Self Monitoring Analysis and Reporting Technology,自我监测分析和报告技术)信息包括硬盘的运行时间,运行参数,运行温度等信息,用于记录硬盘的状态;通过查询硬盘的SMART信息直接得到信息,不影响系统散热效果,也方便可靠的监测硬件温度。
[0066]
上述RMC31,作为系统中的机柜管理节点,通过以太网交换汇聚了所有节点板的BMC,组成所述机柜服务器系统的管理平面。
[0067]
管理客户端35,作为系统中的网管后台,以太网连接RMC,负责整个服务器机柜节点板的版本管理、故障管理和资源管理等。提供web GUI,用户可以图形化管理所述机柜服务器系统中的存储资源。
[0068]
可选地,机柜管理板RMC31如果仅接收到SMART信息、SAS拓扑信息以及硬盘信息中的一种信息,则说明其他没有上报信息的路径出现异常,就可以实现异常的IO路径检测,针对相关技术的的RMC对硬盘的检测不能覆盖完整的服务器节点的IO路径(如图2中RMC1并不能发现HBA24和SAS Switch32之间出现的断链),本发明实施例能够实现故障硬盘隔离更换功能。
[0069]
可选地,如图5所示,为本发明实施例的另一种机柜服务器系统管理平面示意图。本实施例为了实现HBA324将记录的所述SMART信息中的温度信息上报给RMC31,本发明实施例的存储资源管理的系统中,所述服务器节 点板32包括:与所述RMC连接的第二基板管理控制器BMC321,所述第二BMC321设置为:分别带外管理与该第二BMC321连接的主机总线适配器HBA324、基本输入输出系统BIOS322以及温度传感器323,其中,所述第二BMC321设置为:管理所述HBA324记录的所述SMART信息中的温度信息。
[0070]
本发明实施例中,所述服务器节点板32的第二BMC321管理HBA324,可以解决相关技术中的SAS expander带外管理通道无法直接获取硬盘的SMART信息的缺陷。
[0071]
可选地,所述服务器节点板32可以配置一块或者多块,通过所述第二BMC321监控硬盘状态,检测所述服务器节点板32的IO路径,并根据硬盘实际温度调节散热系统,隔离故障硬盘。图5中仅示出一块服务器节点板32,以及该服务器节点板32的结构和连接关系。
[0072]
如图5所示,为了实现从SAS Switch332获取的SAS拓扑信息上报给RMC31,本发明实施例的存储资源管理的系统中,所述交换节点板33包括:与所述RMC31连接的第三基板管理控制器BMC331,所述第三BMC331设置为:分别带外管理与该第三BMC331连接的串行连接小型计算机系统接口交换SAS Switch332以及温度传感器333,其中,所述第三BMC331设置为:管理从所述SAS Switch332获取的SAS拓扑信息。
[0073]
本发明实施例中,所述交换节点板的第三BMC331管理SAS Switch332,对RMC屏蔽了不同厂家SAS Switch的差异。
[0074]
可选地,上述所述交换节点板33至少配置两块构成多路径冗余设计,并且连接于第三BMC331上的SAS Switch332自动拓扑发现SAS交换域中的所有SAS device和SAS expander的信息,包括HBA324连接SAS Switch332的Port ID、SAS地址。图5中仅示出一块交换节点板33,以及该交换节点板33的结构和连接关系。
[0075]
为了能够通过RMC31管理SAS Switch332一端来管理所有资源,将所述存储节点板34上的JBOD342、所述HBA324均与SAS Switch332连接,所述第一BMC341、第三BMC331与第二BMC321均与RMC31连接,因此可以通过RMC31管理SAS Switch332一端来管理所有资源,避免了如图2的RMC1与HBA24以及JBOD42没有连接,无法进行管理的问题。本发明实施例中的 检测方法可以如下,包括步骤101~104:
[0076]
步骤101:RMC下发命令给服务器节点板中的第二BMC,检测IO路径。
[0077]
步骤102:第二BMC命令HBA通过SCSI命令获取交换节点板SAS Switch的SAS地址。如果获取失败,上报异常。
[0078]
步骤103:第二BMC命令HBA通过SCSI命令获取存储节点板SAS expander的SAS地址。如果获取失败,上报异常。
[0079]
步骤104:第二BMC命令HBA通过SCSI命令获取存储节点板硬盘序列号。如果获取失败,上报异常。
[0080]
本发明实施例的系统平面示意。
[0081]
为便于描述如图4所示,只显示两个服务器节点板32、一个交换节点板33和两个存储节点板34。譬如两块存储节点板34共有3个硬盘,用户希望在初始态,所有服务器节点板32看不到任何硬盘,由RMC31根据用户配置把硬盘分配给具体的服务器节点板32,譬如硬盘HDD1(Hard Disk Drive,硬盘驱动器)分配给HBA1,硬盘HDD2分配给HBA2。未分配的硬盘称为无主盘,图4中硬盘HDD3为无主盘。因为服务器节点板32的槽位是固定的,HBA324连接SAS Switch332的端口也是确定的,SAS Switch332不用关心该槽位服务器节点板32是否在位,初始化时分配好所有服务器节点板32槽位的ZONE,服务器节点板32在上电后就可以看到被分配的硬盘。
[0082]
为了实现资源分配,本发明实施例的存储资源管理的系统中,所述RMC31还设置为:在获取第一硬盘的分配请求后,解析所述分配请求中所述第一硬盘的端口及容量信息;根据所述第一硬盘的端口及所述容量信息,将所述第一硬盘的端口加入到,与所述第一硬盘容量匹配的伙伴硬盘分区,其中所述伙伴硬盘分区为与服务器节点板分区预先建立一一对应关系的分区。
[0083]
本发明实施例中,在服务器节点板32没有加电前实现动态资源分配,采用的存储资源分配方法,只需要在初始化时同步一次ZPT表,后续SAS拓扑发生变化时,通过更改硬盘对应SAS PHY的组识别码group ID即可方便的实现SAS zoning配置。
[0084]
可选地,通过所述SAS Switch332设置服务器节点板ZONE和伙伴硬盘ZONE,所述服务器节点板ZONE是指交换节点板33的SAS Switch332对应 服务器节点板32槽位的SAS PHY(Physical Layer,物理层)的属性组group ID,譬如SAS Switch修改HBA1对应的端口P1的group ID为group 8(SAS Zoning规定group0~7为保留group),修改HBA2对应的端口P2的group ID为group9。所述伙伴硬盘ZONE是指所述服务器节点板可以通信的ZONE。譬如HBA1的伙伴存储节点ZONE为group64,HBA2的伙伴存储节点ZONE为group65。
[0085]
SAS expander设置所有硬盘归属同一个缺省ZONE,通常选择一个保留group作为缺省ZONE。譬如SAS expander1设置硬盘HDD1对应的端口P3的group ID为group0,SAS expander2设置硬盘HDD2对应的端口P4的group ID为group0,硬盘HDD3对应的端口P5的group ID为group0。
[0086]
可选地,所述预先建立是指所述交换节点板33的SAS Switch332在初始化时设置服务器节点板ZONE和伙伴硬盘ZONE,使得所述服务器节点板ZONE与伙伴硬盘ZONE是一一对应的关系。
[0087]
所述存储节点板SAS expander设置所有硬盘归属于同一个缺省ZONE。
[0088]
所述SAS Switch332设置ZPT表,只允许所述服务器节点板ZONE与伙伴硬盘ZONE通信。
[0089]
所述SAS Switch332在拓扑发现时把ZPT同步给所有SAS expander。
[0090]
SAS Switch创建ZPT表(协议要用到这个表进行划分通信),服务器节点板ZONE和伙伴硬盘ZONE建立通信。譬如SAS Switch创建的ZPT表如下表1所示。
[0091]
表1
[0092]
[0093]
[0094]
ZPT表的X轴表示源ZONE,Y轴表示目的ZONE,ZP(X,Y)为0表示groupX和groupY不能通信,1表示groupX和groupY能通信。M表示最大group,与SAS expander芯片能力有关,一般支持128个group。图4实例把ZP(8、64)和ZP(64、8)都设置为1使得group8和group64可以互相通信,把ZP(9、65)和ZP(65、9)都设置为1使得group9和group65可以互相通信。
[0095]
SAS Switch332把ZPT同步给SAS expander,譬如SAS Switch1和SAS Switch2把ZPT同步给SAS expander1和SAS expander2。
[0096]
本发明实施例的实现过程可以如下,包括步骤201~204。
[0097]
步骤201:用户在管理客户端35给服务器节点板32分配硬盘,譬如HBA1分配硬盘HDD1,给HBA2分配硬盘HDD2,下发命令给RMC31。
[0098]
步骤202:RMC下发命令给第一BMC。
[0099]
步骤203:第一BMC命令SAS expander修改伙伴硬盘ZONE。所述伙伴硬盘ZONE是指存储节点板SAS expander对应硬盘SAS PHY属性的group ID。譬如SAS expander1修改硬盘HDD1对应的端口P3的group ID为group64,SAS expander2修改硬盘HDD2对应的端口P4的group ID为group65。
[0100]
步骤204:资源分配成功,RMC保存用户数据。
[0101]
对于本发明实施例中,需要先上报硬件资源,再根据用户配置给服务器节点32分配硬件,先将硬盘加载group 0就是默认组,在判断硬件容量以及接口信息机上报资源给RMC31,RMC31根据上报信息将硬盘分配为服务的伙伴ZONE的group ID(即将原有的group 0修改为group 64),这样就可以得到通过RMC31转发的用户客户端指令所需的服务器以及容量大小。
[0102]
为了实现将分配的资源删除,本发明实施例的存储资源管理的系统中,
[0103]
所述RMC31还设置为:在所述第一硬盘已分配之后,获取一删除分配请求,根据所述删除分配请求,将所述第一硬盘退出伙伴硬盘分区。
[0104]
本发明实施例的实现过程可以如下,包括步骤301~303。
[0105]
步骤301:用户在管理客户端35删除分配给服务器节点板的硬盘,譬如删除分配给HBA1的硬盘HDD1,下发命令给RMC。
[0106]
步骤302:RMC下发命令给第一BMC。
[0107]
步骤303:第一BMC命令SAS expander把硬盘退出伙伴存储节点ZONE,譬如SAS expander1修改硬盘HDD1对应的端口P3的group ID为group0(0到9),退出group64。
[0108]
为了方便用户维护或者更换硬盘,进而拔出硬盘,本发明实施例的存储资源管理的系统中,所述第一BMC还设置为:获取到第二硬盘拔出事件,将所述第二硬盘拔出事件上报给所述RMC,由所述RMC进行第二硬盘信息的删除。
[0109]
为了方便用户增加硬盘或者更换硬盘,进而插入新的硬盘,本发明实施例的存储资源管理的系统中,所述第一BMC还设置为:获取到第二硬盘插入事件,将所述第二硬盘分配给预设默认分区,并将所述插入事件上报给所述RMC。
[0110]
可选地,上述预设默认分区为group0。
[0111]
可选地,如图6所示,本发明实施例中所述RMC可以实现上述多种功能,硬盘管理,资源删除,IO路径检测,硬盘插入等功能。
[0112]
如图7所示,为本发明实施例提供一种存储资源管理的方法的流程图,图6所示存储资源管理的方法可以如下,包括步骤61~64:
[0113]
步骤61,服务器节点板获取自我监测分析和报告技术SMART信息,并上报至机柜管理板RMC;
[0114]
步骤62,交换节点板获取串行连接小型计算机系统接口SAS拓扑信息,并上报至所述RMC;
[0115]
步骤63,存储节点板获取硬盘信息,并上报至所述RMC;本实施例中存储节点的结构,以及存储节点中第一BMC的作用,与上述实施例中相同,可以参照图3所示结构。
[0116]
步骤64,所述RMC根据从所述服务器节点板接收到的所述SMART信息、从所述交换节点板接收到的所述SAS拓扑信息,以及从所述存储节点板接收到的所述硬盘信息中的一种或多种,管理存储资源。
[0117]
本发明实施例中,RMC通过直接分别从服务器节点板、交换节点板及存储节点板获取自我监测分析和报告技术SMART信息、串行连接小型计算机系统接口SAS拓扑信息以及硬盘信息进行管理,从而本发明实施例对相关技术的机柜服务器系统的管理平面进行了优化,使用第一BMC实现带外资源管理和分配,并且通过存储节点板的第一BMC管理JBOD,可以直接获取JBOD存储资源,简化了SAS Switch的软件复杂度,提高了传递效率。
[0118]
为了更好的获得拓扑信息,本发明获取拓扑信息的流程举例如下,包括步骤401~406:
[0119]
步骤401,第三BMC向SAS Switch获取SAS拓扑信息,譬如SAS Switch获取HBA1和HBA2的端口信息、连接SAS expander1和SAS expander 2的端口信息。
[0120]
步骤402:第三BMC向RMC上报SAS拓扑信息。
[0121]
步骤403:RMC汇总所有交换节点板上报的SAS拓扑,譬如对板SAS Switch分别上报的SAS拓扑,如果不一致则告警,并选择最优拓扑。
[0122]
步骤404:第一BMC向SAS expander获取SAS拓扑信息,譬如SAS expander1和SAS expander 2获取SAS拓扑信息,包括硬盘的端口信息、容量、设备类型、接口类型。
[0123]
步骤405:第一BMC向RMC上报SAS拓扑。
[0124]
步骤406:RMC汇总所有存储节点板上报的SAS拓扑,譬如对比SAS expander 1和SAS expander 2分别上报的SAS拓扑,如果不一致则告警,并选择最优拓扑(所述最优拓扑是指数字最高,比如是通过一个SAS expander1检测到3个硬盘,一个SAS expander2检测到2个硬盘,为了避免遗漏硬盘,因此按照3个硬盘。具有SAS expander1以及SAS expander2两个,防止一个出错后,另一个可以保证业务,此处是为了选择最优拓扑,一般一个也可以满足要求)。
[0125]
本发明的又一实施例的存储资源管理的方法中,所述服务器节点板包括:与所述RMC连接的第二基板管理控制器BMC,所述第二BMC分别带外管理与所述第二BMC连接的主机总线适配器HBA、基本输入输出系统BIOS以及温度传感器,其中,所述第二BMC设置为:管理所述HBA记录的所述 SMART信息中的温度信息。
[0126]
本发明实施例中,所述服务器节点板中的第二BMC管理HBA,可以弥补SAS expander带外管理通道无法直接获取硬盘的SMART信息的缺陷。
[0127]
本发明的又一实施例的存储资源管理的方法中,所述交换节点板包括:与所述RMC连接的第三基板管理控制器BMC,所述第三BMC分别带外管理与所述第三BMC连接的串行连接小型计算机系统接口交换SAS Switch以及温度传感器,其中,所述第三BMC,设置为:管理从所述SAS Switch获取的SAS拓扑信息。
[0128]
本发明实施例中,所述交换节点板中的第三BMC管理SAS Switch,对RMC屏蔽了不同厂家SAS Switch的差异。
[0129]
本发明的又一实施例的存储资源管理的方法中,所述SAS拓扑信息包括所述HBA连接SAS Switch的端口号Port ID、所述SAS的地址。
[0130]
本发明实施例中,将第一BMC、第二BMC分别与JBOD和HBA连接,所述第一BMC管理JBOD,也可以直接获取JBOD存储资源,简化了SAS Switch的软件复杂度。
[0131]
本发明的又一实施例的存储资源管理的方法中,所述硬盘信息包括硬盘的端口信息、容量、设备类型以及接口类型。
[0132]
本发明的又一实施例的存储资源管理的方法中,所述RMC在获取第一硬盘的分配请求后,解析所述分配请求中所述第一硬盘的端口及容量信息;根据所述第一硬盘的端口及所述容量信息,将所述第一硬盘的端口加入到,与所述第一硬盘容量匹配的伙伴硬盘分区,其中所述伙伴硬盘分区为与服务器节点板分区预先建立一一对应关系的分区。
[0133]
本发明采用的存储资源分配方法,只需要在初始化时同步一次ZPT表,后续SAS拓扑发生变化时,通过更改硬盘对应SAS PHY(Physical layer,物理层)的group ID即可方便的实现SAS zoning配置。
[0134]
本发明的又一实施例的存储资源管理的方法中,所述RMC在所述第一硬盘已分配之后,获取一删除分配请求,根据所述删除分配请求,将所述第一硬盘退出伙伴硬盘分区。
[0135]
本发明的又一实施例的存储资源管理的方法中,所述第一BMC获取到 第二硬盘拔出事件,将所述第二硬盘拔出事件上报给所述RMC,由所述RMC进行第二硬盘信息的删除。
[0136]
本发明的又一实施例的存储资源管理的方法中,所述第一BMC获取到第二硬盘插入事件,将所述第二硬盘分配给预设默认分区,并将所述插入事件上报给所述RMC。
[0137]
本发明的又一实施例的存储资源管理的方法中,
[0138]
所述RMC发送查询第三硬盘运行状态的命令给所述第二BMC;
[0139]
所述RMC接收到由所述第二BMC反馈所述HBA中的SMATR信息,并根据所述SMATR信息中的所述第三硬盘实际温度,调控整体的散热系统;
[0140]
所述RMC接收到由所述第二BMC反馈所述HBA中的SMATR信息,并根据所述SMATR信息中的所述第三硬盘的运行状态,判断所述第三硬盘是否发生故障;
[0141]
所述RMC在所述第三硬盘发生故障之后,告警并隔离。
[0142]
本发明实施例中,能够根据硬盘温度动态调节系统散热并对硬盘的运行状态进行监测。
[0143]
可选地,上述的SMART信息包括硬盘的运行时间,运行参数,运行温度等信息,用于记录硬盘的状态。
[0144]
对于RMC的硬盘管理的流程举例如下,包括步骤501~步骤505:
[0145]
步骤501:RMC下发命令给第二BMC,查询硬盘运行状态。
[0146]
步骤502:服务器节点板中的第二BMC命令HBA查询硬盘的SMART信息。
[0147]
步骤503:RMC获取到硬盘的运行状态。
[0148]
步骤504:RMC根据硬盘实际温度调控散热系统。
[0149]
步骤505:RMC发现故障盘(和正常参数不同),告警并隔离(就是退出硬盘)。
[0150]
本发明实施例中,针对相关技术的的通过单个传感器的数据进行温度数据的上报数据的误差(具体的由于存储板较多,对应的每个存储板上不能都有传感器,或者每个传感器上距离每个存储板的距离远近也会影响测量数据,使得存储节点通过温度传感器监测的硬盘温度与硬盘内部的实际温度存在误 差,影响系统散热效果以及缩短硬盘寿命的问题。如图2中只有服务器节点中的HBA可以作为SAS initiator Device(发起者的装置)通过SCSI(Small Computer System Interface,小型计算机系统接口)协议去获取。交换节点的带外通道是无法直接获取SMART信息的,但是服务器节点通常采用商用OS(Operation System,操作系统),不便直接增加应用程序去控制HBA。)本发明实施例通过查询硬盘的SMART信息直接得到信息,不影响系统散热效果,也方便可靠的监测硬件温度。
[0151]
需要说明的是,本发明实施例提供的存储资源管理的系统是应用上述存储资源管理的方法的系统,则上述存储资源管理的方法的所有实施例均适用于该系统,且均能达到相同或相似的有益效果。
[0152]
本领域普通技术人员可以理解上述实施例的全部或部分步骤可以使用计算机程序流程来实现,所述计算机程序可以存储于一计算机可读存储介质中,所述计算机程序在相应的硬件平台上(如系统、设备、装置、器件等)执行,在执行时,包括方法实施例的步骤之一或其组合。
[0153]
可选地,上述实施例的全部或部分步骤也可以使用集成电路来实现,这些步骤可以被分别制作成一个个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。
[0154]
上述实施例中的装置/功能模块/功能单元可以采用通用的计算装置来实现,它们可以集中在单个的计算装置上,也可以分布在多个计算装置所组成的网络上。
[0155]
上述实施例中的装置/功能模块/功能单元以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。上述提到的计算机可读取存储介质可以是只读存储器,磁盘或光盘等。

工业实用性

[0156]
本发明实施例中的RMC通过直接分别从服务器节点板、交换节点板及存储节点板获取自我监测分析和报告技术SMART信息、串行连接小型计算机系统接口SAS拓扑信息以及硬盘信息进行管理,本发明实施例对相关技术 的机柜服务器系统的管理平面进行了优化,使用第一BMC实现带外资源管理和分配,并且通过存储节点板的第一BMC管理JBOD,可以直接获取JBOD存储资源,简化了SAS Switch的软件复杂度,提高了传递效率。

权利要求书

[权利要求 1]
一种存储资源管理的系统,包括: 机柜管理板RMC,设置为:根据接收到的自我监测分析和报告技术SMART信息、串行连接小型计算机系统接口SAS拓扑信息以及硬盘信息中的一种或多种,管理存储资源; 与所述RMC连接的服务器节点板,设置为:获取所述SMART信息,并上报至所述RMC; 与所述RMC连接的交换节点板,设置为:获取所述SAS拓扑信息,并上报至所述RMC; 与所述RMC连接的存储节点板,设置为:获取所述硬盘信息,并上报至所述RMC,其中所述存储节点板包括:与所述RMC连接的第一基板管理控制器BMC、与所述第一BMC连接的简单硬盘簇JBOD,其中所述第一BMC设置为:管理从所述JBOD获取的硬盘信息。
[权利要求 2]
根据权利要求1所述的存储资源管理的系统,其中,所述服务器节点板包括:与所述RMC连接的第二基板管理控制器BMC,所述第二BMC设置为:分别带外管理与所述第二BMC连接的主机总线适配器HBA、基本输入输出系统BIOS以及温度传感器,其中,所述第二BMC设置为:管理所述HBA记录的所述SMART信息中的温度信息。
[权利要求 3]
根据权利要求1所述的存储资源管理的系统,其中,所述交换节点板包括:与所述RMC连接的第三基板管理控制器BMC,所述第三BMC设置为:分别带外管理与所述第三BMC连接的串行连接小型计算机系统接口交换SAS Switch以及温度传感器,其中,所述第三BMC设置为:管理从所述SAS Switch获取的SAS拓扑信息。
[权利要求 4]
根据权利要求1或3所述的存储资源管理的系统,其中,所述SAS拓扑信息包括所述HBA连接SAS Switch的端口号Port ID、所述SAS的地址。
[权利要求 5]
根据权利要求1所述的存储资源管理的系统,其中,所述硬盘信息包括硬盘的端口信息、容量、设备类型以及接口类型。
[权利要求 6]
根据权利要求1、2或3所述的存储资源管理的系统,其中, 所述RMC还设置为:在获取第一硬盘的分配请求后,解析所述分配请求中所述第一硬盘的端口及容量信息;根据所述第一硬盘的端口及所述容量信息,将所述第一硬盘的端口加入到,与所述第一硬盘容量匹配的伙伴硬盘分区,其中所述伙伴硬盘分区为与服务器节点板分区预先建立一一对应关系的分区。
[权利要求 7]
根据权利要求6所述的存储资源管理的系统,其中, 所述RMC还设置为:在所述第一硬盘已分配之后,获取一删除分配请求,根据所述删除分配请求,将所述第一硬盘退出伙伴硬盘分区。
[权利要求 8]
根据权利要求1所述的存储资源管理的系统,其中, 所述第一BMC还设置为:获取到第二硬盘拔出事件,将所述第二硬盘拔出事件上报给所述RMC,由所述RMC进行第二硬盘信息的删除。
[权利要求 9]
根据权利要求1所述的存储资源管理的系统,其中, 所述第一BMC还设置为:获取到第二硬盘插入事件,将所述第二硬盘分配给预设默认分区,并将所述插入事件上报给所述RMC。
[权利要求 10]
一种存储资源管理的方法,应用于如权利要求1~9中任一项所述的系统中,包括: 服务器节点板获取自我监测分析和报告技术SMART信息,并上报至机柜管理板RMC; 交换节点板获取串行连接小型计算机系统接口SAS拓扑信息,并上报至所述RMC; 存储节点板获取硬盘信息,并上报至所述RMC; 所述RMC根据从所述服务器节点板接收到的所述SMART信息、从所述交换节点板接收到的所述SAS拓扑信息,以及从所述存储节点板接收到的所述硬盘信息中的一种或多种,管理存储资源。
[权利要求 11]
根据权利要求10所述的存储资源管理的方法,其中,所述SAS拓扑信息包括所述HBA连接SAS Switch的端口号Port ID、所述SAS的地址。
[权利要求 12]
根据权利要求10所述的存储资源管理的方法,其中,所述硬盘信息包括硬盘的端口信息、容量、设备类型以及接口类型。
[权利要求 13]
根据权利要求10所述的存储资源管理的方法,还包括: 所述RMC在获取第一硬盘的分配请求后,解析所述分配请求中所述第一硬盘的端口及容量信息;根据所述第一硬盘的端口及所述容量信息,将所述第一硬盘的端口加入到,与所述第一硬盘容量匹配的伙伴硬盘分区,其中所述伙伴硬盘分区为与服务器节点板分区预先建立一一对应关系的分区。
[权利要求 14]
根据权利要求13所述的存储资源管理的方法,还包括: 所述RMC在所述第一硬盘已分配之后,获取一删除分配请求,根据所述删除分配请求,将所述第一硬盘退出伙伴硬盘分区。
[权利要求 15]
根据权利要求10所述的存储资源管理的方法,还包括: 所述第一BMC获取到第二硬盘拔出事件,将所述第二硬盘拔出事件上报给所述RMC,由所述RMC进行第二硬盘信息的删除。
[权利要求 16]
根据权利要求10所述的存储资源管理的方法,还包括: 所述第一BMC获取到第二硬盘插入事件,将所述第二硬盘分配给预设默认分区,并将所述插入事件上报给所述RMC。
[权利要求 17]
根据权利要求11所述的存储资源管理的方法,还包括: 所述RMC发送查询第三硬盘运行状态的命令给所述第二BMC; 所述RMC接收到由所述第二BMC反馈所述HBA中的SMATR信息,并根据所述SMATR信息中的所述第三硬盘实际温度,调控整体的散热系统; 所述RMC接收到由所述第二BMC反馈所述HBA中的SMATR信息,并根据所述SMATR信息中的所述第三硬盘的运行状态,判断所述第三硬盘是否发生故障 所述RMC在所述第三硬盘发生故障之后,告警并隔离。

附图

[ 图 0001]  
[ 图 0002]  
[ 图 0003]  
[ 图 0004]  
[ 图 0005]  
[ 图 0006]  
[ 图 0007]