附件下载
集群管理技术介绍.pdf(180.38 KB)
集群是一组网络通信设备的集合,集群管理的主要目的是解决大量分散的网络设备的集中管理问题。
集群管理功能通过HGMPv2(HW Group Management Protocol version 2,HW组管理协议)实现。网络管理员只需要在集群中的一个设备上配置公网IP地址就可以实现对集群中其它设备的管理和维护;配置公网IP地址并执行管理功能的设备是管理设备,其它被管理的设备是成员设备,管理设备和成员设备组成了一个“集群”。典型组网应用如图1所示。

集群管理优点如下:
l 节省公网IP地址。
l 简化配置管理任务。只需要在管理设备上配置一个公网IP地址,就可实现对多个成员设备的配置和管理,不需要登录到每个成员设备上进行配置。
l 提供拓扑发现和显示功能,有助于监视和调试网络。
l 可同时对多个设备进行软件升级和参数配置,并且不受网络拓扑结构和距离的限制。
根据各设备在集群中所处的地位和功能的不同,形成了不同的角色,用户可以通过配置来指定角色,集群中设备的角色可以分为三种:
l 管理设备:在集群中,对整个集群管理发挥接口作用的设备,也是在集群中唯一配置公网IP地址的设备,对集群中的设备进行配置、管理和监控都必须通过它来进行。一台设备被指定为管理设备后,通过收集NDP(Neighbor Discovery Protocol,邻居发现协议)和NTDP(Neighbor Topology Discovery Protocol,邻居拓扑发现协议)信息来发现和确定候选设备。
l 成员设备:在集群中被管理的设备。
l 候选设备:没有加入任何集群但具有集群能力、能够成为集群成员的设备,与成员设备的区别在于它的拓扑信息已经被管理设备收集到但还没有完成集群加入过程,没有成为集群的成员设备。

l 用户在候选设备上创建集群的同时,将当前候选设备指定为集群管理设备。每个集群必须指定一个(而且只能指定一个)管理设备。在管理设备被指定后,管理设备通过收集相关信息,发现和确定候选设备。用户可以通过相应的配置把候选设备加入到集群中。
l 候选设备加入集群后,成为成员设备。
l 集群内的成员设备被删除后将恢复为候选设备。
l 管理设备只有在删除集群时才能恢复为候选设备。
HGMPv2由以下三个协议组成:
l NDP(Neighbor Discovery Protocol,邻居发现协议)
l NTDP(Neighbor Topology Discovery Protocol,邻居拓扑发现协议)
l Cluster(集群管理协议)
集群通过以上三个协议,对集群内部的设备进行配置和管理。
集群的工作过程包括拓扑收集以及集群的建立和维护,拓扑收集过程和集群维护过程相对独立,拓扑收集过程在集群建立之前就开始启动,工作原理如下所述:
l 所有设备通过NDP来获取邻居设备的信息,包括邻居设备的软件版本、主机名、MAC地址和端口名称等信息。
l 管理设备通过NTDP来收集用户指定跳数范围内的设备信息以及各个设备的连接信息,并从收集到的拓扑信息中确定集群的候选设备。
l 管理设备根据NTDP收集到的候选设备信息完成将候选设备加入集群、成员设备离开集群的操作。
NDP用来获取直接相连的邻居设备的信息,包括连接端口、设备名称、软件版本等信息,工作原理如下所述:
l 运行NDP的设备周期性地向邻居发送NDP报文,NDP报文中包含NDP信息(包括当前设备的设备名称、软件版本、连接端口等信息)以及NDP信息在接收设备上的老化时间。同时也会接收但不转发邻居设备发送的NDP报文。
l 运行NDP的设备都会存储和维护NDP邻居信息表,在NDP邻居信息表里为每个邻居设备创建一个表项。如果新发现了一个邻居即第一次收到它发送的NDP报文,则会在NDP邻居信息表新增一个表项;如果从邻居设备收到的NDP信息与旧的信息不同,则更新NDP表中的相应数据项,如果相同,则只更新老化时间,如果超过老化时间还没有收到邻居发送的NDP信息,将自动删除相应的邻居表项。
NDP协议运行在数据链路层,因此可以支持不同的网络层协议。
NTDP用来在一定网络范围内收集每个设备的信息以及设备间的连接信息。NTDP为管理设备提供可加入集群的设备信息,收集指定跳数内的设备的拓扑信息。
NDP为NTDP提供邻接表信息,NTDP根据邻接信息发送和转发NTDP拓扑收集请求,收集一定网络范围内每个设备的NDP信息和它与所有邻居的连接信息。收集完这些信息后,管理设备或者网管可以根据需要使用这些信息,完成所需的功能。
当成员设备上的NDP发现邻居有变化时,通过握手报文将邻居改变的消息通知管理设备,管理设备可以启动NTDP进行指定拓扑收集,从而使NTDP能够及时反映网络拓扑的变化。
管理设备可以定时在网络内进行拓扑收集,用户也可以通过手工配置命令启动一次拓扑收集。管理设备收集拓扑信息过程如下:
l 管理设备从使能NTDP功能的端口定时发送NTDP拓扑收集请求报文。
l 收到请求报文的设备立即发送拓扑响应报文至管理设备,并在已使能NTDP功能的端口复制此请求报文并发送到邻接设备;拓扑响应报文包含本设备的基本信息和所有邻接设备的NDP信息。
l 邻接设备收到请求报文后将执行同样操作,直至拓扑收集请求报文扩散到指定跳数范围内的所有设备。
当拓扑收集请求报文在网络内扩散时,大量网络设备同时收到拓扑收集请求并同时发送拓扑响应报文,为了避免网络拥塞和管理设备任务繁忙,可采取以下措施控制拓扑收集请求报文扩散速度:
l 设备收到拓扑收集请求后不是立即转发该拓扑收集请求报文,而是延迟等待一定时间,才开始在使能NTDP功能的端口转发该拓扑收集请求报文。
l 在同一个设备上,除第一个端口外,每个使能NTDP功能的端口在前一个端口发送拓扑收集请求报文后都会延迟一定时间再进行拓扑收集请求报文的转发。
(1) 候选设备加入集群
用户在建立集群前应首先指定管理设备,管理设备通过NDP和NTDP协议发现和确定候选设备,将候选设备自动加入集群,也可以通过手工配置将候选设备加入到集群中。
候选设备成功加入集群后,将获得管理设备为它分配的集群成员序列号、集群管理使用的私有IP地址等。
(2) 集群内部通讯
在集群内部,管理设备与成员设备通过握手报文进行实时通信,以维护他们之间的连接状态,管理设备和成员设备的连接状态如图3所示。

图3 集群管理/成员设备状态转换
l 集群建立成功,候选设备加入集群成为成员设备后,管理设备将成员设备的状态信息保存到本地,并将成员状态标识为Active,成员设备也将自身的状态信息保存到本地,并将自身状态标识为Active。
l 管理设备和成员设备互相定时发送握手报文。管理设备收到成员设备的握手报文后,不做应答,将成员设备保持为Active状态;成员设备亦不作应答,将自身状态保持为Active。
l 若管理设备向成员设备发送握手报文后在三倍握手报文发送时间间隔内没有收到成员设备发送的握手报文,则将保存在本地的成员设备的状态由Active迁移为Connect;同样的,若成员设备向管理设备发送握手报文后三倍握手报文发送时间间隔内没有收到管理设备发送的握手报文,其自身状态也将从Active迁移为Connect。
l 若管理设备收到了处于Connect状态的成员设备在有效保留时间内发送的握手报文或管理报文,则将成员设备的状态迁移回Active,否则将其迁移为Disconnect,此时管理设备会认为该成员断开;处于Connect状态的成员设备若在有效保留时间内收到了管理设备发送的握手报文或管理报文,则将自身状态迁移至Active,否则将迁移为Disconnect。
l 当管理设备和成员设备被中断的通信恢复时,处于Disconnect状态的成员设备将重新加入集群,加入成功后,成员设备在管理设备以及本地的状态都将恢复为Active。
如果发现拓扑改变,成员设备也通过握手报文向管理设备传递变化信息。
管理VLAN限制了集群管理的范围,通过配置管理VLAN,可实现如下功能:
l 集群的管理报文(包括NDP、NTDP报文以及握手报文)都将限制在管理VLAN内,与其它报文隔离,增加了安全性。
l 管理设备和成员设备通过管理VLAN实现内部通讯。
集群管理要求管理设备与成员/候选设备相连的端口,包括级联端口(当候选设备是通过另外一台候选设备与管理设备相连时,候选设备之间相互连接的端口叫级联端口)都要允许管理VLAN通过,因此:
l 如果端口不允许管理VLAN通过,则该端口所连接的设备不能加入集群,因此当候选设备与管理设备相连的端口包括级联端口不允许管理VLAN通过时,可通过管理VLAN自协商修改候选设备的端口允许管理VLAN通过。
l 只有当管理设备与成员/候选设备相连接的端口以及级联端口的缺省VLAN ID都是管理VLAN时,才允许配置管理VLAN的报文不带标签通过,否则管理VLAN的报文都必须带标签通过。
集群管理技术介绍.pdf(180.38 KB)