参考文章:VMware灾备与双活、VSAN 延展集群带宽设计、VMware HOL 1627实验手册、Virtual san 6.2 Stretched Cluster。 VSAN ROBO Edition
如果发现文中有错误的部分欢迎留言或者发邮件([email protected])告知,文中关于网络描述较少,对网络部分不懂的也可以留言。
此文章假设读者已有基础VSAN知识或实施经验。 写了一半,感觉完全是在写VSAN考试大纲… 花了两个月时间学习并总结这个文档,期间VSAN项目中也遇到不少问题,学习完这个文档才发现VSAN并没有想象中的那么简单,所以非常建议做VSAN设计的人员能学习下此文章(或原文档),避免规划出现问题。
本文PDF 版本下载链接: 点击下载
此文章遵照原参考文档的目录,着重介绍了存储、存储策略、主机和集群的设计。
Virtual SAN 是一个集成在Hypervisor中,与VMware vsphere高度集成的软件定义存储产品。VSAN 可以将一个vSphere cluster集群中主机上的直连硬盘整合起来,创建出一个分布式共享存储。它使用策略(文中会有策略的详细描述)驱动,简化了存储的置备和管理。
VSAN 当前有两种配置选项,混合配置(hybird)及全闪配置(all-flash);混合配置下一个磁盘组使用一个SSD做读写缓存(容量7/3划分),机械硬盘存储数据。全闪模式下使用寿命高的SSD作为写缓存盘(100%空间用于写缓存,最大只能使用600G空间),使用读性能较好、寿命不高但价格低廉的SSD作为数据存储盘。
解读: 每个VSAN存储对应一个集群,一一对应,一个集群中所有主机都会开启VSAN功能(需要手动配置VSAN网络),一个集群只能有一个VSAN,所有硬盘都在这一个VSAN中,VSAN中的存储不能直接供其他集群直接使用,需要通过创建NAS存储的方式对外提供存储服务。 VSAN 基于 storage policies,通过策略可以定义每个虚机副本数(以此决定主机/硬盘最大故障数),还有资源预留、条带等很多参数设置。
用户的现网中同时存在这三种设备, 华三的SR路由器,华为的AR路由器,思科的39系列路由器和C3560交换机。
之前了解到的是,OSPF有区域认证和接口认证两种,思科是区域开启认证之后,所有接口对应的使用空密码认证,如果接口设置了密码,则优先使用接口的密码进行认证。华为使用类似的方式。按照这个思想,在三种设备上开启了区域认证,结果华为和思科可以建立邻居,华三和这两个都不能建立邻居。
后来查找资料发现华三老软件版本 ospf 认证只能同时配置区域和接口认证(V5不同设备不同版本支持情况不同,很多设备新版本支持了单独的接口认证,可以直接和V7的接口认证对接。V5老版本或者部分设备需要区域和接口都配置,V7两种都配置都可以) 最后所有设备同时开启了区域认证以及接口认证,ospf邻居建立正常,配置如下:
思科:
int g0/0
ip ospf message-digest 1 md5 **password**
router os 110
area 0 authentication message-digest
H3C:
interface GigabitEthernet3/1/0
ospf authentication-mode md5 1 cipher **password**
ospf 110
area 0
authentication-mode md5
Huawei :
interface GigabitEthernet0/0/0
ospf authentication-mode md5 1 cipher **password**
ospf 110
area 0
authentication-mode md5
Veeam 备份是比较灵活的一个备份软件,每个备份文件和备份任务信息都保存在相同的路径,可以方便将任务导入其他backup server,重装veeam也不会影响到之前的备份。
前段时间遇到veeam一个backup repository几乎快满,而里面都是虚拟机的增量文件,按照计划任务还未进行增量文件的合并,如果手动合并会因为存储空间满而任务失败。剩下两种解决办法:增加空间容量或者迁移。我选择了后者。
1、找到对应虚拟机的备份文件夹,文件夹中应该至少包含一个.vbm文件和一个.vkb文件,以及.vib增量文件。
2、将此目录完整复制到目的存储
3、在veeam的 Backup Infrastructure > Backup Repositories 中添加(如果存储库已存在,直接点击rescan)存储库,然后右键选择Rescan repository。
4、更改虚拟机备份任务,在Storage栏中,直接选择新的存储库,点击确定即可。
5、测试运行备份任务,虚拟机增量文件已经备份到新存储。删除原存储的备份文件。
摘要:因为对VSAN环境中主机进行了维护,在主机进入维护模式时未完整迁移上面的所有数据,而是选择了“确保可访问性”。在主机维护完成后发现有台虚拟机的一个组件状态变为: “已过期”,等了很长时间(半小时以上)后VSAN系统也不去自动进行修复。
在网上查找后有人遇到过类似问题,VSAN support团队建议修改对应虚拟机的存储策略,例如将FTT=1修改为FTT=2,或者修改条带宽度,然后重新应用给虚拟机,此问题一般可以解决。 为保证不影响其他虚拟机,我新建了一个存储策略,设置其FTT=2,将其应用给VM后,问题解决。
Controller 在 NSX 中是比较重要的组件,在创建LSW之前必须先建立好Controller集群,建议至少、且最多部署三个Controller,分别运行在不同的主机上。
NSX Controller Cluster失效后,在vCenter Web Client的网络和安全>安装>主机准备>Communication Channel Health 可以看到下列显示: