摘要:一套vSphere环境断电,物理硬件全部恢复后发现vCenter没有自动开机,排查后发现所有主机的上某个LUN都处于非活动(已卸载)状态。
登陆所有ESXi,在数据存储中可以看到此LUN为非活动状态,但是查看此LUN的路径全部是活动的(同存储上其他LUN在主机上均可以正常挂载使用,登陆存储未看到异常报警),重新扫描所有无法解决此问题,通过vSphere Client 选中此LUN执行挂载操作会报未知错误。
按照此KB2004605,可以通过esxcli命令行去查看存储卷相关的详细信息。
esxcli storage filesystem list
可以看到vmware02这个卷未挂载,类型未知。
使用下列命令手动执行挂载,报告有Lock,详细看VMkernel日志
~# esxcli storage filesystem mount -u57889c95-a7569072-ec6e-0025b500001a
Sysinfoerror on operation returned status : Lock was not free. Please seethe VMkernel log for detailed error information
按照提示查看日志,发现下列行
~ # tail -100 /var/log/vmkernel.log
2017-04-24T02:19:07.224Z cpu2:35389 opID=d5f911f6)WARNING: LVM: 13127: The volume on the device naa.60a980004431577850244463372d6653:1 locked, possibly because some remote host encountered an error during a volume operation and could not recover.
2017-04-24T02:19:07.224Z cpu2:35389 opID=d5f911f6)WARNING: LVM: 4938: If you are _sure_ this is the case, please break the device lock with `vmkfstools -B /vmfs/devices/disks/naa.60a980004431577850244463372d6653:1`
2017-04-24T02:19:07.224Z cpu2:35389 opID=d5f911f6)LVM: 11786: Failed to open device naa.60a980004431577850244463372d6653:1 : Lock was not free
按照日志中的提示,输入下列行来解锁。
~ # vmkfstools -B /vmfs/devices/disks/naa.60a980004431577850244463372d6653:1
VMware ESX Question:
LVM lock on the device naa.60a980004431577850244463372d6653:1 will be forcibly broken. See the vmkfstools or ESX documentation for information on breaking the LVM lock.
Ensure that multiple servers are not accessing this device.
Continue to break lock?
0) _Yes
1) _No
Select a number from 0-1: 0
Successfully broke LVM device lock for /vmfs/devices/disks/naa.60a980004431577850244463372d6653:1
再次通过命令行挂载~# esxcli storage filesystem mount -u57889c95-a7569072-ec6e-0025b500001a
,执行成功没有报错,通过vSphere Client也可以看到主机正常挂载LUN,问题解决。
摘要:在客户现场遇到一个奇怪的问题,华为交换机频繁地报告 MAC 地址抖动,通过交换机日志发现一个全0的MAC地址在两个端口上抖动,而这两个端口分别接同一个集群的两台vSphere主机,网卡为标准虚拟机交换机的uplink。
全为 0 的 MAC 在正常的理解中是不合规的 MAC 地址,但是在交换机上查看mac地址表确实有此mac。但是关联在VLAN 1 下。
dis mac-address table
<Huawei>dis mac address-table
Mac Address Table
-------------------------------------------
Vlan Mac Address Type Ports
---- ----------- -------- -----
1 0000.0000.0000 dynamic G1/1/0/47
OSPF的设计需要满足可靠性和可扩展性,这取决于合理的网络结构和地址规划,通过路由汇总等手段可以大大减少路由设备的开销,在网络稳定性和扩展性上都会有很大优势。
快速收敛也是网络设计很重要的一个原则。
OSPF 的设计可以按照下列思路进行,而每个部分都需要做一定考虑,熟悉其原理就显得很重要了,文章后面是各种相关知识简介,可以帮助设计,避免设计考虑不足。
进行区域的设计,划定区域范围和将要参与的路由器,此处需要同时考虑物理连接结构(例如冗余度很高的数据中心用一个区域、网络复杂的Hub-Spoke区域用一个、网络稳定性不好的分公司用一个区域)
按照区域划分IP地址,前提是保证区域内的地址是连续的可以进行汇总,且有一定的IP余量
末节区域的定义,视情况调整末节区域类型,优化非骨干区域的路由
其他路由协议如何和OSPF网络通信,此处可能牵扯到双向路由重发布,需要注意与末节区域搭配的问题还有环路问题
Router-ID,为了规范需要手动定义Router-ID,建议整体规划环回口地址
DR的选举考虑,Router-ID并不能保证DR选举正常,需要根据网络结构修改OSPF优先级来调整DR选举
OSPF 认证,为保证网络安全需要配置md5认证,防止私接。
Hello 、Dead时间,hello dead时间在某些时候会影响网络收敛速度,可以根据需求缩短此时间。
路由的路径优化,可以使用ip ospf cost命令来调整选路
路由汇总,通过此方式进一步减少域间路由
OSPF 网络类型微调。默认OSPF根据物理接口类型适配OSPF网络类型,但是可能需要手动调整网络类型以便让OSPF环境更加切合实际物理网络。另外有些特殊场合,例如环回口做VPN的接入点时,需要修改环回口的网络类型。
网络扩展能力是否好一般取决于路由器的处理性能:内存、CPU和接口带宽。OSPF 进程资源占用由下列因素决定:
每个区域内的最大路由器:OSPF的算法依赖于CPU,当区域内有频繁的链路变动时,路由重计算工作会很高,由此会产生性能问题。按照经验值一个区域内路由器不能超过50台,如果区域内有很不稳定的链路,则路由器数量越少越好。
摘要:用户为 OSPF 启用了区域认证,在以前只有交换机参与路由的时候,OSPF 邻居都能正常建立,但是加入 NSX Edge 之后,发现 NSX 和交换机的认证配置方法略微“不一样”,这篇文章会介绍下OSPFv2的认证方法并解决上述问题。
现象:在生产环境使用vSphere6.0(u1b及u2)后,出现过至少4次 ESXi 主机从vCenter断开(vCenter上显示主机未响应),这时 ESXi 主机上的虚拟机运行正常,但是无法通过web client以及vSphere client登录主机进行管理,ESXi 的 esxcli 和 ssh 均能正常运行。在使用传统EMC存储以及VSAN时均遇到过此问题。
-上海
BONA 新天地2D-西安
汉神购物广场5F 3D-西安
电脑-延安
中影时代国际影城(旭弘店)-西安