云硬盘服务异常导致虚拟机无法删除场景分析

在虚拟机删除的操作当中,时长会有一些异常出现,比如nova-compute服务卡主,libvirtd中断等,当然也有可能还有其它的一些依赖服务出现问题,导致本来不是主机服务异常却引起无法删除虚拟机的场景出现,下面就是一个云硬盘服务的异常触发的问题

首先,虚拟机执行删除操作

lihui@MacBook  ~/server/source_txt  nova show 83e35fec-6da8-[......]

Read more

Nova-compute定时任务解析

每个计算节点都有一个nova-compute进程服务,而nova-scheduler在调度的时候会根据所有计算节点的资源信息来进行filter,因此每个计算节点资源信息的正确性必须得到保证,所以提供了一个定时任务,来通过Hypervisor获取相关信息,持续地更新到数据库当中,周期性地保障信息准确性

我这里OpenStack的版本是havana版,可能比较老,有兴趣可以对照最新版

在nova/no[……]

Read more

OpenStack虚拟机迁移调度Ceph Pool影响

今天在并发migrate的时候,由于一批节点是新上nova-compute服务还处于disable状态,而且迁移必须会更换新节点,导致迁移到一些没有空余资源的节点上出现了ERROR,因此也没太放心上,但是结束之后,随后对一台云主机进行了resize操作,正常返回,但是没有任何修改规格的动作引起了我的注意,因此仔细研究了一下

首先直接调用nova接口进行修改规格

$ nova resize f72[......]

Read more

OpenStack计算资源创建异常日志定位

在云计算虚拟机创建过程中时常会出现异常或者创建失败,而这显然不能跟一般的普通应用软件一样看执行结果,因为往往涉及到很多不同的项目组,而且数量十分庞大,因此会每一个操作都会通过详细的日志记录下来,方便定位各种异常,OpenStack就做到了这一点

比如现在使用方想看看几天前有一个虚拟机出错,但是虚拟机已经删掉了,现在需要知道错误原因,通过日志也是可以查的

用户A:

1:虚拟机已删了

2:租户为7bb[……]

Read more

云主机异常信息显示

虽然有超售比例这个概念来提高资源的利用率,但庞大的用户群里以及对云主机的疯狂使用,使得创建云主机失败依旧是出现频率最高的问题,在此当中资源配额不足是主要原因,包括宿主机节点物理资源,网络资源等,而它们又分别包括了cpu,ram,ecu,port等,假如只知道状态为ERROR,然后一项一项去检查哪一项导致创建失败,显然影响使用者的效率,同时也增加了定位错误的成本,因此异常状态信息的显示优化是十分必要[……]

Read more