Nova
- Nova架构
- 实例管理
- 调整实例大小
- cloud-init初始化
- 主机聚合
- 迁移实例
- 配置文件
- 配置控制台
- 配置VNC控制台
- SPICE 控制台
- 串行控制台
- 常见报错
- 主机未找到
OpenStack 的 Nova 组件是 OpenStack 云平台中的 计算服务(Compute Service),主要负责管理虚拟机实例的生命周期,包括实例的创建、调度、启动、停止、销毁等。Nova 是 OpenStack 中核心组件之一,它提供了云环境中的计算资源,允许用户在虚拟机中运行应用和服务
Nova 的主要功能
- 虚拟机管理:Nova 提供了对虚拟机的创建、启动、停止、暂停、恢复、销毁等操作的控制。
- 调度和资源分配:Nova 通过调度器根据资源可用性和用户需求,将虚拟机实例调度到合适的物理主机上。这涉及到资源的分配和优化,确保计算资源得到高效利用。
- 多种虚拟化支持:Nova 支持多种虚拟化技术,包括 KVM、Xen、VMware 和 LXD 等。它允许用户在不同的虚拟化平台上创建虚拟机。
- 扩展性:Nova 是高度模块化和可扩展的,可以支持大规模的虚拟机管理,并且能够适应各种硬件配置。
- 与其他组件的集成:Nova 与 OpenStack 中的其他组件(如 Keystone、Neutron、Glance、Cinder 等)紧密集成,提供完整的云服务。比如,Nova 会通过 Glance 获取镜像文件,使用 Cinder 提供的存储来挂载磁盘,使用 Neutron 提供的网络服务为虚拟机分配网络。
Nova架构
nova子服务与其他组件之间的架构图如下:
-
nova-api
作用:
提供 RESTful API 接口,接收用户的虚拟机创建、删除等请求。
解析请求并将指令传递给其他组件。 -
nova-scheduler
作用:
根据调度算法选择最合适的计算节点(Compute Node)来运行虚拟机。
评估资源使用情况并优化资源分配 -
nova-conductor
作用:
作为数据库的中间代理,避免计算节点直接访问数据库。
处理复杂的数据库操作和对象状态同步。 -
nova-compute
作用:
运行在每个计算节点上,实际负责创建、管理和销毁虚拟机实例。
控制虚拟化技术(如 KVM、QEMU)和云平台资源。
nova的子服务之间都是通过RabbitMQ进行通信,且nova-conductor、nova-scheduler、nova-api都可与数据库进行直接通信,而nova-compute则需要通过nova-conductor作为数据库中间代理
虚拟机管理程序
OpenStack Compute 支持许多虚拟机管理程序,默认是使用KVM,也是原生支持最好的,支持以下是openstack的支持的虚拟机管理程序:
-
KVM - 基于内核的虚拟机。它支持的虚拟磁盘格式继承自 QEMU,因为它使用经过修改的 QEMU 程序来启动虚拟机。支持的格式包括原始图像、qcow2 和 VMware 格式。
-
LXC ——Linux 容器(通过 libvirt),用于运行基于 Linux 的虚拟机。
-
QEMU——快速模拟器,一般仅用于开发目的。
-
VMware vSphere 5.1.0 及更新版本 - 通过与 vCenter 服务器的连接运行基于 VMware 的 Linux 和 Windows 映像。
-
Virtuozzo 7.0.0 及更新版本 - 支持 OS 容器和基于内核的虚拟机。支持的格式包括 ploop 和 qcow2 图像。
-
zVM - 在 z Systems 和 IBM LinuxONE 上进行服务器虚拟化,它可以运行 Linux、z/OS 等。
-
Ironic - 提供裸机(而非虚拟)的 OpenStack 项目。
Nova 通过 virt 驱动程序支持虚拟机管理程序。virt 驱动程序中具有以下内容:
compute_driver=libvirt.LibvirtDriver#该驱动程序在 Linux 上运行并支持多个虚拟机管理程序后端,可通过nova.conf文件libvirt.virt_type配置选项进行配置。compute_driver=ironic.IronicDrivercompute_driver=vmwareapi.VMwareVCDrivercompute_driver=zvm.ZVMDrivercompute_driver=fake.FakeDriver
实例管理
平台环境:Ubuntu2404;C版
创建实例需要准备好实例类型、镜像以及网络子网,其中镜像可以有多种格式,例如ISO,raw,qcow2等,使用qcow2格式是最为灵活的。
root@controller:~# openstack image list
+--------------------------------------+--------+--------+
| ID | Name | Status |
+--------------------------------------+--------+--------+
| 010f396c-6cec-4348-a99d-227f87adf30b | cirros | active |
+--------------------------------------+--------+--------+
root@controller:~# openstack network list
+--------------------------------------+------+--------------------------------------+
| ID | Name | Subnets |
+--------------------------------------+------+--------------------------------------+
| be171fc7-8b6d-438f-b03a-3c1b2a75c68f | int | 04fe7fef-574c-4165-ae5c-e072253a12f4 |
+--------------------------------------+------+--------------------------------------+
root@controller:~# openstack flavor list
+--------------------------------------+------+------+------+-----------+-------+-----------+
| ID | Name | RAM | Disk | Ephemeral | VCPUs | Is Public |
+--------------------------------------+------+------+------+-----------+-------+-----------+
| 1c144f2b-e3e3-4d89-9218-b8c071326928 | test | 1024 | 1 | 0 | 1 | True |
+--------------------------------------+------+------+------+-----------+-------+-----------+
启动一个cirros测试镜像,创建的实例存储于/var/lib/nova/instances/
openstack server create --image cirros --network int --flavor test cirros
创建出来的实例可以通过KVM管理工具进行查看
root@compute:~# virsh list --allId Name State
-----------------------------------7 instance-0000000c running
tail -f /var/log/nova/nova-compute.log
日志如下:包含了实例创建所需要的镜像、网络、资源分配等
2024-12-30 06:45:28.244 382621 INFO nova.compute.claims [None req-371da9c6-525b-489a-a578-a9a55d63b112 cb2cba23a7c1446fa424a49a494ed20d 627a106dda814f3a9f3791e611f16cad - - default default] [instance: c9bc9a8f-28b8-4cf5-895a-69e7fadfbe4d] Claim successful on node controller
Nova compute服务对实例ID c9bc9a8f-28b8-4cf5-895a-69e7fadfbe4d进行资源声明,确认控制节点上有足够的资源可以创建实例2024-12-30 06:45:28.394 382621 INFO nova.virt.libvirt.driver [None req-371da9c6-525b-489a-a578-a9a55d63b112 cb2cba23a7c1446fa424a49a494ed20d 627a106dda814f3a9f3791e611f16cad - - default default] [instance: c9bc9a8f-28b8-4cf5-895a-69e7fadfbe4d] Ignoring supplied device name: /dev/vda. Libvirt can't honour user-supplied dev names
2024-12-30 06:45:28.458 382621 INFO nova.virt.libvirt.driver [None req-371da9c6-525b-489a-a578-a9a55d63b112 cb2cba23a7c1446fa424a49a494ed20d 627a106dda814f3a9f3791e611f16cad - - default default] [instance: c9bc9a8f-28b8-4cf5-895a-69e7fadfbe4d] Creating image(s)
libvirt驱动忽略了用户指定的设备名/dev/vda,开始创建实例所需的镜像文件2024-12-30 06:45:28.960 382621 INFO oslo.privsep.daemon [None req-371da9c6-525b-489a-a578-a9a55d63b112 cb2cba23a7c1446fa424a49a494ed20d 627a106dda814f3a9f3791e611f16cad - - default default] Running privsep helper: ['sudo', 'nova-rootwrap', '/etc/nova/rootwrap.conf', 'privsep-helper', '--config-file', '/etc/nova/nova.conf', '--config-file', '/etc/nova/nova-compute.conf', '--privsep_context', 'nova.privsep.sys_admin_pctxt', '--privsep_sock_path', '/tmp/tmpqq_cn0jc/privsep.sock']
2024-12-30 06:45:29.856 382621 INFO oslo.privsep.daemon [None req-371da9c6-525b-489a-a578-a9a55d63b112 cb2cba23a7c1446fa424a49a494ed20d 627a106dda814f3a9f3791e611f16cad - - default default] Spawned new privsep daemon via rootwrap
2024-12-30 06:45:29.718 456471 INFO oslo.privsep.daemon [-] privsep daemon starting
2024-12-30 06:45:29.722 456471 INFO oslo.privsep.daemon [-] privsep process running with uid/gid: 0/0
2024-12-30 06:45:29.724 456471 INFO oslo.privsep.daemon [-] privsep process running with capabilities (eff/prm/inh): CAP_CHOWN|CAP_DAC_OVERRIDE|CAP_DAC_READ_SEARCH|CAP_FOWNER|CAP_NET_ADMIN|CAP_SYS_ADMIN/CAP_CHOWN|CAP_DAC_OVERRIDE|CAP_DAC_READ_SEARCH|CAP_FOWNER|CAP_NET_ADMIN|CAP_SYS_ADMIN/none
2024-12-30 06:45:29.724 456471 INFO oslo.privsep.daemon [-] privsep daemon running as pid 456471
启动privsep守护进程用于权限提升通过nova-rootwrap执行需要root权限的操作privsep进程以root权限(uid/gid: 0/0)运行,配置了必要的Linux capabilities2024-12-30 06:45:30.315 382621 WARNING nova.virt.libvirt.driver [None req-371da9c6-525b-489a-a578-a9a55d63b112 cb2cba23a7c1446fa424a49a494ed20d 627a106dda814f3a9f3791e611f16cad - - default default] This host appears to have multiple sockets per NUMA node. The `socket` PCI NUMA affinity will not be supported.
2024-12-30 06:45:30.456 382621 INFO oslo.privsep.daemon [None req-371da9c6-525b-489a-a578-a9a55d63b112 cb2cba23a7c1446fa424a49a494ed20d 627a106dda814f3a9f3791e611f16cad - - default default] Running privsep helper: ['sudo', 'nova-rootwrap', '/etc/nova/rootwrap.conf', 'privsep-helper', '--config-file', '/etc/nova/nova.conf', '--config-file', '/etc/nova/nova-compute.conf', '--privsep_context', 'vif_plug_ovs.privsep.vif_plug', '--privsep_sock_path', '/tmp/tmpch69fcsj/privsep.sock']
2024-12-30 06:45:31.129 382621 INFO oslo.privsep.daemon [None req-371da9c6-525b-489a-a578-a9a55d63b112 cb2cba23a7c1446fa424a49a494ed20d 627a106dda814f3a9f3791e611f16cad - - default default] Spawned new privsep daemon via rootwrap
2024-12-30 06:45:31.005 456496 INFO oslo.privsep.daemon [-] privsep daemon starting
2024-12-30 06:45:31.008 456496 INFO oslo.privsep.daemon [-] privsep process running with uid/gid: 0/0
2024-12-30 06:45:31.009 456496 INFO oslo.privsep.daemon [-] privsep process running with capabilities (eff/prm/inh): CAP_DAC_OVERRIDE|CAP_NET_ADMIN/CAP_DAC_OVERRIDE|CAP_NET_ADMIN/none
2024-12-30 06:45:31.009 456496 INFO oslo.privsep.daemon [-] privsep daemon running as pid 456496
2024-12-30 06:45:31.515 382621 INFO os_vif [None req-371da9c6-525b-489a-a578-a9a55d63b112 cb2cba23a7c1446fa424a49a494ed20d 627a106dda814f3a9f3791e611f16cad - - default default] Successfully plugged vif VIFOpenVSwitch(active=False,address=fa:16:3e:96:f3:46,bridge_name='br-int',has_traffic_filtering=True,id=c19e6403-4e4f-4872-96c9-e38b122b1f73,network=Network(be171fc7-8b6d-438f-b03a-3c1b2a75c68f),plugin='ovs',port_profile=VIFPortProfileOpenVSwitch,preserve_on_delete=False,vif_name='tapc19e6403-4e')
启动另一个privsep进程处理网络配置成功配置了Open vSwitch网络:配置虚拟接口VIFOpenVSwitch
MAC地址: fa:16:3e:96:f3:46
桥接到br-int
创建了tap设备tapc19e6403-4e2024-12-30 06:45:32.892 382621 INFO nova.compute.manager [None req-3e0ed34e-5304-4e17-8e5b-8c488b044c50 - - - - - -] [instance: c9bc9a8f-28b8-4cf5-895a-69e7fadfbe4d] VM Started (Lifecycle Event)
2024-12-30 06:45:32.932 382621 INFO nova.compute.manager [None req-3e0ed34e-5304-4e17-8e5b-8c488b044c50 - - - - - -] [instance: c9bc9a8f-28b8-4cf5-895a-69e7fadfbe4d] VM Paused (Lifecycle Event)
2024-12-30 06:45:32.972 382621 INFO nova.compute.manager [None req-3e0ed34e-5304-4e17-8e5b-8c488b044c50 - - - - - -] [instance: c9bc9a8f-28b8-4cf5-895a-69e7fadfbe4d] During sync_power_state the instance has a pending task (spawning). Skip.
2024-12-30 06:45:34.004 382621 INFO nova.compute.manager [None req-3e0ed34e-5304-4e17-8e5b-8c488b044c50 - - - - - -] [instance: c9bc9a8f-28b8-4cf5-895a-69e7fadfbe4d] VM Resumed (Lifecycle Event)
2024-12-30 06:45:34.011 382621 INFO nova.virt.libvirt.driver [-] [instance: c9bc9a8f-28b8-4cf5-895a-69e7fadfbe4d] Instance spawned successfully.
VM Started: 虚拟机开始启动
VM Paused: 虚拟机暂停(这是正常的启动过程)
VM Resumed: 虚拟机恢复运行2024-12-30 06:45:34.056 382621 INFO nova.compute.manager [None req-3e0ed34e-5304-4e17-8e5b-8c488b044c50 - - - - - -] [instance: c9bc9a8f-28b8-4cf5-895a-69e7fadfbe4d] During sync_power_state the instance has a pending task (spawning). Skip.
2024-12-30 06:45:34.067 382621 INFO nova.compute.manager [None req-371da9c6-525b-489a-a578-a9a55d63b112 cb2cba23a7c1446fa424a49a494ed20d 627a106dda814f3a9f3791e611f16cad - - default default] [instance: c9bc9a8f-28b8-4cf5-895a-69e7fadfbe4d] Took 5.61 seconds to spawn the instance on the hypervisor.
2024-12-30 06:45:34.128 382621 INFO nova.compute.manager [None req-371da9c6-525b-489a-a578-a9a55d63b112 cb2cba23a7c1446fa424a49a494ed20d 627a106dda814f3a9f3791e611f16cad - - default default] [instance: c9bc9a8f-28b8-4cf5-895a-69e7fadfbe4d] Took 5.90 seconds to build instance.
实例成功在hypervisor上创建完成
整个创建过程耗时统计:
在hypervisor上部署耗时: 5.61秒
总构建时间: 5.90秒
可以在web界面对该实例的生命周期进行操作:创建、删除、修改等等基础操作
调整实例大小
其中调整实例大小需要进行单独配置,界面的其他操作可以正常使用
vi /etc/nova/nova.conf
[DEFAULT]
# 允许调整实例规格
allow_resize = True
# 是否允许在同一主机上调整大小
allow_resize_to_same_host = True
# 设置调整大小的超时时间(秒)
resize_confirm_window = 3600
然后重启nova组件,界面即可调整实例大小
实例类型由test变为test2
cloud-init初始化
可以通过cloud-init编写一个脚本,用于完成创建镜像的初始化操作
vi cloud-config.yml
初始化实例的root用户密码
#cloud-config# 修改root密码
chpasswd:list: |root: huhyexpire: false# 完成后通知
final_message: "The system is finally up, after $UPTIME seconds"
创建实例:使用centos镜像,笔记本可能带不动,需要服务器资源
openstack server create --image centos --network inside-net --flavor centos --user-data cloud-config.yml centos-test
控制台信息如下:
注:这里我是因为忽略了密码前面有个空格,所有尝试了半天没进去,所有设置时最好加个引号
配置示例(centos)
#cloud-config
# 设置主机名
hostname: my-custom-server
fqdn: my-custom-server.example.com# 设置时区
timezone: Asia/Shanghai# 用户和密码设置
users:- name: adminsudo: ALL=(ALL) NOPASSWD:ALLgroups: sudoshell: /bin/bashpasswd: $6$rounds=4096$randomsalt$hashedpasswordlock_passwd: falsessh_authorized_keys:- ssh-rsa AAAAB... your-public-key# 修改root密码
chpasswd:list: |root:your-new-passwordexpire: false# 系统包更新和安装
package_update: true
package_upgrade: true
packages:- vim- curl- wget- net-tools- htop# 创建目录
write_files:- path: /etc/sysctl.d/99-custom.confcontent: |net.ipv4.ip_forward = 1net.ipv4.conf.all.rp_filter = 0owner: root:rootpermissions: '0644'# 运行命令
runcmd:- systemctl stop firewalld- systemctl disable firewalld- setenforce 0- sed -i 's/SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config- echo "nameserver 8.8.8.8" >> /etc/resolv.conf# 配置SSH
ssh_pwauth: true
disable_root: false# 配置YUM源
yum_repos:epel:baseurl: http://download.fedoraproject.org/pub/epel/$releasever/$basearch/enabled: truegpgcheck: truegpgkey: https://dl.fedoraproject.org/pub/epel/RPM-GPG-KEY-EPEL-$releasever# 网络配置
write_files:- path: /etc/sysconfig/network-scripts/ifcfg-eth0content: |TYPE=EthernetBOOTPROTO=staticNAME=eth0DEVICE=eth0ONBOOT=yesIPADDR=192.168.1.100NETMASK=255.255.255.0GATEWAY=192.168.1.1owner: root:rootpermissions: '0644'# 添加定时任务
write_files:- path: /var/spool/cron/rootcontent: |0 * * * * /usr/bin/ntpdate pool.ntp.orgowner: root:rootpermissions: '0600'# 设置系统参数
bootcmd:- echo 1024 > /proc/sys/net/core/somaxconn- echo never > /sys/kernel/mm/transparent_hugepage/enabled# 修改系统限制
write_files:- path: /etc/security/limits.d/custom.confcontent: |* soft nofile 65535* hard nofile 65535owner: root:rootpermissions: '0644'# 自定义脚本
write_files:- path: /root/init.shcontent: |#!/bin/bashecho "System initialization completed at $(date)" >> /root/init.log# 添加自定义初始化操作owner: root:rootpermissions: '0755'runcmd:- /root/init.sh# 完成后通知
final_message: "The system is finally up, after $UPTIME seconds"
主机聚合
主机聚合(Host Aggregate)是 OpenStack 中的一种逻辑分组机制,用于根据特定的属性将计算节点(主机)分组。它提供了一种灵活的方式来管理和组织计算资源,使得云管理员可以更好地控制资源调度和分配。主机聚合通常与元数据(Metadata)配合使用,为虚拟机实例调度提供条件
简单就来就是把某些特殊需求的实例放到对应的主机上,例如这个主机的磁盘读写高,就把需要该特点的实例放到这个主机上
- 界面创建主机聚合,域为test,将controller主机放入该主机聚合
创建实例,并将可用域指定为test
该实例已经调度在test主机聚合上的controller主机
删除主机聚合:点击管理主机,然后移除主机
才能删除成功
- 将主机聚合绑定到实例类型上:这里用命令的方式实现
controller节点配置调度程序以支持主机
vi /etc/nova/nova.conf
[filter_scheduler]
enabled_filters=AggregateInstanceExtraSpecsFilter
重启nova
bash nova-service-restart.sh
创建主机聚合test2
root@controller:~# openstack aggregate create test2
+-------------------+--------------------------------------+
| Field | Value |
+-------------------+--------------------------------------+
| availability_zone | None |
| created_at | 2025-01-02T09:03:30.513896 |
| deleted_at | None |
| hosts | None |
| id | 2 |
| is_deleted | False |
| name | test2 |
| properties | None |
| updated_at | None |
| uuid | 1f528965-e512-4095-9fff-6c9759cd28ca |
+-------------------+--------------------------------------+
将节点添加到主机聚合中:
root@controller:~# openstack aggregate add host test2 controller
+-------------------+----------------------------+
| Field | Value |
+-------------------+----------------------------+
| availability_zone | None |
| created_at | 2025-01-02T09:03:30.000000 |
| deleted_at | None |
| hosts | controller |
| id | 2 |
| is_deleted | False |
| name | test2 |
| properties | |
| updated_at | None |
| uuid | None |
+-------------------+----------------------------+
为主机聚合设置元数据,这是关键步骤:
openstack aggregate set --property ssd=true test2
修改实例类型,添加相应的元数据:
root@controller:~# openstack flavor list
+--------------------------------------+------+------+------+-----------+-------+-----------+
| ID | Name | RAM | Disk | Ephemeral | VCPUs | Is Public |
+--------------------------------------+------+------+------+-----------+-------+-----------+
| 1c144f2b-e3e3-4d89-9218-b8c071326928 | test | 1024 | 1 | 0 | 1 | True |
+--------------------------------------+------+------+------+-----------+-------+-----------+
root@controller:~# openstack flavor set --property aggregate_instance_extra_specs:ssd=true test
界面查看
创建两台实例并绑定到该实例类型
openstack server create --image cirros --network int --flavor test cirros-test
openstack server create --image cirros --network int --flavor test cirros-test2
界面查看到两台实例都放在了controller节点上
迁移实例
非实时迁移(冷迁移)是指虚拟机关机状态下,将其从一台主机迁移到另一台主机的操作。与实时迁移(Live Migration)不同,冷迁移不会尝试在虚拟机运行时保持服务的连续性
查看实例id和当前存储位置
root@controller:~# openstack server list
+--------------------------------------+-------------+--------+---------------+--------+--------+
| ID | Name | Status | Networks | Image | Flavor |
+--------------------------------------+-------------+--------+---------------+--------+--------+
| 37c09d21-cabb-4c60-98e5-bc64a5415a7c | cirros-test | ACTIVE | int=10.0.0.43 | cirros | test |
+--------------------------------------+-------------+--------+---------------+--------+--------+
root@compute:~# ll /var/lib/nova/instances/
total 24
drwxr-x--x 5 nova nova 4096 Dec 31 08:16 ./
drwxr-x--- 10 nova nova 4096 Dec 31 06:20 ../
drwxr-x--x 2 nova nova 4096 Dec 31 08:16 37c09d21-cabb-4c60-98e5-bc64a5415a7c/
drwxr-x--x 2 nova nova 4096 Dec 31 08:16 _base/
-rw-r----- 1 nova nova 31 Dec 31 08:24 compute_nodes
drwxr-x--x 2 nova nova 4096 Dec 31 08:16 locks/
将实例关机,然后把实例从计算节点传到控制节点
scp -r /var/lib/nova/instances/37c09d21-cabb-4c60-98e5-bc64a5415a7c/ controller:/var/lib/nova/instances/
修改目录用户为nova
root@controller:~# chown -R nova:nova /var/lib/nova/instances/37c09d21-cabb-4c60-98e5-bc64a5415a7c/
root@controller:~# ll /var/lib/nova/instances/
total 24
drwxr-x--x 5 nova nova 4096 Dec 31 08:48 ./
drwxr-x--- 10 nova nova 4096 Dec 4 07:09 ../
drwxr-x--x 2 nova nova 4096 Dec 31 08:48 37c09d21-cabb-4c60-98e5-bc64a5415a7c/
drwxr-x--x 2 nova nova 4096 Dec 31 05:55 _base/
-rw-r----- 1 nova nova 33 Dec 31 08:23 compute_nodes
drwxr-x--x 2 nova nova 4096 Dec 31 05:55 locks/
在完成 test 虚拟机目录的迁移后,此时去启动虚拟机会报错,因为在数据库中记录了该实例的宿主机名字,需要进入数据库,修改这一字段才能完成实例的迁移。
- 注意替换的主机名,节点名称以及实例id
mysql -uroot -p000000
use nova;
update instances set host='controller', node='controller' where uuid='37c09d21-cabb-4c60-98e5-bc64a5415a7c';
重启nova所有服务
bash nova-service-restart.sh
界面重启实例
实时迁移(热迁移)是指在虚拟化环境中,将一个正在运行的虚拟机(VM)从一台物理主机迁移到另一台物理主机的过程,无需中断虚拟机的运行或影响其服务的正常提供。这通常用于维护、负载均衡、硬件升级等场景。
!由于版本较新,bug较多还未成功
实时迁移可以根据处理实例存储的方式进一步分类:
-
基于共享存储的实时迁移。实例具有临时磁盘,这些磁盘位于源主机和目标主机之间共享的存储上。
-
阻止实时迁移,或简称为阻止迁移。实例具有不在源主机和目标主机之间共享的临时磁盘。阻止迁移与只读设备(如 CD-ROM 和配置驱动器 (config_drive))不兼容。
-
卷支持的实时迁移。实例使用卷而不是临时磁盘。
所有计算节点配置
vim /etc/libvirt/libvirtd.conf
listen_addr 对应该节点IP
listen_tls = 0
listen_tcp = 1
tcp_port = "16509"
listen_addr = "192.168.200.160"
auth_tcp = "none"
vim /etc/default/libvirtd
添加
LIBVIRTD_ARGS="--listen"
重启
systemctl mask libvirtd.socket libvirtd-ro.socket libvirtd-admin.socket libvirtd-tls.socket libvirtd-tcp.socket
systemctl restart libvirtd.service
验证测试
root@controller:~# virsh -c qemu+tcp://compute/system
Welcome to virsh, the virtualization interactive terminal.Type: 'help' for help with commands'quit' to quitvirsh #
root@compute:~# virsh -c qemu+tcp://controller/system
Welcome to virsh, the virtualization interactive terminal.Type: 'help' for help with commands'quit' to quitvirsh #
修改源代码,取消CPU验证,避免出现以下报错
Migration pre-check error: Unacceptable CPU info: CPU doesn't have compatibility. 0 Refer to
http://libvirt.org/html/libvirt-libvirt-host.html#virCPUCompareResult (HTTP 400) (Request-ID: req-aea319ad-ab01-4498-a729-b517b745f7b3)
vim /usr/lib/python3/dist-packages/nova/virt/libvirt/driver.py
编辑控制台监听所有节点,因为该地址在实例迁移时会发生变化
vi /etc/nova/nova.conf
[vnc]
server_listen = 0.0.0.0
所有计算节点注释对应代码
9984 if disk_over_commit:9985 disk_available_gb = dst_compute_info['free_disk_gb']9986 else:9987 disk_available_gb = dst_compute_info['disk_available_least']9988 disk_available_mb = (9989 (disk_available_gb * units.Ki) - CONF.reserved_host_disk_mb)99909991 #if not CONF.workarounds.skip_cpu_compare_on_dest:9992 # # Compare CPU9993 # try:9994 # if not instance.vcpu_model or not instance.vcpu_model.model:9995 # source_cpu_info = src_compute_info['cpu_info']9996 # self._compare_cpu(None, source_cpu_info, instance)9997 # else:9998 # self._compare_cpu(instance.vcpu_model, None, instance)9999 # except exception.InvalidCPUInfo as e:
10000 # raise exception.MigrationPreCheckError(reason=e)
10001
10002 # Create file on storage, to be checked on source host
10003 filename = self._create_shared_storage_test_file(instance)
重启nova-compute服务
systemctl restart nova-compute.service
配置所有计算节点免密和主机映射
配置共享存储,以NFS为例,这里用一台计算节点充当共享存储服务器
apt install -y nfs-server
vi /etc/exports
星号允许任何 NFS 客户端访问。该选项fsid=0将实例目录导出为 NFS 根目录
/var/lib/nova/instances *(rw,sync,fsid=0,no_root_squash)
exportfs -r
systemctl start nfs-server
root@compute:~# showmount -e 192.168.200.161
Export list for 192.168.200.161:
/var/lib/nova/instances *
在所有计算节点挂载 NFS 存储: 在每个计算节点上安装 NFS 客户端:
apt install nfs-common -y
两台节点挂载共享目录:
root@compute:~# mount -t nfs 192.168.200.161:/var/lib/nova/instances /var/lib/nova/instances
root@compute:~# df -Th
Filesystem Type Size Used Avail Use% Mounted on
tmpfs tmpfs 387M 1.7M 386M 1% /run
/dev/mapper/ubuntu--vg-ubuntu--lv ext4 48G 7.3G 39G 17% /
tmpfs tmpfs 1.9G 0 1.9G 0% /dev/shm
tmpfs tmpfs 5.0M 0 5.0M 0% /run/lock
tmpfs tmpfs 1.9G 0 1.9G 0% /run/qemu
/dev/sda2 ext4 2.0G 95M 1.7G 6% /boot
tmpfs tmpfs 387M 16K 387M 1% /run/user/0
192.168.200.161:/var/lib/nova/instances nfs 48G 7.3G 39G 17% /var/lib/nova/instances
root@controller:~# mount -t nfs 192.168.200.161:/var/lib/nova/instances /var/lib/nova/instances
root@controller:~# df -Th
Filesystem Type Size Used Avail Use% Mounted on
tmpfs tmpfs 387M 1.8M 386M 1% /run
/dev/mapper/ubuntu--vg-ubuntu--lv ext4 48G 8.1G 38G 18% /
tmpfs tmpfs 1.9G 8.0K 1.9G 1% /dev/shm
tmpfs tmpfs 5.0M 0 5.0M 0% /run/lock
tmpfs tmpfs 1.9G 0 1.9G 0% /run/qemu
/dev/sda2 ext4 2.0G 95M 1.7G 6% /boot
tmpfs tmpfs 387M 16K 387M 1% /run/user/0
192.168.200.161:/var/lib/nova/instances nfs 48G 7.3G 39G 17% /var/lib/nova/instances
如果挂载后instances目录用户组被修改,需要改成nova
chown -R nova:nova /var/lib/nova/instances/
启用 live migration:
vi /etc/nova/nova.conf
[DEFAULT]
instances_path = /var/lib/nova/instances
[libvirt]
live_migration_downtime = 500
live_migration_downtime_steps = 10
live_migration_downtime_delay = 75
live_migration_completion_timeout = 800
live_migration_progress_timeout = 1500
cpu_mode=host-passthrough
live_migration_permit_post_copy = True
live_migration_flag=VIR_MIGRATE_UNDEFINE_SOURCE,VIR_MIGRATE_PEER2PEER,VIR_MIGRATE_LIVE,VIR_MIGRATE_TUNNELLED
block_migration_flag=VIR_MIGRATE_UNDEFINE_SOURCE,VIR_MIGRATE_PEER2PEER,VIR_MIGRATE_LIVE,VIR_MIGRATE_NON_SHARED_INC
实时迁移(VIR_MIGRATE_LIVE)和点对点模式(VIR_MIGRATE_PEER2PEER)
Nova 服务需要通过 SSH 在计算节点之间传输数据。因此还需要配置各计算节点之间的 SSH 免密登录
systemctl restart nova-compute.service
编辑网络的policy.yaml,避免报错
nova.exception.MigrationError: Migration error: rule:create_port_binding is disallowed by policy
Neutron server returns request_ids: ['req-b97a1c33-7189-408d-bd1e-681209639e92']
vim /etc/neutron/policy.yaml
添加以下规则
{"update_port": "","update_port:binding:profile": "","delete_port_binding": "","create_port_binding": ""
}
重启neutron服务
systemctl restart neutron-server
但最后还是卡在报错,暂未解决
Live Migration failure: unsupported configuration: Target CPU feature count 40 does not match source 109:
libvirt.libvirtError: unsupported configuration: Target CPU feature count 40 does not match source 109
通过快照迁移实例:将实例通过保存为快报后,下载为本地镜像,再次导入到其他openstack节点上进行使用
将实例保存为快照
将该快照通过命令下载保存
root@controller:~# openstack image list
+--------------------------------------+-----------------+--------+
| ID | Name | Status |
+--------------------------------------+-----------------+--------+
| 010f396c-6cec-4348-a99d-227f87adf30b | cirros | active |
| 30dd3458-d851-4f9c-b164-c469e11d6d2a | cirros-snapshot | active |
+--------------------------------------+-----------------+--------+
root@controller:~# openstack image save --file cirros-snapshot.qcow2 30dd3458-d851-4f9c-b164-c469e11d6d2a
root@controller:~# du -sh cirros-snapshot.qcow2
22M cirros-snapshot.qcow2
进行压缩
root@controller:~# qemu-img convert -O qcow2 -c cirros-snapshot.qcow2 cirros-snapshotv2.qcow2
root@controller:~# du -sh cirros-snapsho*
22M cirros-snapshot.qcow2
13M cirros-snapshotv2.qcow2
该镜像cirros-snapshotv2.qcow2即可提供给其他openstack平台进行使用
配置文件
nova的主要配置文件为:/etc/nova/nova.conf,官网配置说明
vi /etc/nova/nova.conf
#将实例等待事件的最大时间调整为600
vif_plugging_timeout=600#remove_unused_base_images用于开启自动清理镜像缓存。
#remove_unused_original_minimum_age_seconds也是为了缩短测试时间,默认是超过247个消失的无用base镜像才会被删除。
#image_cache_manager_interval是为了缩短测试时间才需要设置,默认40分钟才检查一次
remove_unused_base_images=True
remove_unused_original_minimum_age_seconds=3
image_cache_manager_interval=5#平台若意外断电,在电力系统恢复后,OpenStack平台的实例可以自启动
resume_guests_state_on_host_boot=true#host-model,libvirt 会请求与主机最匹配的指定 CPU 型号,尽量模拟源主机的 CPU 特性。适用于目标主机 CPU 与源主机 CPU 类型相似的情况。
#host-passthrough,libvirt 会告诉 KVM 不做任何修改就直接通过主机 CPU。直接将宿主机的 CPU 特性透传到虚拟机。适用于目标主机和源主机完全一致的情况。
#none,libvirt 不会指定 CPU 型号
cpu_mode=host-model
配置控制台
OpenStack 提供了多种与客户机交互的方法:VNC、SPICE、Serial、RDP 或 MKS,最佳做法是仅部署一种控制台类型,并非所有计算驱动程序都支持所有控制台类型。无论选择哪种选项,都需要控制台代理服务。这些代理服务负责以下事项:
- 在客户端所在的公共网络和带有控制台的服务器所在的私有网络之间提供桥梁。
- 中介令牌认证。
- 透明地处理特定于虚拟机管理程序的连接详细信息,以提供统一的客户端体验
VNC控制台
- 优点:
兼容性最好,使用最广泛
配置简单,文档丰富
支持多种客户端
几乎所有hypervisor都支持 - 缺点:
性能相对较差
图形处理能力有限
高分辨率下可能出现延迟
功能相对基础
SPICE控制台
- 优点:
性能优于VNC
支持多显示器
提供USB重定向
双向音频支持
视频播放流畅度好
支持客户端硬件加速 - 缺点:
配置相对复杂
需要专门的客户端支持
资源消耗较大
只支持KVM hypervisor
串行控制台
- 优点:
资源消耗最少
稳定性最好
适合故障排查
支持纯文本模式
可通过SSH访问
适合自动化操作 - 缺点:
只支持文本界面
不支持图形界面
配置要求较高
用户体验相对较差
需要实例操作系统支持
配置VNC控制台
官网默认推荐使用VNC控制台
vi /etc/nova/nova.conf
其中novncproxy_base_url为控制节点IP,server_proxyclient_address取决于当前节点IP
[vnc]
enabled = True
server_listen = 0.0.0.0
server_proxyclient_address = 192.168.200.160
novncproxy_base_url = http://192.168.200.160:6080/vnc_auto.html
重启nova服务
systemctl restart nova-compute
界面查看
并且Z版后支持一些额外的小功能
SPICE 控制台
VNC 协议相当有限,不支持多显示器、双向音频、可靠的剪切粘贴、视频流等。SPICE 是一种新协议,旨在解决 VNC 的局限性并提供良好的远程桌面支持。
OpenStack Compute 中的 SPICE 支持与 VNC 实现具有类似的架构。OpenStack 仪表板在其控制台选项卡中使用 SPICE-HTML5 小部件,该小部件通过使用 SPICE-over-websockets与nova-spicehtml5proxy服务进行通信。nova -spicehtml5proxy服务通过使用 SPICE 直接与虚拟机管理程序进程进行通信。
安装软件包
apt install -y spice-html5 nova-spiceproxy
将VNC选项下的参数注释,配置spice
[DEFAULT]
vnc_enabled = False
novnc_enabled = False[spice]
enabled = True
html5proxy_base_url = http://192.168.200.160:6082/spice_auto.html
server_listen = 0.0.0.0
server_proxyclient_address = 192.168.200.160
html5proxy_host = 0.0.0.0
html5proxy_port = 6082
agent_enabled = True
keymap = en-us
重启nova-compute服务
systemctl restart nova-compute
界面打开实例控制台
串行控制台
要启用串行控制台服务,必须同时配置 nova-serialproxy服务和nova-compute服务
apt install -y nova-serialproxy
注意需要注释并关闭SPICE控制台相关配置
vi /etc/nova/nova.conf
[serial_console]
serialproxy_host = 0.0.0.0
serialproxy_port = 6083
enabled = True
base_url = ws://192.168.200.160:6083/
proxyclient_address = 192.168.200.160
port_range = 10000:20000
重启nova服务
systemctl restart nova-compute
界面查看
常见报错
主机未找到
2025-01-02 09:15:57.504 360892 WARNING nova.scheduler.utils [None req-ffd0da64-79d1-4443-9fce-22061ceab584
cb2cba23a7c1446fa424a49a494ed20d 627a106dda814f3a9f3791e611f16cad - - default default] [instance: 3a4f16ab-381d-4049-
8fbd-58e1af6e396b] Setting instance to ERROR state.: nova.exception.HostMappingNotFound: Host 'compute' is not mapped to
any cell
首先检查当前的 cell 映射:
nova-manage cell_v2 list_cells
检查主机映射:
nova-manage cell_v2 list_hosts
如果发现 compute 节点未映射,需要执行主机发现:
nova-manage cell_v2 discover_hosts --verbose
如果上述命令不能解决问题,可以手动创建主机映射:
获取 cell1 的 UUID:
nova-manage cell_v2 list_cells | grep cell1 | awk '{print $4}'
手动添加主机映射:
nova-manage cell_v2 map_instances --cell_uuid <cell1_uuid>
nova-manage cell_v2 map_cell_and_hosts