ceph osd pg 状态介绍

news/2025/1/11 10:12:30/

导读:
1.从零部署一个ceph集群
2.ceph block device与cephfs快速入门
3.ceph 对象存储快速入门
4.Ceph存储集群&配置
5.centos7 通过cephadm部署ceph octopus版本
6.ceph集群状态检查常用命令

OSD in/out 、up/down

OSD状态应处于集群内(in)、集群外(out),并且处于运行(up)或关闭(down)。如果OSD处于up,他可能位于集群中(可以读写数据),也可能不在集群中。如果OSD原本在集群中但是最近被移除了集群,ceph会将整个PG移动到其他OSD中。如果OSD不在集群中,则CRUSH不会将PG分配给OSD。
在这里插入图片描述

PG状态

OSD存储PG,PG包含对象。集群的整体监控状态主要取决于PG。只有所有PG的状态都是active+clean状态时,集群才会保持为HEALTH_OK状态。如果ceph集群不是健康状态,很有可能PG不是active+clean。下面介绍下PG的多种状态

  • creating:创建pool时,它将创建指定的pg的数量。 当Ceph创建一个或多个PG时,它将fillback创建。 创建OSD之后,属于PG"Acting Set"的OSD将会对等(peer)。 对等完成后,展示PG状态应为active+clean,这意味着Ceph客户端可以开始写入PG。

    在这里插入图片描述

  • peering:在peering状态下,OSD的PG都在acting集合中,存储PG的副本,并保持PG中的对象和元数据状态一致。在peering操作完成后,存储PG的所有OSD都彼此确认当前状态。

  • active:在peering操作完成后,Ceph将PG状态置为active。处在active状态,说明PG及其副本中的数据都处于能够提供I/O操作的状态。

  • clean:在clean状态下,主OSD和副本OSD已经成功彼此确认,所有PG都处在正确的位置上,没有发生偏移,而且所有对象都复制好正确的副本数。

  • degraded:当客户端将PG对象写入主OSD时,主OSD负责将副本写入副本OSD。在主OSD将对象写入存储后,PG将保持degraded状态,直到主OSD从副本OSD收到确认Ceph成功创建副本对象的确认为止。

    PG可以处于active+degraded的原因是:即使OSD尚未容纳所有对象,也可能处于active状态,如果OSD出现故障down掉了,ceph将会标记分配给OSD的每一个PG为degraded。当OSD重新恢复后,OSD会再次完成peer操作。即使PG处于degraded状态,客户端依然可以执行I/O操作。

    如果OSD down并且degraded状态持续存在,ceph可能会将down的OSD标记为不在集群内,并将数据映射到另一个OSD中。标记down的时间默认为600s,可以由mon osd down out interval控制。

    PG也可能degraded,因为ceph找不到认为应该在PG中的一个或多个对象,虽然无法读取或写入未找到的对象,但仍可以访问处于degraded PG中的其他对象。

  • recovering:ceph专为容错能力而设计。当OSD发生故障时,其存储的内容可能会与其他OSD上副本的数据不一致。当OSD恢复up状态,ceph会针对这些PG启动恢复操作,使得它们的数据与其他OSD上的PG副本保持一致。

  • back filling:当新的OSD加入集群后,CRUSH将把PG从集群中的OSD重新分配给新添加的OSD来平衡数据。这个过程称之为back filling。一旦PG的backfilling 操作完成,OSD可以参与到客户端的I/O操作中。

    在backfilling操作期间,可能会看到如下状态:

    • backfill_wait:backfill操作处于挂起状态,还未执行。
    • backfill_toofull:已请求backfill操作,由于存储容量不足无法完成。
  • remapped:每当OSD的 acting 集合有变化,就会触发数据迁移,数据从老的 acting 集合OSD向新的 acting 集合OSD转移。在迁移操作期间,依然由旧的 acting 集合主副本OSD为客户端提供服务。迁移完成后,使用新的 acting 集合主OSD为客户端提供服务。

  • stale:ceph通过heartbeat机制来确保主机与daemon处于运行状态,当ceph-osd daemon处于卡顿状态,从而无法积极反应统计结果。默认情况下osd daemon每隔0.5秒向ceph mon报告统计信息。如果某个PG的acting集合的主副本OSD没有成功向mon报告统计结果,或者其他OSD报告它们的主OSD状态变为down,mon会考虑将这些PG标记为stale状态。

可以通过如下命令查看PG状态。

[root@ceph-admin ~]# ceph pg stat
INFO:cephadm:Inferring fsid 23db6d22-b1ce-11ea-b263-1e00940000dc
INFO:cephadm:Using recent ceph image ceph/ceph:v15
105 pgs: 105 active+clean; 5.3 KiB data, 71 MiB used, 297 GiB / 300 GiB availx pgs: y active+clean; z bytes data, aa MB used, bb GB / cc GB avail
pg的总数(x),处于特定状态(例如,active+clean(y))和已存储的数据量(z)的特定状态下有多少个放置组。
已使用的存储容量(aa),剩余存储容量(bb)和该pg的总存储容量(cc)。


http://www.ppmy.cn/news/494989.html

相关文章

海思OSD

目前我要在3518E上面做个OSD,叠加时间上去,主要的开发有两种方式: 一种是获取时间字符串,通过第三方库提供的接口将时间字符串转化为bmp格式位图,然后利用SDK中提供的demo直接进行转化 第三方库主要有三个,一下是第三…

音视频OSD完全教程

目录 前言OSD 介绍学习路线图像 字符编码基础知识ASCII点阵字库叠加信息相关操作GB2312点阵字库UNICODE UTF-8矢量字库 前言 感谢海康高级工程师宇哥和安霸高级工程师杰哥对我的无私帮助 现有的博客内容都是抄来抄去,不成体系 希望我整理的内容能够对行业有所帮助…

MiniOSD DIY记

最近迷上了航模,研究了很多东西,感觉路走的长了还是适当要停下脚步休息下总结下。 这次DIY的是一块OSD设备,主要用于航模图传的叠加显示,原理也很简单就是atmel atmega328pMAX7456芯片,网上卖的成品基本上都是一个原理…

ceph 删除 osd

# ceph --version ceph version 12.2.13 luminous (stable)# ceph osd tree 0 hdd 7.27739 osd.0 up 1.00000 1.00000# ceph osd out 0 marked out osd.0. # ceph osd tree0 hdd 7.27739 osd.0 up 0 1.00000等待数据迁移 # ceph -w…

OSD实现原理介绍

OSD的主要实现方法和类型 目前有两种主要的OSD实现方法:外部OSD发生器与视频处理器间的叠加合成;视频处理器内部 支持OSD,直接在视频缓存内部叠加OSD信息。 外部OSD发生器与视频处理器间的叠加合成的实现原理是:由一个MCU内建的字…

QT 视频窗口 OSD 使用详解

QT 视频窗口 OSD 效果展示 悬浮 FormSensorPannel 设置 在构造函数中 1》//设置 Qt::FramelessWindowHint|Qt::Tool Qt::Tool 表示小部件是一个工具窗口。 工具窗口通常是一个小窗口,具有比通常的标题栏和装饰更小的窗口,通常用于工具按钮的集合。 如…

ceph osd学习小结

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 ceph osd学习小结 前言一、osd是什么?二、osd的特点 二、osd的状态查看三、osd的故障与修复 前言 ceph是一种后端文件存储集群。相对于hdfs等传统文件系统&#…

对象存储osd以及存储分类

一、三种存储 首先我们来看一看什么是对象存储?目前,独立的存储形态有三种:块存储、文件存储,以及新出现的对象存储。块存储我们简单的理解就是一块一块的硬盘,直接挂载在主机上,在主机上我们能够看到的就…