集群状态

  • ceph-dashboard

集群整体状态

PG状态

  • DashBoard中PG的状态有4种:Clean、Working、Warning、Unknown。它们是一种抽象的状态,如Scrubbing状态中的PG,就会被归类为Working中。所以有处于非Clean状态的PG,不一定是坏事。
  • 正常的PG状态是 100%的active + clean, 这表示所有的PG是可访问的,所有副本都对全部PG都可用。
状态 描述
Creating 创建中
Peering PG正在互联过程中,正在同步态。PG正在执行同步处理。类似Raft的Leader选举,使一个PG内的OSD达成一致,不涉及数据迁移等操作
Peered PG已互联,但是不能向客户端提供服务,因为其副本数没达到本存储池的配置值( min_size 参数)。在此状态下恢复会进行,所以此PG最终能达到 min_size
Activating PG已经互联,但是还没有active
Active 活跃态,PG可以正常处理来自客户端的读写请求
Unactive 非活跃态,PG不能处理读写请求
Clean 干净态,PG内所有的对象都被正确的复制了对应的份数。
Unclean 非干净态,PG不能从上一个失败中恢复
Recovering 正在恢复态,集群正在执行迁移或同步对象和他们的副本
Remapped PG被临时分配到了和CRUSH所指定的不同的OSD上
Backfilling Ceph正常扫描并同步整个PG的数据,而不是从最近的操作日志中推断需要同步的数据,Backfill(回填)是恢复的一个特殊状态。
Scrubbing Ceph 正在检查PG metadata的一致性。
Deep Ceph 正在检查PG数据和checksums的一致性。
Repair Ceph正在检查PG并且修复所有发现的不一致情况(如果有的话)
Degraded PG中的一些对象还没有被复制到规定的份数
Undersized 该PG的副本数量小于存储池所配置的副本数量。PG当前Acting Set小于存储池副本数。ceph默认3副本,min_size参数通常为2,即副本数>=2时就可以进行IO,否则阻塞IO
Down 一个包含必备数据的副本离线,所以PG也离线了

相关文档