
文章目录Ceph 参数调优重构相关备注Ceph 中与“重构/恢复/回填/重平衡”相关的参数表。我只用了Ceph 官方文档可明确核实到的内容拿不准或官方没有统一建议值的地方我留空。另外要注意不同版本Pacific / Quincy / Reef / 最新版默认值可能有差异下面优先采用当前官方文档可查到的默认值。( Ceph 文档)Ceph 参数调优重构相关参数说明执行修改组件参数说明参数含义默认值建议值修改说明恢复 / 回填osdosd_max_backfills单个 OSD 允许并发进行的 backfill 数量入向/出向分别生效1调大可加快回填但会明显增加对业务 IO 的影响官方说明该值在启用 mClock 调度器时会被自动重置。(Ceph 文档)恢复 / 回填osdosd_recovery_max_active单个 OSD 同时处理的 active recovery 请求数0该值为 0 时实际使用介质类型对应的osd_recovery_max_active_hdd或osd_recovery_max_active_ssd启用 mClock 时会被自动重置。(Ceph 文档)恢复 / 回填osdosd_recovery_max_active_hddHDD OSD 的并发 recovery 请求数3适用于机械盘调大可缩短恢复时间但会抬高业务时延启用 mClock 时会被自动重置。(Ceph 文档)恢复 / 回填osdosd_recovery_max_active_ssdSSD OSD 的并发 recovery 请求数10适用于 SSD/NVMe官方明确该值在 mClock 启用时会被自动重置。(Ceph 文档)恢复 / 回填osdosd_recovery_sleep每次 recovery/backfill 操作之间的休眠时间秒0.0调大后恢复更慢但对前台业务影响更小官方说明启用 mClock 时该参数被忽略。(Ceph 文档)恢复 / 回填osdosd_recovery_sleep_hddHDD 场景下 recovery/backfill 的休眠时间秒0.1主要用于机械盘限速启用 mClock 时该参数被忽略。(Ceph 文档)恢复 / 回填osdosd_recovery_sleep_ssdSSD 场景下 recovery/backfill 的休眠时间秒0.0SSD 默认不额外 sleep启用 mClock 时该参数被忽略。(Ceph 文档)恢复 / 回填osdosd_recovery_sleep_hybrid数据在 HDD、WAL/DB 在 SSD 的混合场景 recovery/backfill 休眠时间秒0.025混合盘场景限速参数启用 mClock 时该参数被忽略。(Ceph 文档)恢复 / 回填osdosd_recovery_op_priorityrecovery 操作优先级3值越高越偏向恢复值越低越偏向客户端 IO。若池级别设置了recovery_op_priority则可覆盖默认行为。(Ceph 文档)业务 / 恢复优先级osdosd_client_op_priority客户端操作优先级63官方默认“显著偏向客户端 IO”通常与osd_recovery_op_priority一起看。(Ceph 文档)恢复期负载控制osdosd_scrub_during_recovery是否允许在恢复期间启动新的 scrub / deep-scrubfalse设为false时恢复期间不再调度新的 scrub可降低集群忙时负载已开始的 scrub 会继续执行。(Ceph 文档)自动重平衡mgrbalancer mode自动平衡模式upmap当前官方文档说明默认模式为upmap新集群默认启用 balancer 模块。旧客户端兼容性不足时不能直接使用upmap。(Ceph 文档)自动重平衡mgrtarget_max_misplaced_ratio单轮自动平衡允许迁移的 PG 最大比例5%官方文档明确默认值为 5%示例中演示可改为 3%但未给出统一推荐值。该值越大平衡收敛越快但对业务影响可能更大。(Ceph 文档)自动重平衡mgrmgr/balancer/upmap_max_deviation认为“已经足够平衡”时允许的 PG 偏差51官方文档说明默认值为 5对于多设备类型或OSD 容量差异较大的集群1是“reasonable and safe for most clusters”的值。(Ceph 文档)自动重平衡mgrmgr/balancer/sleep_intervalbalancer 两轮运行之间的休眠秒数官方文档给出了配置方式但在该页未明确写出默认值因此留空。(Ceph 文档)mClock 相关osdosd_mclock_override_recovery_settings是否允许用传统 recovery/backfill 参数覆盖 mClock 的限制false官方说明启用后可让osd_recovery_max_active_hdd、osd_recovery_max_active_ssd、osd_max_backfills等参数对 mClock 生效。(Ceph 文档)备注你图里的表是“参数说明 / 执行修改组件 / 参数名 / 参数说明 / 默认值 / 建议值 / 修改说明”这种结构我这里按同样逻辑做了文字版。严格来说Ceph 里“重构”一般会落到几类动作recovery恢复、backfill回填、rebalance / balancer重平衡。上表把这三类最常用、最能影响恢复速度与业务影响面的参数放在一起了。相关行为和 balancer 默认模式、upmap 兼容性官方文档都有明确说明。(Ceph 文档)很关键的一点如果集群启用了 mClock 调度器不少传统恢复参数会被自动重置或忽略例如osd_max_backfills、osd_recovery_max_active_*、osd_recovery_sleep*等所以实际调参前要先确认调度器模式。(Ceph 文档)你要的话我可以下一步直接把这份内容整理成一版更像你截图那种可直接粘进 Word/Excel 的表格格式。