自适应网站怎么做m站湖北省建设工程教育协会网站

张小明 2026/3/13 4:10:51
自适应网站怎么做m站,湖北省建设工程教育协会网站,临沂百度代理公司有几个,上海弄网站的文章目录概述1. 背景#xff1a;主副本同时 Unassigned#xff0c;reroute 依然失败2. 问题表现#xff1a;Too many open files 触发系统级崩溃文件句柄耗尽 → ES 无法打开 segment 文件进一步导致#xff1a;3. ES 分片恢复的底层机制#xff1a;stale primary vs empt…文章目录概述1. 背景主副本同时 Unassignedreroute 依然失败2. 问题表现Too many open files 触发系统级崩溃文件句柄耗尽 → ES 无法打开 segment 文件进一步导致3. ES 分片恢复的底层机制stale primary vs empty primary3.1 allocate_stale_primary3.2 allocate_empty_primary4. 工程化恢复流程从系统修复到分片恢复Step 0修复系统文件句柄限制关键Step 1冻结集群分片分配避免自动迁移Step 2检查磁盘上的 shard 目录Step 3查看 allocation explainStep 4根据策略表为每个分片执行 stale 或 empty 恢复Step 5恢复自动分片分配Step 6等待 replica 自动重建5. 逐分片恢复策略表逐分片恢复策略表6. 策略表:按图索骥7. 恢复后的校验、压测与加固建议7.1 校验数据一致性7.2 强制段合并可选7.3 集群压测7.4 加固措施8. 结语灾难恢复能力是搜索系统的核心韧性概述现代业务系统对 ElasticSearch简称 ES 的依赖已经到了深水区一旦集群分片出现主副本同时 unassigned的情况往往意味着搜索、查询、分析、写入全面瘫痪。本周某客户现场线上ES集群部分索引健康状态red接下来来看看我是如何在磁盘上仍存在数据文件的情况下使用 ElasticSearch 的底层能力进行分片级数据恢复。1. 背景主副本同时 Unassignedreroute 依然失败某生产 ES 集群中RED状态的5个核心业务索引均采用5 个 Primary shard1 个 Replica shard(其中两个索引5个shard都未分配 三个索引有1个shard未分配)一次系统级事件导致 ES 节点出现大量too manyopenfiles系统文件句柄被用尽影响包括ES 无法打开 segment 文件无法读取 shard metadata无法加载 translog无法验证安全性 → 导致分片 unassigned事后虽然尝试了 reroute 但仍然失败显示分片不可分配。 然而 ——磁盘上的 shard 数据目录依然存在。这类情况非常典型ES 认为分片不安全但物理数据其实还在可恢复。要想救回数据就需要走“磁盘级恢复”路线。2. 问题表现Too many open files 触发系统级崩溃too many open files看似常见却会直接影响 ES 的核心文件句柄耗尽 → ES 无法打开 segment 文件segment 是 Lucene 的基本存储单位一旦无法被打开metadata 校验失败CRC 校验失败ES 无法确认 shard 是否一致自动恢复与 reroute 都会失败进一步导致primary → unassignedreplica → unassignedallocation explain 显示无法恢复分片数据“存在但不可用”所有问题最终汇聚为一句话ES 会拒绝恢复那些无法被安全验证的分片即使它们在磁盘上。这时工程师必须介入进行手动分片级恢复。3. ES 分片恢复的底层机制stale primary vs empty primaryElasticSearch 通过_cluster/reroute提供两种分片恢复方式3.1 allocate_stale_primaryallocate_stale_primary:使用磁盘上的旧分片恢复 primary可能回滚数据场景shard 目录存在segment 完整ES 标记为 stale陈旧但可用紧急情况下允许数据回滚这是真正的“从磁盘恢复”。3.2 allocate_empty_primaryallocate_empty_primary:清空该分片建立一个全新的 primary数据不可恢复场景shard 目录不存在数据损坏无法读取必须保证索引继续可用只要磁盘数据存在且可读永远优先 stale。empty 是最后一步等同于“放弃治疗”。4. 工程化恢复流程从系统修复到分片恢复Step 0修复系统文件句柄限制关键设置/etc/security/limits.conf * soft nofile 65536 * hard nofile 65536systemd[Service]LimitNOFILE65536当前ES进程的使用情况curl-XGETlocalhost:9200/_cat/nodes?vhname,file_desc.current,file_desc.percent,file_desc.max以上请检查确保可用的fd数量尽量保持50%的余量。 线上65536 当前使用率40%左右。 较为安全。可进行下一步。Step 1冻结集群分片分配避免自动迁移PUT _cluster/settings{transient:{cluster.routing.allocation.enable:none}}实际操作并没有执行这一步不过建议考虑Step 2检查磁盘上的 shard 目录路径/xxxxx/elasticsearch/nodes/0/indices/index_uuid/shard_id需要看到_state/index/*.cfs*.si多个节点的话早一个数据最大的 可能意味着更新。Step 3查看 allocation explainGET _cluster/allocation/explain?pretty特别关注stored_shard:stale意味着可恢复。Step 4根据策略表为每个分片执行 stale 或 empty 恢复示例POST _cluster/reroute{commands:[{allocate_stale_primary:{index:index_name,#需要恢复的所以明shard:2,node:node-1,#(集群的节点名称 elasticsearch.yml里配置的也可以用node的id)accept_data_loss:true}}]}如果有多个循环往复多次执行查看状态。 亲测可用。校验GET _cat/shards?v GETindex/_count GETindex/_search?size10Step 5恢复自动分片分配PUT _cluster/settings{transient:{cluster.routing.allocation.enable:all}}配合step 1Step 6等待 replica 自动重建重建期间 ES 负载较高请保持稳定。5. 逐分片恢复策略表这张表用于决定每个 shard 是用allocate_stale_primary从磁盘恢复allocate_empty_primary重建空分片核心判定规则只要 shard 目录存在且 segment 文件完好 → 使用 stale。仅当目录不存在或损坏 → 使用 empty。逐分片恢复策略表Shard目录存在segment 完整allocation explain恢复方式说明0✔/✘✔/✘stale/empty/unknownstale/empty——1✔/✘✔/✘stale/empty/unknownstale/empty——2✔/✘✔/✘stale/empty/unknownstale/empty——3✔/✘✔/✘stale/empty/unknownstale/empty——4✔/✘✔/✘stale/empty/unknownstale/empty——6. 策略表:按图索骥Shard目录存在segment 完整allocation explain恢复方式说明0✔✔staleallocate_stale_primary可恢复1✔✔staleallocate_stale_primary可恢复2✔✔staleallocate_stale_primary可恢复3✔✔staleallocate_stale_primary可恢复4✔✔staleallocate_stale_primary可恢复如果某个分片目录损坏比如 shard 3Shard恢复方式0stale1stale2stale3empty4stale7. 恢复后的校验、压测与加固建议恢复不是结束以下操作决定能否彻底恢复正常业务。7.1 校验数据一致性count 对比随机文档抽查业务侧搜索验证7.2 强制段合并可选提升健康度POSTindex/_forcemerge?max_num_segments17.3 集群压测使用 rally 或 jmeter 构建写入/查询压力测试。7.4 加固措施提升系统 nofile设置 JVM heap 与 memlock配置 shard allocation awareness增加 replica如果业务要求高可用8. 结语灾难恢复能力是搜索系统的核心韧性ElasticSearch 虽然强大但恢复机制背后的设计哲学始终明确ES 宁可拒绝恢复也不会冒险使用可能损坏的数据。因此工程师必须掌握磁盘级恢复与 stale 分片重建的技术。分片恢复原理allocate_stale_primary 与 allocate_empty_primary 的判定逻辑逐分片恢复策略表完整恢复手册都可以作为你的 ES 灾难恢复知识库的重要组成部分。真正的韧性不是避免灾难而是在灾难发生后仍能恢复如常。
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

建设网站公司哪儿济南兴田德润有活动吗平台建设网站

浙大疏锦行 方差筛选 是最基础的过滤法:计算特征的方差,剔除方差极低的特征(这类特征数值变化小,对样本区分度弱)。优点是计算极快,缺点是只看特征自身,不考虑和目标的关联。 皮尔逊相关系数筛…

张小明 2026/3/10 16:51:43 网站建设

电子商务网站设计毕业设计论文天津移动网站建设

往期热门文章:1、Spring 项目别再乱注入 Service 了!用 Lambda 封装个统一调用组件,爽到飞起 2、再见Maven!官方推出全新一代Java项目构建工具,性能提升2~10倍 3、程序员的伪年薪百万还能持续多久? 4、索引…

张小明 2026/3/10 16:51:45 网站建设

域名进行网站备案吗系列图标设计网站推荐

健康档案管理终极指南:如何高效下载和使用体检报告 【免费下载链接】资源下载-体检报告 这是一份详细的体检报告PDF文件,记录了2101年2021年153016号的健康检查结果,涵盖了常规体检项目的各项数据。用户可下载并查看报告,用于个人…

张小明 2026/3/10 16:51:47 网站建设

wap微信网站模板安卓系统最好优化软件

第一章:VSCode 量子开发的插件集成在现代量子计算开发中,Visual Studio Code(VSCode)已成为主流集成开发环境之一。其强大的扩展生态系统支持开发者通过插件无缝接入量子编程框架,如Qiskit、Cirq和Microsoft Quantum D…

张小明 2026/3/10 16:51:55 网站建设

成都网站开发哪个好青岛做网站企业排名

在各行各业都在追求降本增效与精细化运营的背景下,企业对于资产可视化与高效利用的需求正持续增长,无论是工厂中的关键设备、仓库中的周转物料,还是医院里的高价器械,管理者都希望能随时掌握资产的位置、状态与流转情况&#xff1…

张小明 2026/3/10 16:56:49 网站建设

网站建设实训个人备案网站管理系统

一、项目介绍 木材缺陷检测是木材加工和质量控制中的关键环节,传统人工检测方法效率低且易受主观因素影响。本文基于深度学习技术,提出一种基于YOLOv11的木材缺陷检测系统,能够高效识别裂纹(Crack)、死节(…

张小明 2026/3/10 16:56:50 网站建设