集群升级常见问题

举报
金哲 发表于 2023/02/06 15:00:07 2023/02/06
【摘要】 在集群升级过程中积累了一些案例,整理出来供大家参考:涉及升级前准备,包分发案例,升级案例,升级后扩容和检查,案例也会不断的进行更新
  1. 升级前准备
    1. updateInstanceTask FAIL

  2. 包分发案例
    1. updateInstanceTask FAIL

      1. 【升级前检查规避】【8.1.0.3->8.1.0.101 8.1.1.1->8.1.1.5 8.1.1.2->8.1.1.5】 节点超20个并发高触发swift性能瓶颈

      2. 【升级前检查规避】【8.1.0.3->8.1.0.101 8.0.1.100->8.1.1.202】 rds_soft_info 缺少插件信息

      3. 【升级前检查规避】【8.1.1.1->8.1.1.5】日志中报错获取token失败

      4. 【过程中】【8.1.0.3->8.1.0.101】stop haagent failed while upgrade haagent

      5. 【升级前检查规避】【所有swift局点】节点到Swiftadapter域名不通

      6. 【升级前检查规避】【8.1.0.101->8.1.1.5】裸机中调起ech0网卡

      7. 【过程中】【ALL】包分发时有某个节点露分发时后台手动分发

  3. 升级案例
    1. 【过程中】【8.1.1.5->8.1.2】 UpdateFinalizeTask FAIL

    2. 【过程中】【8.1.0.101->8.1.1.5】 updatePreinstallTask FAIL

    3. 【升级前检查规避】【8.1.0.3->8.1.0.101】 updatePreinstall FAIL cannot remove /lib/enum/_pycache "Permission dened"

  4. 升级后规避预案
    1. 【BMS ARM<8.1.1.300】Networkmonitor导致系统重启,节点主备切换

    2. 【<8.1.3】network disable导致业务卡没挂上,集群不可用

  5. 升级后检查
    1. 【升级后检查】【ALL】检查agent版本

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。