【愚公系列】软考高级-架构设计师 105-设 计 、 测 试 、 评 价

举报
愚公搬代码 发表于 2024/08/31 09:22:43 2024/08/31
【摘要】 🏆 作者简介,愚公搬代码🏆《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专家等。🏆《近期荣誉》:2022年度博客之星TOP2,2023年度博客之星TOP2,2022年华为云十佳博主,2023年华为云十佳博主...

🏆 作者简介,愚公搬代码
🏆《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专家等。
🏆《近期荣誉》:2022年度博客之星TOP2,2023年度博客之星TOP2,2022年华为云十佳博主,2023年华为云十佳博主等。
🏆《博客内容》:.NET、Java、Python、Go、Node、前端、IOS、Android、鸿蒙、Linux、物联网、网络安全、大数据、人工智能、U3D游戏、小程序等相关领域知识。
🏆🎉欢迎 👍点赞✍评论⭐收藏

🚀前言

设计、测试和评价在软件开发过程中扮演着至关重要的角色,它们相互交织,共同确保软件的质量、可靠性和用户体验。

🚀一、设 计

🔎1.提高系统可靠性的技术

提高系统可靠性的技术可以分为避错(排错)技术和容错技术。

🦋1.1 避错技术

避错技术是通过多种手段在系统正式运行之前避免、发现和改正错误。主要方法包括:

  • 技术评审:通过专家评审,识别和修正设计中的问题。
  • 系统测试:在不同阶段进行详细的测试,发现并修正错误。
  • 正确性证明:使用数学方法和工具,证明系统的正确性。

🦋1.2 容错技术

容错技术是指系统在运行过程中发生一定的硬件故障或软件错误时,仍能保持正常工作而不影响正确结果的一种性能或措施。其核心思想是通过冗余来消除故障的影响。

🦋1.3 软件容错方法

冗余技术

冗余是指在正常系统运行所需的基础上加上一定数量的资源,包括信息、时间、硬件和软件。冗余是容错技术的基础,通过冗余资源的加入,可以使系统的可靠性得到较大的提高。主要的冗余技术有:

  1. 结构冗余:

    • 静态冗余:在系统设计中预先配置额外的硬件或软件资源。
    • 动态冗余:在运行过程中动态分配冗余资源。
    • 混合冗余:结合静态和动态冗余的优点,提供更高的可靠性。
  2. 信息冗余:

    • 通过增加冗余信息(如校验码、错误检测码)来检测和纠正错误。
  3. 时间冗余:

    • 通过重复执行操作或延长处理时间来确保正确性。
  4. 冗余附加:

    • 在设计中增加冗余功能模块,以备故障时使用。

软件容错的主要方法是提供足够的冗余信息和算法程序,使系统在实际运行时能够及时发现程序设计错误并采取补救措施,以提高系统可靠性,保证整个系统的正常运行。

🔎2.软件容错技术

🦋2.1 N版本程序设计

N版本程序设计的思想是用N个具有相同功能的程序同时执行一项计算,并通过多数表决来选择正确的结果。其关键要点包括:

  • 独立设计:N个版本的程序必须由不同的人独立设计,使用不同的方法、设计语言、开发环境和工具来实现。
  • 减少相关错误:通过独立设计,减少N个版本的程序在表决点上出现相关错误的概率。

在这里插入图片描述

🦋2.2 恢复块设计(动态冗余)

恢复块设计也称为动态冗余或主动冗余,其目标是通过故障检测、故障定位及故障恢复等手段实现容错。其主要思路包括:

  • 多重模块待机储备:系统中预备多个模块,当检测到某工作模块出现错误时,用一个备用模块替代并重新运行。
    • 热备份系统(双重系统):备用模块在待机时与主模块一样工作。
    • 冷备份系统(双工系统、双份系统):备用模块在待机时不工作,只有在需要时才激活。

在这里插入图片描述

🦋2.3 防卫式程序设计

防卫式程序设计是一种不采用传统容错技术的实现软件容错的方法,其基本思想是通过在程序中包含错误检查代码和错误恢复代码,确保程序在发生错误时能够撤销错误状态并恢复到一个已知的正确状态。其实现策略包括:

  • 错误检测:在程序中加入代码以检测可能的错误。
  • 破坏估计:评估错误对程序的影响。
  • 错误恢复:一旦发生错误,程序能够撤销错误状态并恢复到正确状态。

🔎3.双机容错技术

双机容错技术是一种结合了软硬件的容错应用方案,通常由两台服务器和一个外接共享磁盘阵列以及相应的双机软件组成。其主要特点和工作模式如下:

  • 心跳机制

    • 双机容错系统采用“心跳”方法来保证主系统和备用系统之间的联系。
    • 心跳是指主从系统之间按照一定的时间间隔发送通信信号,以表明各自的运行状态。
    • 一旦心跳信号表明主系统发生故障,或者备用系统无法收到主系统的心跳信号,高可用性管理软件会认为主系统故障,从而立即将系统资源转移到备用系统,确保系统正常运行和网络服务不间断。
  • 工作模式

    • 双机热备模式:备用系统在待机时与主系统一样工作,一旦主系统出现故障,备用系统立即接管。
    • 双机互备模式:两台系统互为备份,彼此监控对方的状态,一旦一方故障,另一方接管其任务。
    • 双机双工模式:两台系统同时工作,互为备份,能同时处理任务,提供更高的性能和容错能力。

🔎4.集群技术

集群技术将多台计算机组织起来进行协同工作,以提高系统的可用性和可靠性。其主要特点和分类如下:

  • 特点

    • 可伸缩性:系统可以根据负载需求进行扩展。
    • 高可用性:系统通过冗余和故障转移机制保证高可用性。
    • 可管理性:集群系统提供集中管理和监控工具,简化系统管理。
    • 高性价比:通过使用多台普通计算机实现高性能和高可用性,降低成本。
    • 高透明性:集群系统对用户透明,用户感觉不到系统内部的复杂性。
  • 分类

    • 高性能计算集群(HPC):主要用于科学计算和数据处理,多个计算节点协同工作以提高计算能力。
    • 负载均衡集群:通过将任务分配到不同的服务器上来达到负载均衡,适用于Web服务器、数据库服务器等应用。
    • 高可用性集群:通过冗余和故障转移机制确保系统的高可用性,适用于关键业务系统和服务。

🔎5.负载均衡

负载均衡是集群系统中的一项重要技术,主要用于提高集群系统的整体处理能力和系统可靠性,最终目的是加快集群系统的响应速度,提高客户端访问的成功概率。集群的最大特征是多个节点的并行和共同工作,因此,如何让所有节点承受的负荷平均,不出现局部过大负载或过轻负载的情况,是负载均衡的重要目的。

🦋5.1 常用的负载均衡实现技术

  1. 基于特定软件的负载均衡(应用层)

    • 原理:使用网络协议中的重定向功能,例如基于HTTP重定向服务。
    • 实现:服务器使用HTTP重定向指令,将客户端请求重新定位到另一个服务器位置。服务器返回一个重定向响应,客户端确认新地址后重发请求,从而实现负载均衡。
  2. 基于DNS的负载均衡(传输层)

    • 原理:在DNS服务器中为同一个主机名配置多个IP地址。
    • 实现:DNS服务器在应答DNS查询时,按照顺序返回不同的IP地址,将客户端的访问引导到不同的节点上,使得不同的客户端访问不同的节点,从而实现负载均衡。
  3. 基于NAT的负载均衡

    • 原理:将一个外部IP地址映射为多个内部IP地址。
    • 实现:对每次连接需求动态地转换为一个内部节点的地址,将外部连接请求引导到转换得到地址的那个节点上,从而实现负载均衡。
  4. 反向代理负载均衡

    • 原理:将来自Internet上的连接请求以反向代理的方式动态地转发给内部网络上的多个节点。
    • 实现:反向代理服务器接收到请求后,根据负载均衡策略选择一个内部节点进行处理,从而实现负载均衡。
  5. 混合型负载均衡

    • 原理和实现:综合使用多种负载均衡技术,结合应用层、传输层和网络层的不同方法,来实现更高效的负载均衡。

🚀二、 测 试 、 评 价

🔎1.软件可靠性测试

软件可靠性测试是为了验证和提升软件系统的可靠性,确保其在预期的操作环境中能够稳定运行。该过程由以下主要活动组成:确定可靠性目标、开发运行剖面、设计测试用例、实施测试、以及分析测试结果。

测试步骤

  1. 定义软件运行剖面

    • 目的:为软件的使用行为建模,准确反映软件在实际使用中的操作情况。
  2. 设计可靠性测试用例

    • 步骤:基于定义的运行剖面,设计具体的测试用例,确保覆盖所有预期的使用场景。
  3. 实施可靠性测试

    • 执行:按照设计的测试用例进行实际操作,记录软件在测试过程中出现的各种失效情况。

🔎2.软件可靠性评价过程

  1. 选择可靠性模型

    • 考虑因素
      • 模型假设的适用性
      • 预测的能力与质量
      • 模型输出值能否满足可靠性评价需求
      • 模型使用的简便性
  2. 收集可靠性数据

    • 数据类型:主要是软件失效数据。
    • 数据收集阶段:在软件测试和实施阶段收集。
    • 解决方法
      • 及早确定所采用的可靠性模型
      • 制订可实施性较强的可靠性数据收集计划
      • 重视软件测试数据的整理和分析
      • 充分利用数据库完成可靠性数据的存储和统计分析
  3. 可靠性评估和预测

    • 评估目标:判断是否达到了可靠性目标,如果未达到,需要评估再投入多少资源;预测软件在实际运行一段时间后(如一年)能否达到预期的可靠性水平。
    • 辅助方法
      • 失效数据的图形分析法
      • 试探性数据分析技术

🚀感谢:给读者的一封信

亲爱的读者,

我在这篇文章中投入了大量的心血和时间,希望为您提供有价值的内容。这篇文章包含了深入的研究和个人经验,我相信这些信息对您非常有帮助。

如果您觉得这篇文章对您有所帮助,我诚恳地请求您考虑赞赏1元钱的支持。这个金额不会对您的财务状况造成负担,但它会对我继续创作高质量的内容产生积极的影响。

我之所以写这篇文章,是因为我热爱分享有用的知识和见解。您的支持将帮助我继续这个使命,也鼓励我花更多的时间和精力创作更多有价值的内容。

如果您愿意支持我的创作,请扫描下面二维码,您的支持将不胜感激。同时,如果您有任何反馈或建议,也欢迎与我分享。

在这里插入图片描述

再次感谢您的阅读和支持!

最诚挚的问候, “愚公搬代码”

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。