【云监控-最佳实践】电商平台业务监控
下图为某企业电商平台的业务架构图。电商业务内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。
图1 电商平台业务架构图
由以上架构图可知,ECS为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。
网站为电商平台的入口,双12,618等大型购物节,会导致不同网络用户访问电商网站出现网页打开慢、网络延时高等问题。站点监控可对网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。
针对电商平台使用的RDS、ELB、VPC等服务,可以使用云服务监控,在云服务监控页面实时查看云服务运行状态、各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。
电商业务主要涉及华为云ECS、CDN、AS、安全服务、RDS、ELB、OBS等服务。通过资源分组功能从业务视角查看资源使用情况、告警情况、健康情况,管理告警规则,可以极大的降低运维复杂度,提高运维效率。
站点监控
应用场景
针对大量的静态数据,如产品图片,产品视频等导致不同网络用户访问电商网站出现网页打开慢、网络延时高等问题。可以使用站点监控对网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。
操作步骤
登录管理控制台。
单击“管理与部署 > 云监控”。
单击左侧导航栏的“站点监控”。
在“站点监控”界面,单击右上角“创建站点监控”,进入“创建站点监控”界面。
在弹出的“创建站点监控”对话框中根据界面提示配置参数,如图 1 创建站点监控所示。
图1 创建站点监控
说明:
监控频率建议设置为1分钟,更多参数说明如配置参数所示。
配置完成后,单击“确定”,完成创建站点监控。
创建站点监控完成后,单击站点名称右侧的“更多 > 创建告警规则”,为设置的站点配置告警规则。
在创建告警规则界面,按照界面提示配置参数,参数说明请参见参数说明。
图1 创建告警规则
说明:
响应时间大于400毫秒为缓慢,建议配置成连续出现3次为400毫秒发送告警。
根据界面提示配置名称与描述。配置完成后,单击“创建”,完成创建告警规则。
当网站或ECS的弹性IP出现异常时,站点监控会第一时间通过消息通知服务实时告知资源异常,提醒您处理异常。
主机监控
ECS是电商平台的基础支撑,因此ECS上细微的性能变化,都可能会引起电商业务的大幅震荡,甚至出现宕机,引起巨大损失。
主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为ECS自动上报的监控指标,操作系统监控通过在ECS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。
应用场景
促销、秒杀、爆款等电商业务场景,瞬间访问量达到平常的几十至数百倍,会导致服务器负载高,系统响应慢。
您可以对ECS的监控指标配置告警规则,比如CPU使用率,当CPU使用率达到配置的阈值时发送告警通知,及时处理异常。
前提条件
已安装Agent插件,具体安装步骤请参见安装配置Agent。
操作步骤
登录管理控制台。
在管理控制台左上角单击图标,选择区域和项目。
单击“管理与部署 > 云监控”。
单击页面左侧的“主机监控”,进入主机监控页面。
单击ECS主机所在栏右侧的“更多”按钮,选择下拉出的“创建告警规则”。
在“创建告警规则”界面,根据界面提示配置参数。
监控对象为当前的ECS,无需配置。
选择监控指标,选择“自定义创建”,参照配置参数说明完成参数配置。
图1 创建告警规则
说明:
以CPU使用率为例,由于需要给服务器预留部分处理性能保障服务器正常运行,所以建议将CPU告警阈值设置为80%,连续三次超过阈值后开始报警。
根据界面提示配置名称与描述。配置完成后,单击“创建”,完成创建告警规则。
告警规则创建完成后,当业务量飙升,监控指标触发设定的阈值时,云监控会在第一时间通过消息通知服务实时告知资源异常,提醒您处理,以免因此造成业务损失。
云服务监控
应用场景
电商平台RDS、ELB、VPC等服务,可以使用云服务监控,在云服务监控页面实时查看云服务运行状态、各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。
操作步骤
登录管理控制台。
在管理控制台左上角单击图标,选择区域和项目。
单击“管理与部署 > 云监控 > 云服务云监控”。
在“云服务监控”页面,选择弹性负载均衡,单击弹性负载均衡名称右侧的“创建告警规则”,进入创建告警规则页面。
为关系型数据库、虚拟私有云创建告警规则分别在“云服务监控”分别选择关系型数据库和虚拟私有云。
图1 创建告警规则(ELB)
图2 创建告警规则(RDS)
图3 创建告警规则(VPC)
说明:
为了更好监控弹性负载均衡服务,需要先开启负载均衡ELB的健康检查,详情参见健康检查机制和配置说明,建议设置负载均衡ELB网络留出速率的80%作为告警阈值。
建议将RDS的CPU使用率告警阈值设置为80%,连续三次超过阈值后开始告警。硬盘使用率、最大IOPS使用率、连接数等其他监控指标可根据您的实际情况来设置。
建议将VPC的出网带宽告警阈值设置为80%,连续三次超过阈值后开始告警。其他监控指标可根据您的实际情况来设置。
单击“下一步”,进入规则信息界面,根据界面提示配置参数。
单击“创建”,完成告警规则的创建。
具体的告警规则参数,请参见创建告警规则。
当业务量飙升,RDS、VPC或ELB的监控指标触发设定的阈值时,云监控会在第一时间通过消息通知服务实时告知资源异常,提醒您处理,以免因此造成业务损失。
资源分组
应用场景
一套完整的电商平台会使用到ECS、CDN、AS、安全服务、RDS、OBS、VPC等服务,您可以创建资源分组,将电商业务的ECS、EIP、EVS等资源划分成一个分组,通过资源分组功能从业务视角查看资源使用情况、告警情况、健康情况,管理告警规则,可以极大的降低运维复杂度,提高运维效率。
本章节指导用户创建资源分组。
操作步骤
登录管理控制台。
单击“管理与部署 > 云监控”。
单击页面左侧的“资源分组”,进入“资源分组”页面。
单击页面右上角的“创建资源分组”按钮。
图1 创建资源分组
按照界面提示,填写分组名称。
选择需要添加的云服务资源。
图1 选择云服务资源
单击“立即创建”,完成资源分组的创建。
创建完成后,可在资源分组界面查看分组的资源使用情况、告警情况、健康情况等。
图1 资源分组
- 点赞
- 收藏
- 关注作者
评论(0)