概述
“三位一体”超级混沌工程X-Chaos主要包括基础故障编排、业务场景故障编排、演练场景编排、故障库管理、演练场景管理、演练计划管理、演练观测和演练报告等模块,支持对传统架构、云环境以及国产化基础环境的IT系统进行故障演练。
价值
-
NO.1
提升IT系统的健壮性
通过X-Chaos平台对系统注入业务故障、基础故障或复杂场景故障,同时观测系统整体QPS、RT以及业务健康度,验证IT系统的流量调度是否准确,故障预案是否有效,以提升IT系统的健壮性。 -
NO.2
提升运维监控的有效性
验证监控指标是否准确,监控维度是否完善,告警阈值是否合理,告警信息触达是否及时、准确,提升监控告警的准确性和时效性。 -
NO.3
提升团队应急能力
随机对系统注入故障,验证故障跟踪、处理流程是否合理,以及研发运维团队对突发问题的应急处理能力,达到以练代战,提升团队定位与解决问题的能力。
产品功能
-
1
基础故障库
平台内置460+基础故障注入脚本,并配备详细的故障注入说明和使用场景。并支持用户自定义或导入第三方故障脚本,帮助用户快速创建演练场景或演练任务。 -
2
业务场景故障编排
集成XRunner性能测试平台,基于低代码能力快速实现基于业务的大并发、错误业务重试、非法请求注入等类型的业务场景故障脚本编排。 -
3
支持自定义演练场景
支持用户自定义演练场景,进行随机故障注入或者有序故障注入,模拟实际生产中故障的不可预知性,验证/提升IT系统及保障团队的反脆弱应急能力。 -
4
跨栈演练观测
在演练过程中,提供“系统性能指标”和“业务健康度”展示,演练效果可视化。同时支持接入第三方观测数据。
利来国际最老品牌网的优势
-
“三维一体”故障演练平台
业界首个支持业务级故障注入的混沌工程产品,支持基础组件故障和业务故障聚合爆破,解决了传统故障演练工具与云原生技术栈和业务关联度结合不够,以及复杂云环境和真实业务故障问题观测难的问题。 -
“上帝视角”的观测能力
提供基于各类资产、基线的监控能力和业务健康度监控能力,更可提供细粒度、多维度的通信指标和会话内容支撑。依赖于这些指标和内容,可以帮助用户在演练过程中建立“上帝视角”的观测能力。 -
智能启停精准控制爆炸半径
支持用户自定义保护策略,演练过程中实施观测,自动暂停或终止故障演练,避免引发预期外的故障造成重损失。