集群系统运行状态监控软件设计

Huazhong Keji Daxue Xuebao (Ziran Kexue Ban)/Journal of Huazhong University of Science and Technology (Natural Science Edition)(2011)

引用 1|浏览1
暂无评分
摘要
结合现有监控方法,设计并实现了一种针对集群系统关键部件的多层次、集中式监控软件.该软件的监控状态参数丰富,涵盖了部件的物理状态、节点的负载状态、节点的事件信息状态和数字电路逻辑状态这4大类运行状态;其状态数据使用数据库集中存储,便于历史数据的检索与分析;状态数据具有统一时钟,能够再现集群系统历史某时刻的运行时场景.在实际系统上的运行结果表明:基于该软件实现的故障在线自动处理机制能够提高系统运行稳定性及作业的成功率.
更多
查看译文
关键词
Cluster system,Online fault management,Resource management,Stability,State monitoring
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要