近年来,随着各类应用系统建设速度迅猛发展,信息化技术人员的数量、维护能力和知识水平日显不足,在实际工作中只能等到设备及应用系统出现问题造成故障时才进行维护,并且IT设备和信息系统多而复杂关联性日益增强。运维人员有效地降低系统运行的风险,主动的发现并及时解决系统运行故障,这些都给企业IT运维服务管理水平提出了更高的要求,也是当前IT系统运维服务管理普遍面临的巨大挑战。面对如此高的要求和压力,目前的信息化应用平台单靠人工管理已经变得不现实, 因此,通过采取IT运维服务管理系统来辅助信息部门进行半自动化管理,使信息系统更加适应业务持续变化的需求。
本篇文章将就国内领先网络设备及解决方案供应商锐捷网络的IT运维产品线进行逐一介绍,希望通过对国内领先IT运维厂商的产品线进行梳理,加深企业管理人员对企业IT运维的理解,实现IT系统与业务系统的统一与融合。
目前,锐捷网络IT运维产品线共有7大产品,其中6款为基础架构监控产品,1款为IT服务管理产品。6款基础架构监控产品包括RIIL-IMC实时化基础架构管理中心、RIIL-BMC关键业务系统运行监控中心、RIIL-IEMC机房环境管理中心、RIIL-NFA流量分析中心、RIIL-Smart灵动监控管理系统和RIIL V6.0 IT综合运维管理平台;1款IT服务管理产品为RIIL-RMC服务请求管理中心。
本篇文章将重点介绍RIIL-IMC实时化基础架构管理中心。这是一款基于IT基础架构的监控软件,能实现对服务器、存储、网络设备、数据库、终端、中间件等在内的基础设施的实施运行状态监控。
一、产品特征
1.一键发现复杂异构网络
先进的多线程多协议智能发现算法,能够通过多种私有协议兼容各种复杂异构网络,最大限度的提高发现速度和准确率,使网络模型构建工作轻松、简单。可自动化发现的IT资源包括:
●网络设备监控:路由器、交换机、安全设备、无线设备等网络相关设备
●主机及服务器设备监控:Windows、IBM AIX、Linux、HP-UX、SCO-UNIX等各种操作系统主机
●数据库监控:Oracle、Sysbase、SQL Server、Mysql、DB2等多种数据库
●中间件监控管理:J2EE(WebSphere、Weblogic、TOMCAT)、JBOSS、Tuxedo、Apache、Resin等中间件
●应用系统监控:提供WEB服务的Apache Server、IIS、Tomcat的服务状态和应用系统的状态
2.全面IT资产管理
RIIL-IMC将自动发现的各类IT资源自动的加入IT资产库,通过IT资产库可以从资产类别、厂商、自定义分组等不同视角来查询IT资产的情况,在IT资产详细信息页面,IT运维人员可以对IT资产信息进行单独或批量修改,并能实时查询资产的动态运行信息,有效解决IT运维过程中遇到的各种资产管理问题。
3.多协议应用监控管理
多协议应用监控管理,能够基于应用层协议模拟管理员日常工作行为。通过SNMP、CLI、JMX、JMS、JDBC、Oracle、Tomcat、WMI等多种协议监控方式实现对各种网络设备、操作系统、中间件、数据库、业务应用的全面7x24小时监控,极大提升监控准确率和及时率。
4.多视角网络拓扑管理
多视角网络拓扑管理功能,能够提供二、三层网络拓扑、逻辑拓扑、地图拓扑、3D拓扑、机房机架拓扑,全方位多视角、实时展示拓扑运行状态,通过拓扑可实时显示设备、链路等基本信息和CPU、链路流量等性能信息,IT运维人员可以在拓扑界面中直观地对网络中的设备以及相关链路进行监视,拓扑上提供了常用的Ping、Telnet、TraceRoute、打开设备Web网管等常用操作和相关链接,彻底摆脱枯燥的CLI设备管理模式,帮助IT运维人员清晰快速地分析网络运行状态。
5.精细化智能告警管理
7级的业务故障级别,能够精准地反映故障的演化趋势,增加更多的告警处理动作,使故障的内容更具准确性,故障的处理更具针对性。支持各种标准的通知方式,如发送电子邮件、短信、记录工单,使用户随时随处就可以获得告警信息,从而能够及时地解决问题。RIIL-IMC用不同的颜色来表示不同重要度的警报,让管理人员一目了然,快速掌握整个业务基础架构的情况。IT运维人员还可以对告警的解决方案进行登记,并形成知识库,为今后的同类故障处理提供参考。
6.智能故障分析诊断管理
内置强大的事件管理规则引擎,能够通过灵活的配置功能实现复杂故障信息的过滤和提炼,实现智能的故障分析诊断,使常见故障能够自动关联识别,支持重复、闪断、未知事件自动关联识别;支持自定义事件过滤规则、自定义告警生成规则。实现重复告警识别过滤、突发事件告警识别过滤、未知告警识别过滤和用户自定义规则识别过滤功能,可以有效压缩“风暴式”网络告警,使得IT运维人员直接关注真正的IT故障,并通过智能事件-告警关联分析技术,自动过滤各种干扰信息,在产生告警的同时自动匹配知识库生成根本原因分析,协助管理人员对故障进行处理,减少了故障时间,大幅度提高运维工作中的故障诊断效率。
二、技术参数
1.网络自动发现
RIIL平台的网络自动发现和管理技术,借鉴和发展了国内外最新的网络拓扑动态发现和跟踪技术,支持拓扑基线技术,通过锐捷网络TLOD智能拓扑算法准确地展现出网络的当前拓扑情况。并支持全球广泛使用的SNMP 协议(简单网络管理协议),并全面支持SNMP V1、SNMP V2、SNMP V3 三个不同的版本,充分考虑和规划了SNMP协议的安全性、稳定性和兼容性原则。
RIIL平台自动发现参数配置能根据网络规模和网络协议应用情况,有针对性的配置发现协议、并发进程、管理域、种子节点和区域、屏蔽设备和网段等参数信息,这些参数直接影响着系统发现、运行和更新的性能。 通过360度雷达扫描视图,用户能够快速了解RIIL平台自动发现的各类设备的统计信息,并能够实时观测到RIIL平台后台的扫描和发现进程,增加对网络发现情况的掌握。
2.网络故障监控
根据预先设定的运行监测参数持续地监测网络系统的各项运行参数,跟踪网络拓扑的变化,一旦网络发生故障或者拓扑发生变化就可以迅速的通过前台拓扑图反映出来,能够展现网络设备故障事件、重要网络链路故障事件、网络协议故障事件等。出现的故障可以在网络拓扑图上通过节点告警的形式表现给用户,并且故障和报警事件显示在统一的告警控制台中,根据报警事件的重要级别、优先级、重复次数、资源名称、告警地址等信息,用户可以直观、快速地了解报警事件的紧要性。以帮助管理人员深入了解告警事件。用户可以设定报警过滤器和排列顺序,用来重点关注重要的网络报警事件,网络管理人员能够看到与每一个报警有关的所有事件。系统支持通过声音、邮件、短信等方式提示及时告警,起到准确预警和定位故障的作用,为用户发现和处理事件提供数据信息支持。
3.网络性能监控
支持网络性能实时监测,监测到网络设备、服务器的端口流量、丢包率、错包率、Ping延时和丢包、CPU利用率、内存利用率、磁盘利用率等运行参数,超过预设阀值时能在拓扑图上根据用户定义阀值以醒目颜色显示,并能够根据设定阀值以不同颜色、不同粗细显示线路运行状态,实现对用户网络的通畅率、流量的监测,当链路出现异常,自动告警。提供对历史性能数据进行统计分析功能。
4.网络拓扑管理
RIIL平台提供的多样化,层次化展现拓扑图,可以帮助管理员轻松的做好运维工作,包括:
●在拓扑图上展现设备状态、链路带宽流量、告警故障的展现;使用不同颜色、粗细、图标表示被管理对象的状态信息;
●提供快速查找和定位设备功能,可以通过设备名称、IP地址等信息,在拓扑图上准确定位设备,并显示出此设备的网络连接信息;
●便捷的浮动信息显示,浮动显示各类设备和链路的关键信息;
●丰富的右键管理菜单;
●集成一些常用管理工具,如ping、traceroute、telnet等
●拓扑图大小滑动式缩放缩放、全屏显示以及背景图设置。
●手工修改网络设备的链路和配置信息。
RIIL平台针对大型和特大型网络,提供有网络分层管理功能,通过将大型网络通过按照地域、部门等划分成多个相对较小的子网实现分级管理、提供远程管理工具辅助用户对大型网络进行监控和管理。用户可以根据自己的使用习惯选择合适的拓扑视图加以监控。RIIL还可以更具网络分层设计的结构,将网络拓扑划分为核心层拓扑、骨干链路拓扑、支干链路拓扑等多种展现手段和形式,以应对大规模网络的分级、分层管理需求,同时为了防范安全和管理风险,RIIL支持针对用户组或单个用户进行拓扑、分层拓扑的浏览和管理授权,做到“谁维护、谁管理”的工作模式和理念。
5.服务器管理
RIIL平台可以实现对Windows、IBM AIX、Linux、HP-UNIX、SCO-UNIX等各种操作系统的主机的关键资源的自动监控,帮助管理员及时发现故障和故障隐患。采用集中非代理式监测,无需在被监控对象上安装任何代理软件,对原有系统不产生任何影响。
6.数据库管理
RIIL数据库系统监控模块能够根据预定义的监控项目对Oracle、Sysbase、SQL Server 、Mysql 、DB2等多种数据库进行监控,按照属性相关性分为数据库工作状态、数据库表空间的利用情况、数据文件和数据设备的读写命中率、数据碎片的情况、数据库的进程状态、数据库内存利用状态等属性监控组,每个属性组包含一个或多都多个预先定义的监控项目,可以直接使用相关的监控参数和项目,也支持自定义或者修改。
7.中间件管理
支持市场主流的各类中间件进行性能、状态和故障信息的监测,包括有J2EE(WebSphere、Weblogic、TOMCAT)、JBOSS、Tuxedo、Apache、Resin等中间件的监控。
8.应用服务管理
●Apache
基本负载监测:监测服务器是否连接,采集CPU负载、正常运行时间、响应时间、累计访问数、累计访问数据处理、每秒请求数、每秒处理字节数、每请求处理字节、忙作业数、空闲作业数等指标,可设定告警阈值。
●WEB
HTTP URL:监测http服务器是否连接以及是否正常运行,可以监测指定http的URL路径是否包含或者不包含指定内容。
HTTPS URL:监测httpd是否连接以及是否正常运行,可以监测指定https的URL路径是否包含或者不包含指定内容。
Web Service:通过调用Web Service提供的方法,监测Web Service服务器是否正常运行。
●标准邮件服务器
POP3服务:监测pop3邮件服务器是否连接以及是否正常运行,可以监测具体的邮箱的邮件数以及邮箱使用量,并且可以设置告警阈值。
SMTP服务:监测STMP邮件服务器是否连接以及是否正常运行,可以设置杨影时间的告警阈值。
●基础服务
DNS服务:监测DNS服务器是否连接以及是否正常运行,可以监测指定域名是否正确解析。
三、产品点评
RIIL-IMC实时化基础架构管理中心是一款基础架构级监控软件,能实现对企业IT基础设施的状态监控,并实现IT基础设施管理的可视化和自动化,大幅降低了企业IT运维难度。对IT基础架构运行设备状态和性能的监控是实现IT运维自动化的第一步,也是关键一步。锐捷网络作为国内领先的网络设备及解决方案供应商,对IT软硬件都有着非常深刻的理解。近年来,通过将ITIL理念融入到产品开发,推出了基于自身实践的RIIL系列IT运维产品,广受市场好评。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:国内IT运维产品点评之锐捷篇(一)