总公司自2008年开始安装并使用公交智能调度系统,在信息管理中心建设机房。随着公交智能调度系统功能的扩展以及公交运营车辆的增加,公交智能调度系统的后台运算及存储量在不断增加,数据处理出现瓶颈,导致服务器出现多处故障现象,直接影响了公交智能调度系统、电子站牌、掌上公交系统的使用。总公司领导非常重视,副总经理吴贺明亲自到信息管理中心现场指导工作。为了确保升级前服务器设备的正常运行,信息管理中心工作人员利用休息时间坚持工作,积极的寻找解决问题的方法,及时的解决突发事件的发生,为升级工作做好各项相关准备工作。
8月1日开始服务器内存升级工作,为使升级工作对其他业务影响最小,信息管理中心反复斟酌,决定先升级B机,让A机继续工作,但升级工作没有想象的顺利,B机更换新内存后,没能成功启动,需要重新检测问题根源,通过反复的拆机更换内存,首先确定B机的原有两条内存条已经损坏,同时,更换过程中也发现很多问题,通过多次安装、重启,并查询IBM手册,重新确定了与我公司需升级服务器兼容的内存型号,重新联系货源并要求快速发货,工作到晚上9点多钟,为第二天的升级工作做足了准备。
8月2日早上开始,更换B机新型号的内存条,直到中午12点20分,该服务器的升级工作完成,可以正常工作。为检测升级的效果,马上通知各营运分公司应用智能调度系统,一方面进行压力测试,一方面让升级工作对运营、安全服务等相关工作的影响降到最小。为保证数据库软件(oracle)升级的正常进行,先将所有重要的数据进行了备份,并对小机的AIX系统进行了清理。直到晚上8点多钟,数据库软件(oracle)的升级工作完成。
8月3日,通过B机的压力测试,反映较好,故继续升级小机A及磁盘阵列,小机A的升级工作比较顺利,升级成功后,与B机双机运行,使系统运算、处理能力明显增强;为解决系统存储问题,增加原有磁盘阵列的容量,增加5块硬盘,并划分了RAID5,划分了逻辑卷,挂载到A机和B机上,进行重新配置。升级完小机和存储后,对TSM存储进行了重新清理,直到中午12点多,升级工作完成。
此次历时3天的升级工作完成后,所有服务器设备及数据库软件运行正常,公交智能调度系统、电子站牌、掌上公交系统也恢复正常使用。信息管理中心在总公司各级领导的大力支持和帮助下,将会继续努力,为我公司信息化建设工作做出更大贡献。
(总公司信息管理中心