作为技术侧的,来说一说“西安一码通”项目所呈现出的问题,以及可以弥补的方向

【本文来自《西安大数据刘军被免职,再次为外行领导内行敲响警钟》评论区,标题为小编添加】

西安的一码通最近几天连续崩溃两次。作为技术侧的,来说一说这个项目所呈现的问题以及可能可以弥补方向:

1.项目流程问题:之前也做过一些项目,实际上政府相关项目流程都比较严谨,任何官方项目都会找专家走过场,但是现在政府找到的外部专家多为学院派大部分知识点老旧,关心的点可能并不在高并发上,或者存在某些专家被东软公关走过场问题,而且这个项目要求紧任务重;出现各种问题是需要多多体谅,只不过当初不知为何没找阿里 腾讯这些大厂作这个事。

2. 项目技术承包方的技术能力评估:

西安互联网资源有限 很难像杭州 广州那样直接找互联网大厂搞高并发的架构

比如杭州可以请阿里直接上手,上手就是互联网高并发的架构,二维码访问和后台数据访问可能没啥问题,顶多早期计算存储资源预估不足,完全可以通过申请政务云上资源扩容就能解决 只要架构设计好,后期基本通过资源扩容就能解决问题。 西安一码通系统建设方是西安东软,西安东软没听说做过千万级高并发的架构(如果有误请指出),东软做的健康码在哈尔滨也宕机好几次,只不过哈尔滨那边出现健康码崩溃情况,舆情反应没这么大。

3. 项目的安全侧评估 项目采购了杭州安恒的安全包,按道理不应该出现安全漏洞导致的宕机,当然不排除最近Log4j等漏洞,运维方没有及时打补丁出现问题。另外一方面也可能是某国黑客搞得DDOS拒绝攻击导致宕机,如果出现这个问题,甲方还得增加针对DDOS攻击应对预案。因为工信部总工程师韩夏到陕西省通信管理局开展疫情防控工作调研时强调:要切实加强网络和信息安全,优化应急预案,强化安全防护,排查安全隐患,防止出现网络安全事故…西安“一码通”要加强技术改进和网络扩容,确保平台安全稳定运行。

3. 项目本身弥补点:

这个项目上线时间是去年2月份也就是武汉疫情开始后三个月就上线。一开始可能是要求紧任务重。但是按照常规来说这种项目上线前或者上线后应该作至少一次高并发模拟压测,不知道西安有没有作,我猜可能没做,因为做了应该会发现相关问题并整改。另外在西安出问题之前,全国范围内天津 海南 山东 哈尔滨都出过健康码出问题或者崩溃的情况,之前应该在全国范围内技术分析和解决方案分享,只怕当初各地都觉得面子问题,大概率不会作这样的技术分享。而且关键问题是企业级商用大项目都会部署至少两套系统,一套生产环境,另一套开发环境,平时用开发环境作压测和开发,生产环境作生产使用,严谨点应该是生产一套,DEV/UAT一套,压测的Perf环境一套一共至少三套环境。Perf环境压测发现问题,在开发环境作整改,再上Perf环境验证,最后合并到生产环境。 这样处理至少不会出现天津升级健康码升级垮掉的问题,也会尽量减少西安这些出现好几次宕机问题。

4. 项目技术点:

网络安全 高并发访问,分摊访问流量,队列处理 ,分库分表等

综上,第一次西安一码通出问题的时候大概率是系统架构设计就有问题,所以在云上资源扩容后还出第二次宕机故障,当然不排除第二次有国外黑客攻击导致宕机问题。

全部专栏