云厂商这么多哪家好,有监控数据了还敢吹吗?

05.08.2015  14:17
最近云主机厂商都跟约好了似的,扎堆办大会:阿里云、青云、华为、用友……,或发布产品或阐述战略,拼技术,拼产品,拼亲家,还拼性价比,弄得用户也是眼花缭乱。云主机厂商在服务发生故障前的自监测,并及时处理问题,也是一个监测的应用场景。

  最近云主机厂商都跟约好了似的,扎堆办大会:阿里云、青云、华为、用友……,或发布产品或阐述战略,拼技术,拼产品,拼亲家,还拼性价比,弄得用户也是眼花缭乱。大数网赶场子似的参加完这个会议又跑那个会议,想从中做个比较,但是选择哪家服务很是难以决策。

   IaaS云主机市场的诸侯争霸

  云计算的到来,实现了低成本、弹性灵活的IT资源调度,把企业的IT部门解放出来,将更多的将精力集中在主体业务上。技术的进步和需求的刺激,促使IaaS 云主机服务迅速发展起来,传统厂商扎堆转型做云,有从传统主机转型的,有从互联网转型的,当然还少不了互联网时代的管道工——运营商们,场面混乱,都说自家本领强,可是用户一旦被忽悠,买到不靠谱的云服务,往往会造成重大损失。

  众多厂商跑马圈地,已经到了拼价格的阶段。虽然云主机在数据安全、运行稳定性方面虽然比传统的VPS和服务器更强,但云主机由于稳定、安全等诸多原因导致故障时有出现,宕机现象每每发生。

  举两个近日发生的事例:7月22日,青云用户大会当天,青云北京机房遭到DDOS攻击,导致汇聚层路由器损坏;同天举办大会的阿里云也不要五十步笑百步,就在上个月,及6月21日,因为挖断光纤,阿里云香港节点出现全线宕机,业务中断超过12小时,给用户造成的损失可想而知。

  因此,技术再牛,性价比再高,选择IaaS云主机的大部分用户,还是会把安全、可靠放在首位的。

   真实数据监测,应用缓慢怎么破?

  也因此,市面上的云这么多,到底哪个好哪个不好?除了实地参会了解技术,必须通过客观的检测来比较一下。

  所以有第三方就搞了这么个检测,通过云智慧监控宝部署在全国范围的数百个监测点,真实模拟用户访问行为,对市面上流行的云主机性能从服务器性能、网络性能等维度进行全方位检测。

  必须承认的是,云主机的性能涉及到很多影响因素,而现实环境下的压力测试才能真正体现云主机性能的优劣。下图是监控宝100个监测点并发访问下, 13家云主机的性能测试结果。

图1 监控宝云主机性能监测数据

  此次评测中服务器性能监控是指针对服务器系统的运行状态以及各项指标的监控,包括CPU平均使用率、CPU负载、内存平均使用率、磁盘I/O写入平均流量、磁盘I/O读取平均流量等。在云主机的初始环境下,部署了一个相同版本的PHP应用WordPress,然后在监控宝中选择100个遍布全国各主要省市,使用移动、联通、电信和教育网接入的监控点,以2分钟一次的访问频率,同时向云主机上的WordPress首页发起访问,形成100并发的真实访问压力,在这个压力下测试获得云主机的各项性能指标。

  数据显示,并不是大品牌的云主机性能就是最好的哦。

  那么,在监测的帮助下,如何防止避免性能瓶颈导致的用户访问缓慢的发生?

  首先要看懂这些数据。因为,正常的服务器工作状态是CPU使用率在50%-60%之间,内存在50%-70%之间,超过这个极限值,运维人员就需特别关注,且要发出预警;CPU负载就是CPU的工作量,多核CPU能够并行处理的事务的数量应该是个数与核数的乘积,CPU的负载数最好不要超过这个数值。CPU 负载太高,即目前工作量已经接近于CPU的最大计算能力了,应该发出预警;而硬盘I/O是云主机性能的最大瓶颈,它不仅会影响高并发时服务器的响应速度,更会对数据库性能的产生影响。当I/O性能大幅降低时,应该及时发出预警,进行必要的干预。

   无网不欢,网络测试哪家强?

  除了性能上要保障安全可靠,在创业企业对速度非常渴求的时代,对网站的响应速度也是用户选择IaaS云主机厂商的重要参考。除却服务器性能、程序架构、带宽质量对响应速度的影响,从近期频发的云主机事故来看,网络是最容易对云服务造成影响的因素。因此,业内专家一般用网络性能作为评价云主机性能的主要指标。

图2 监控宝云主机网络监测数据

  不测不知道,这里面还挺有趣。读图可知, Ping可用率、Traceroute可用率除了个别的云主机外,基本上都达到了100%,但是对不同应用,不同的云主机的响应时间却相差巨大。不同用户有不同的需求倾向,可以根据自己应用的不同和网站评测数据,做出自己的选择。

  下面给您来个读图趣说。

  青云号称是秒级服务,到底怎么样呢?数据显示,像青云这样的专业互联网云服务公司的性能还是不错的,就是网络常常掉链子,安全性和稳定性需要好好加把力啦。

  相比较来说,阿里云的表现要弱一些。可见,并不是像人们想象的,大品牌的云主机厂商提供的云主机性能就好。

  腾讯云一直号称是阿里云的最强对手,看看数据,表现确实不错。如今这么大力推动腾讯云“互联网+”,后端服务必须给力!

  金山云,合作伙伴中好几个是游戏企业,都知道网游对网络的稳定性要求很高,看来金山云的实力也不是吹的。

  美团云,对外都是以“第一家将物理服务器集群迁移到云上”的电商网站来宣传,从数据表现上看,性能差强人意,看来这第一还要加油啊。

  百度云,很亲切,认识的人中大多数应用它的网盘。性能评测也很优秀。

  首都在线云,“最受信任的云服务提供商”,是否足够让人信任,还要看长期的数据表现。

  安畅网络云,“中国最大的自动化IDC服务平台”,资源上的优势很明显。

  华为云,要在这个这两天公布公有云战略,但是,你真的准备好了吗?

  沃云和天翼云,作为运营商团队掌握着管道的优势,性能一般般,貌合神离的结果吗?

  西部数码云,作为传统主机服务商,中规中矩。

  另外,图中还可以发现,在Ping可用率监测中唯一没有达到100%的是Ucloud。因为监测点有100多个,所以某一时间点、某一个监测点无法访问是正常现象。

  当然,云主机厂商在服务发生故障前的自监测,并及时处理问题,也是一个监测的应用场景。

   为什么要这么做,科学吗?

  调查中了解到,各家云主机硬件、系统和网络配置都是一样的,但是实际性能还是有较大区别,没有统一标准,孰优孰劣,用户无从比较。再者,云主机厂商那么多,之前业内也有过一些文章大肆吹捧,但是无图无证明,总要用数据说话。

  采用第三方监测,一方面,对IaaS云主机厂商来说,在保障性能稳定的同时,对其进行性能监控和网络监控,从而实现及时报警、干预,这是现在企业不可或缺的;另一方面,也是基于不同需求的用户,可以根据自己的实际业务需要,选择不同厂商服务的重要参考依据。

   需要说明的是:

  关于云主机性能缓慢的元凶,主要是由CPU、内存、硬盘在内的服务器基础设施稳定性、可用性方面出现性能瓶颈造成的。所以,想要获得最佳的用户体验,除了云主机服务商采用必要保证措施以外,需要对云主机的这几项性能进行客观的评测(如图1),让用户对云主机稳定性和可用性有一个准确的认知。

  而在网络监控中,可用率和响应时间是两个重要指标。所以,针对这两个指标的监测(如图2),并以可视化的数据呈现,有利于运维人员及时发现网络的潜在风险。

  不过监测没那么简单,数据会受到监测环境的影响,要想排除这些影响,还是需要IT部门来进行架构优化。表格中显示的是监测周期内的数据,云智慧监控宝提供精确到分钟级的详细监测数据,后续会针对具体问题出具报告。

   监测有什么价值?

  除了在监测方法上的设计,监测数据的真实、准确性也是各方所关注的。

  此次第三方数据来自云智慧,在云服务行业已经深耕多年,建立了国内最大的全球分布式监测网络,据了解,其目前已经部署了200多个监测点,除了国内各主要省份城市,还包括港台和欧美等地区。这在国内,是仅有的一家,有能力做到这个程度,并且是专注来做监测的企业。

  为了监测数据的真实性,不仅在监测中模拟真实应用场景,在选择监测点上,这次IaaS云主机网络性能评测特意选择了国内分布在不同运营商、不同地区的100个监测点,来确保网络监测数据尽量接近真实数据。

  未来几年,中国云主机市场还将混战很长一段时间,比实力、比技术、比背景,而这也是监测中保持数据真实性的价值所在,对云主机的监测,也必然成为常态。

  总而言之,IaaS云主机哪家强,做到安全、稳定、长久,才是最后的赢家。