随着系统变得越来越复杂,要保持其敏捷性也正变得越来越困难。做任何改变都变成一次缓慢和痛苦的历程。工程师也畏惧对这样复杂的大型系统做任何改变,改变往往只能让事情变得更糟。在本讲话中我将回顾我们是如何在日益复杂的系统中实施可靠改变的。
应用基础设施向云中迁移已经是一个不可逆转的过程,相对于传统的层次分明的应用架构来说,云时代的应用底层架构更加简单,网络基础被SDN资源化,数据存储和分发成了IaaS里面的标准接口,各种计算能力也随时按需获取。然而前端的用户入口层面却反而更加多样化,移动App,Web浏览器,H5轻应用,各种不同的应用分发渠道让用户和应用的交互从未如此容易,这种应用架构给性能管理带来了新的挑战。从性能测试技术、性能监控技术、性能管理技术各个方面都需要全新的技术方案,本演讲将围绕以上三方面进行分享。
移动互联网的浪潮到来,对互联网产品的性能和用户体验要求越来越高,当我们访问app速度慢、抢购支付环节卡顿、 使用LBS应用的时候地图显示不出来等都会严重影响用户体验进而导致用户流失;加上新一代的基于saas、 paas、iaas的新IT架构的兴起,对我们应用的性能和稳定又提出了高的要求,这个时候APM应运而生了。这次议题主要分享APM给新一代互联网和IT架构带来的变革,看OneAPM如何利用Apdex的标准细粒度去做好性能管理,给企业和互联 网产品性能提升带来福音。
介绍APM为何应该以用户体验为核心,以及性能极客如何提供新一代web及移动端的 前端性能监控优化服务。
近年来,开源在高科技技术行业正在成为越来越重要的资源。对于web前端开发人员和社区,更是如此。新的理念,框架,和库不断出现和更新。在选择开源框架和库的时候, 可用性和可学习性是开发者们最初最关心的。性能往往会被忽视,有时则可能在项目初始阶段无法预知。
通过Yahoo Media近年来前端web应用JS框架的进化过程,我将会探讨驱动框架演变的各种因素,特别是性能对技术发展和选择的影响。
Web 开发最重要的工作之一就是取悦用户。我们非常了解高性能 Web 体验恰恰能做到这一点,而且已经做了大量改进针对性的改进,比如 TCP 的 slow-starts、resource parallelism、单线程渲染以及很多问题。我们称之为“最佳实践”。
现在是 2015 年,仅靠那些“最佳实践”来取悦用户正变得越发困难。用户正通过不同尺寸、操作系统、容量的设备来使用我们的服务,为了提高性能我们的应用也变得越来越复杂。而且情形愈发严重。
本议题中我会探讨在用户期望和产品要求发生变化时取悦用户所面临的新挑战,如何在新技术帮助下改变我们的最佳实践,更重要的是新技术如何和现实结合,在现阶段下 Web 工程师如何平衡二者。
京东618已经过去,在开发和备战618期间总结过一些设计原则,也遇到了一些坑。而且随着网站业务发展,需求日趋复杂多样随时变化;传统静态化方案会遇到业务瓶颈,不能满足瞬变的需求。因此需要一种能高性能实时渲染的动态化模板技术来解决这些问题。
本分享会从如下方面介绍:
对于通过 API 部署的服务,理解和管理延迟是创造良好客户体验的重要部分。本议题您将会听到 API 服务性能监测的战略,重点放在延迟和反应测量上。讲话将涵盖监测和测量技术,数据分析和如何使数据可操作。
页面的加载时间大部分都消耗在文件的下载上,而在相同应用、相同网络环境下,决定文件下载速度的是TCP协议栈,通过对TCP协议栈的优化,能够有效的减少页面的加载时间10%-30%,能够将视频的卡顿率减少20%-50%,能够大幅提高在无线弱网环境下的文件下载的成功率。本演讲我们将会从原理上介绍为什么TCP协议栈会影响文件的下载速度,然后我们会讲解现在TCP协议栈存在的一些问题和改进空间。最后我们会介绍一下我们阿里云CDN在TCP协议改进和定制上做的一些成果和经验,包括针对图片的优化、针对视频的优化,端到端的QoS、网络服务质量的采集等。
影响WEB性能的因素众多且复杂,当性能相关数据从不同节点采集回来时,如何快速有效的进行数据分析并通过一体化的视图展现出来,越来越成为产品技术人员共同关注的话题。要解决这一问题,需要从数据模型,流式数据处理,大数据存储及大数据可视化展现等众多技术方面进行统一的设计。云智慧技术研发团队经过长时间的技术实践,提出了一套完整的数据可视化技术栈。
任何技术栈都不是万能的,了解你的数据,了解数据最简单直观的 分析描述,对不同的场景应用不同的技术栈,从实践中找到最适合自己的技术栈,让我们一起玩转大数据,让大数据动起来。
介绍如何提供精准地评测页面及app的加载速度,以及如何有效 地实施前端性能的监控和优化。
如今当我们访问的移动应用速度慢、图片页面无法打开、视频无法下载、交易拥塞等症状时,大多数人会毫不犹豫地离开。由于越来越多互联网应用承载着企业的商业价值,应用出现性能 问题直接转化为实际损失,所以性能问题即关乎用户体验、也直接影响营收和企业竞争力。 kevin在腾讯、百度工作近十年,不断吸收国际优秀企业的性能管理“营养”,参与和主导多个腾讯事业部级、百度公司级应用性能优化项目,并取得巨大收益,将为大家分享大 规模企业级性能管理实践。
随着互联网产品规模的爆发式增长,大型分布式系统的监控复杂性也日益显现。工程师们发现:监控遗漏导致宕机的黑天鹅现象频繁发生;出现故障时很难从海量监控指标中迅速找到故障根因;报警风暴极大地干扰了工程师定位问题的速度;故障恢复速度基本依赖于工程师的操作速度。由此,我们尝试建立一个智能运维监控系统,希望用智能化手段去帮助工程师解决这些问题。
在本议题中,我们会以实际例子来讲解,在百度我们是如何帮助产品完成智能化运维监控之路的。主要包含如下一些内容:
网站的性能越来越成为互联网发展的重中之重。要提升性能前提是先能找出性能的瓶颈。抓准要点,才能一击必中。eBay作为全球领先的互联网公司,很多年前就开始从各个方面监控和测量性能有关的指标,并且提出一些切实有效的方案提升了整体性能。
通过分享一些eBay的真实案例和工具,希望能和大家互相借鉴,取长补短。
Betty 之前在 Yahoo 以及目前在 Amazon 都组建过一些专业工程师团队,包括 YSlow 移动团队,近期在 Amazon 的团队启动了全站范围前端框架影响了 amazon.com 超过 90% 的流量。本讲话中她将分享在组建专家团队中的所学,你在寻找什么样的人,如何吸引他们,如何创造愉快的工作环境,在数据不充足的情况下如何作决定,等等。
从交付内部软件系统迁移到在云平台上部署一个服务,对任何企业来讲都是巨大的项目。除了显而易见的技术变化外,文化和商业的转换也是非常重要的。Message Systems 创始人 George Schlossnagle 将讨论如何成功转换到云业务。
新互联网时代IT系统依赖性变强,运维质量对业务的影响至关重要,即便是DevOps也未必尽善尽美。“以用户体验为中心”的运维转型是互联网时代的一大重点,利用APM来支撑业务级运维,是真正的APM3.0时代。
网站的性能和安全关乎用户体验、企业的竞争力,HTTPS化已是大势所趋。但HTTPS网站的运维、性能提升、安全是一道门槛,做到精准优化的HTTPS网站和普通HTTPS网站有巨大的差异。野狗实时,以用户体验和用户安全为出发点,成立之时就实行全站 HTTPS。通过不断的研究和分析,我们在HTTPS的性能、安全优化上积累了很多高价值成果,并都已用于实践。在各机构的性能、安全评测中出类拔萃。这次提议,我们主要分享HTTPS网站和WebSocket wss那些必须、重要、还有鲜为人知的优化细节。
做实验是个理解客户非常好的办法,但它在性能和可维护性方面也带来额外代价。在一个复杂系统上同时跑数百个实验情况可能变得更差。本讲话中我们重点会放在实验如何给前端性能带来冲击,并且讨论如何选择一个较好解决问题的方法。
一年前,Yahoo Frontpage团队开始开发新一代前端web应用JS框架。我们选择了Facebook的React,同时开始將Flux理念拓展到node.js服务器端, 开发了Fluxible -- 最早客户端和服务器端同构的开源Flux库之一。一年后的现在, 我们已经成功的运用这个框架开发并推出了多个新的Yahoo Frontpage web应用。
我将会分享我们:
Web App 的 Native 化是这两年比较火热的话题,Hybrid App 是一个使用很广的方案。但是 Hybrid 确无法解决 WebView 在页面流畅度上的卡顿。Facebook 发布的 React Native 比较好的解决了这个问题,但是 React 本身却是对传统Web开发的颠覆(完全不同的UI构建方式、Native化的API),那么有没有一种既能够兼容传统 WebView,又有着媲美 Native 性能的开发方式呢?boostUI的出现就解决了这个问题。
由于LinkedIn 流量增长很快我们不得不扩展网络基础设施来满足要求。本议题中将涵盖我们在构建和扩展基础流量设施过程中所做的关键设计、性能和可靠性决策。
互联网上每时每刻都有信息泄露,请求被劫持和篡改的事情发生,为了让用户能够安全、放心的在我们的网站上购物,我们对淘宝进行了全站HTTPS改造工作。这是全球最大的电子商务网站第一次全站HTTPS实践,因此遇到的挑战非常巨大:
Hybrid App(混合模式移动应用)看上去是一个Native App, 但只有一个UI WebView,里面访问的是一个Web App,兼具“Native App良好用户交互体验的优势”和“Web App快速迭代的优势”,这里给大家分享一下我们使用这种模式遇到的挑战和解决过的“坑”,特别是在接口调用,资源加载,渲染速度和帧率等方便的优化尝试和经验分享。
在服务运维环节,业务监控是非常重要的一个环节,对于业务指标的异常变化要及时发现和处理。通常业务信息是从服务日志中提取,但由于影响业务指标的因素众多,通常需要从多个角度逐层细分到多个维度进行分析和监测,例如对PV按运营商、省份的流量细分,或按URL类别细分,或按浏览器来源细分,等等。业界有ELK的整体解决方案,但在大规模数据下性能表现并不尽如人意,百度服务监控平台针对这种场景专门设计了一套解决方案,主要包括高性能客户端数据采集和归并、Storm计算、HBase存储、异常波动监测、可配置化展示等环节,在性能和灵活性方面有很多考量,业务方只需要提交一些配置信息,即可使用整套服务。
以手机淘宝前端实践为例,讲讲移动互联网时代,无线前端如何利用技术和工程体验,带给用户体验提升。
为了满足不同用户的多样性购物需求,过去两年里手机淘宝的业务不断膨胀,从单一的购物工具成为了购物内容平台。在手淘业务快速增长的同时,也带来一些副作用,很多操作环节和页面因为承载功能太多,展示的速度变慢,用户等待时间变长。性能优化势在必行。我们根据手机淘宝用户的购物操作流程,对每个步骤和模块都进行监控,以量化数据为指导来进行优化。这次演讲介绍启动、首页、购物车三个业务环节中,手机淘宝开发团队在网络调优与图片下载两个领域的优化方案。
数据是一个企业的生命,而数据库的运维对于企业运营来说更是重中之重。随着互联网和云计算的发展,企业纷纷加大了对IT运维的投入,数据库运维最受重视。因为数据库运维水平的高低,将可以直接影响企业的业务发展。大规模的数据库为企业IT运维带来了极大的挑战,包括监控响应、性能优化、在线扩容和容灾恢复等。
本议题将结合UCloud 大规模的数据库运维经验,主要分享如下内容:
1000 QPS的站点,是个工程师就能做的出来。1万QPS的站点如何做?10万QPS的站点又如何做呢?本次演讲告诉你,如何完成10万QPS量级的web server,从技术选型、实践结果以及我们工作亮点举例,以身边的故事走入异步编程网络。如果您已经是openresty的开发一员,那我们多了一个伙伴。如果您还不了解它,那么我相信这次旅行,可能会颠覆你的认知,为啥身边有这么牛X的利器今天才初露光芒。
分享阿里巴巴在移动网络领域相关加速技术。
有意赞助 O'Reilly Velocity China 2015 或者有其他合作想法,请通过地址 donna at oreilly.com.cn 联系马女士。
For Velocity China sponsorship information for companies outside China, contact Gloria Lombardo at glombardo at oreilly.com
进一步联系信息请查看联系Velocity China 2015