如何理解 Web 性能优化
事实上就是用户觉得页面加载很快,用户从输入 URL(网址)到页面在浏览器上加载出来的时间很短;与之相对的有如服务器性能优化(如网页占的 CPU 少),一定要区分开来。
对于用户众多的网站,节约下的加载时间或能带来可观的收入,这便是前端 Web 性能优化的意义。
从输入 URL 到页面加载发生了什么
一道所有前端耳熟能详的经典面试题,也确实是需要前端去深入研究的东西。下面我会简单介绍其过程,并罗列相关的 Web 优化方案。
0. 缓存
当我们在浏览器上输入网址,浏览器首先会查看是否有缓存,如果之前已经访问过该网站,则会有缓存,那浏览器就不必再向服务器发请求了,用户则能够很快得看到内容。Web 性能优化有极大一部分都是优化缓存,缓存事实上又分为数据库缓存、代理服务器缓存、还有我们熟悉的 CDN 缓存,以及浏览器缓存等,部分内容后文介绍。
1. DNS 查询
DNS 查询就像电话簿,你在浏览器地址栏输入网址,通过 DNS 查询得到域名的真实 IP。
DNS 查询完成之前,浏览器无法从服务器下载任何数据。
优化方案:减少 DNS 查询
1.1 DNS 缓存
ISP、局域网、操作系统、浏览器等都会有相应的 DNS 缓存机制。
1.2 减少页面的唯一域名
因为每次 DNS 查询就是查找唯一域名的过程,那么域名越少,DNS 查询就越少,应该尽量将资源放在同一域名。当然这样做又有其他问题,下文详解。
2. TCP 连接
经典的三次握手和四次挥手,不展开赘述。
简单讲讲优化方案:TCP 连接复用(TCP Connection Reuse),在 HTTP 请求头中的 Connection 上加 keep-alive;HTTP/2.0 多路复用等。
3. HTTP 请求及响应
直接讲优化策略
3.1 避免不必要的重定向
最浪费的重定向经常发生、而且很容易被忽略:URL 末尾应该添加/但未添加。比如,访问http://astrology.yahoo.com/astrology将被301重定向到 http://astrology.yahoo.com/astrology/(注意末尾的 /)。如果使用 Apache,可以通过 Alias 或 mod_rewrite 或 DirectorySlash 解决这个问题。
3.2 Cookie
3.2.1 减少 Cookie 大小
每次请求都会带上对应的 Cookie,减少 Cookie 大小可以降低其对响应速度的影响:
- 去除不必要的 Cookie;
- 尽量压缩 Cookie 大小;
- 注意设置 Cookie 的 domain 级别,如无必要,不要影响到 sub-domain;
- 设置合适的过期时间。
3.2.2 静态资源使用无 Cookie 域名
静态资源一般无需使用 Cookie,可以把它们放在使用二级域名或者专门域名的无 Cookie 服务器上,降低 Cookie 传送的造成的流量浪费,提高响应速度。
3.3 添加 Expires 或 Cache-Control 响应头
HTTP/1.1 增加的 Cache-Control,它比 Expires 等好在其设定时间是相对的,避免了用户本地设置时间落后所造成的无法良好缓存的问题等。
- 静态内容:将 Expires 响应头设置为将来很远的时间,实现「永不过期」策略;
- 动态内容:设置合适的 Cache-Control 响应头,让浏览器有条件地发起请求。
3.4 配置 Etag
通过如 MD5 等加密算法,设置缓存体的 Etag 配合 3.3 的缓存时间使用,这样 Cache-Control 就可以设置较长时间(max-age 设置个十年半载 ),只要浏览器缓存中资源与源服务器中的资源 Etag 不一致,说明内容更新了,此时再下载新资源;Etag 匹配成功则直接响应 304,不用重复下载了用户自然感觉很快。
3.5 使用 Gzip
使用 Gzip 就是将 HTML、CSS、JS、XML、JSON 等资源进行 Gzip 高效压缩,减少资源体积那么下载就会更快。
Gzip 压缩通常可以减少 70% 的响应大小,对某些文件更可能高达 90%,比 Deflate 更高效。主流 Web 服务器都有相应模块,而且绝大多数浏览器支持 Gzip 解码。
从 HTTP/1.1 开始,客户端就有了支持压缩的 Accept-Encoding HTTP 请求头。
1 | Accept-Encoding: gzip, deflate |
服务器看到这个请求头,它就会用客户端列出的一种方式来压缩响应。web 服务器通过 Content-Encoding 响应头来通知客户端。
1 | Content-Encoding: gzip |
需要注意的是,已经压缩过的内容如图片和 PDF 不要使用 Gzip,另外还有文件内容本身就很小,这些资源再使用 Gzip 反而会增加资源下载时间,浪费 CPU 资源,而且还可能增加文件体积。
值得一提
HTTP 请求的另一个优化方案是增加同时请求的数量,浏览器会同时发送多个请求,但是同一域名最多同时发送 4~8 个(不同浏览器不同)请求,那么当资源过多时,可以采用增加域名的方法增加并发量。当然这一方法又与上述 DNS 查询的优化方案矛盾,真正使用的时候就需要权衡。
另外,既然一次只能发的请求有限,就应该将重要的需要优先展示的资源先请求:
3.6 延迟加载(懒加载)
页面初始加载时哪些内容是绝对必需的?不在答案之列的资源都可以延迟加载。比如:
- 非首屏使用的数据、样式、脚本、图片等;
- 用户交互时才会显示的内容。
遵循「渐进增强」理念开发的网站:JavaScript 用于增强用用户体验,但没有(不支持) JavaScript 也能正常工作,完全可以延迟加载 JavaScript。
将首屏以外的 HTML 放在不渲染的元素中,如隐藏的<textarea>,或者 type 属性为非执行脚本的 <script> 标签中,减少初始渲染的 DOM 元素数量,提高速度。等首屏加载完成或者用户操作时,再去渲染剩余的页面内容。
3.7 预加载
预先加载利用浏览器空闲时间请求将来要使用的资源,以便用户访问下一页面时更快地响应。
4. 浏览器解析渲染页面
响应完成后,浏览器下载完资源,就开始解析资源生成页面了。对于前端来说,这部分内容是完全需要我们去掌控的,我们也来简单介绍一下对应的优化内容,部分内容如懒加载等上面已经提及就不再重复。
4.1 写对文档类型声明 <!DOCTYPE html>
这个声明的目的是防止浏览器在渲染文档时,切换到我们称为“怪异模式(兼容模式)”的渲染模式。“
<!DOCTYPE html>
“ 确保浏览器按照最佳的相关规范进行渲染,而不是使用一个不符合规范的渲染模式。
不写或写错文档类型声明,会浪费浏览器渲染页面的时间或引起错误排版。
4.2 CSS 放在 <head> 中
把样式表放在 <head> 中可以让页面渐进渲染,尽早呈现视觉反馈,给用户加载速度很快的感觉。
这对内容比较多的页面尤为重要,用户可以先查看已经下载渲染的内容,而不是盯着白屏等待。
如果把样式表放在页面底部,一些浏览器为减少重绘,会在 CSS 加载完成以后才渲染页面,用户只能对着白屏干瞪眼,用户体验极差。把样式表放到文档的 HEAD 部分能让页面看起来加载地更快。
4.2 把脚本放在页面底部
浏览器下载脚本时,会阻塞其他资源并行下载,即使是来自不同域名的资源,并且,没有 js 并不邮箱呈现在用户目前的内容的观感。因此,最好将脚本放在底部,以提高页面加载速度。
一些特殊场景无法将脚本放到页面底部的,可以考虑<script>的以下属性:
- defer 属性;
- HTML5 新增的 async 属性。
4.3 使用外部 JavaScript 和 CSS
外部 JavaScript 和 CSS 文件可以被浏览器缓存,在不同页面间重用,也能降低页面大小。
当然,实际中也需要考虑代码的重用程度。如果仅仅是某个页面使用到的代码,可以考虑内嵌在页面中,减少 HTTP 请求数。另外,可以在首页加载完成以后,预先加载子页面的资源。
4.4 合并和压缩 JS/CSS 等文件
通过该方法减少页面所需资源,减少请求数量,加快响应时间。现在 webpack 打包工具都已经默认实现了。
4.5 减少 DOM 操作和使用高效的事件处理
- 缓存已经访问过的元素;
- 使用 DocumentFragment 暂存 DOM,整理好以后再插入 DOM 树;
- 操作 className,而不是多次读写 style;
- 避免使用 JavaScript 修复布局;
- 减少绑定事件监听的节点,如通过事件委托(当然现在浏览器功能强大,影响不大);
- 尽早处理事件,在 DOMContentLoaded 即可进行,不用等到 load 以后。
4.6 图片优化
如何将图片变得又小又好看是一个工程师实力的体现,这里不过多赘述,大家可以查看我后文提供的资源。
4.7 使用 CND
内容分发网络(Content delivery network 或 Content distribution network)是指一种透过互联网互相连接的计算机网络系统,利用最靠近每位用户的服务器,更快、更可靠地将音乐、图片、影片、应用程序及其他文件发送给用户,来提供高性能、可扩展性及低成本的网络内容传递给用户。
动态 CDN,使用离你最近的服务器;CDN 没有 Cookie,使用 CDN 可以减少 Cookie;CND 会自动合并脚本文件等,减少请求数量;当然,使用 CND 同时也增加了一个域名,增大了同时请求数量。
总结
该文大量参考了雅虎 35 军规,增加了一些自己的理解并舍弃了一些已经过时的内容。细节内容比较少,主要是笼统地将 Web 性能优化的思路做了梳理,很多内容都值得我们去深入研究。当然其中部分内容顺序还是不佳,因为很多内容事实上是贯穿在整个过程当中的,正如 Web 性能优化是个整体,需要权衡所有冲突。希望本文可以给你一些在面试官问道你时的思路。
深入阅读 从输入 URL 到页面加载的过程?如何由一道题完善自己的前端知识体系!
本文参考:
前端性能优化之雅虎 35 条军规
前端经典面试题: 从输入 URL 到页面加载发生了什么?
MDN
维基百科