浏览器HTTP缓存原理分析
2015-10-26 22:20:11 | 来源:玩转帮会 | 投稿:佚名 | 编辑:小柯

原标题:浏览器HTTP缓存原理分析

以前项目中遇到了很多浏览器缓存相关的问题,也在网上查过资料,搞过服务器的配置,来确保客户端加载服务器照片的速度和照片有效性。最近仔细看了下http协议中和缓存相关的一些属性,总结一下。

浏览器缓存原理文字版描述

①浏览器第一次访问服务器照片 /index.html

在浏览器中没有缓存文件,直接向服务器发送请求。

服务器返回 200 OK,实体中返回 index.html文件内容,并设置一个缓存过期时间,一个文件修改时间,一个根据index.html内容计算出来的实体标记Entity Tag,简称Etag。

浏览器将/index.html路径的请求缓存到本地。

②浏览器第二次访问服务器照片 /index.html

由于本地已经有了此路径下的缓存文件,所以这一次就不直接向服务器发送请求了。

首先,进行缓存过期判断。浏览器根据①中设置缓存过期时间判断缓存文件是否过期。

情景一:若没有过期,则不向服务器发送请求,直接使用缓存中的结果,此时我们在浏览器控制台中可以看到 200 OK(from cache) ,此时的情况就是完全使用缓存,浏览器和服务器没有任何交互的。

情景二:若已过期,则向服务器发送请求,此时请求中会带上①中设置的文件修改时间,和Etag

然后,进行照片更新判断。服务器根据浏览器传过来的文件修改时间,判断自浏览器上一次请求之后,文件是不是没有被修改过;根据Etag,判断文件内容自上一次请求之后,有没有发生变化

情形一:若两种判断的结论都是文件没有被修改过,则服务器就不给浏览器发index.html的内容了,直接告诉它,文件没有被修改过,你用你那边的缓存吧—— 304 Not Modified,此时浏览器就会从本地缓存中获取index.html的内容。此时的情况叫协议缓存,浏览器和服务器之间有一次请求交互。

情形二:若修改时间和文件内容判断有任意一个没有通过,则服务器会受理此次请求,之后的操作同①

我的文字表达能力可能有限,为了尽量把这个流程描述清楚一点,下面

一图以蔽之

浏览器 HTTP 缓存原理分析 - 技术文摘 | 玩赚乐 1

浏览器 HTTP 缓存原理分析 - 技术文摘 | 玩赚乐 2

缓存相关首部字段request缓存相关首部字段

浏览器 HTTP 缓存原理分析 - 技术文摘 | 玩赚乐 3

① cache-control 用来做缓存过期判断

常用指令:

no-cache 不直接使用缓存,始终向服务器发起请求
max-age 缓存过期时间,是一个时间数值,比如3600秒,设置为0的时候效果等同于no-cache
s-maxage 给缓存代理用的指令,对直接返回照片的server无效,当s-maxage生效时,会忽略max-age的值
only-if-cached 若有缓存,则只使用缓存,若缓存文件出问题了,请求也会出问题

②Pragma 用来做缓存过期判断

它可以取值no-cache

这是一个http1.0遗留的字段,当它和cache-control同时存在的时候,会被cache-control覆盖

③if-match / if-none-match 用来做照片更新判断

这个指令会把缓存中的Etag传给服务器,服务器用它来和服务器端的照片Etag进行对比,若不一致则证明照片被修改了,需要响应请求为 200 OK

④if-modified-since用来做照片更新判断

这个指令会把文件的上一次缓存中的文件的更新时间传给服务器,服务器判断文件在这个时间点后是否被修改,如果被修改过则需要响应请求为200 OK

response缓存相关首部字段

浏览器 HTTP 缓存原理分析 - 技术文摘 | 玩赚乐 4

① cache-control 用来设置缓存过期时间

常用指令:
no-cache 让客户端不直接使用缓存,始终向服务器发起请求,不设置默认是这个,上边截图中的请求就是省略了,所以客户端不会直接使用缓存。

max-age 缓存过期时间,是一个时间数值,比如3600秒,设置为0的时候效果等同于no-cache

s-maxage 给缓存代理用的指令,对直接返回照片的server无效,当s-maxage生效时,会忽略max-age的值

private/public 默认是private,只在一个浏览器中缓存,设置为public时缓存可被多个用户共享

② Etag用来设置根据照片内容生成的实体标签

这个值有强tag和弱tag,区别是计算方式不同,只有强tag才会在照片被更新的时候立即发生变化,请求首部中的if-match/if-none-match字段就会传回这个值给服务端

③ age

这个字段用来告诉客户端,这个response是在多久前被创建的,单位为秒,缓存服务器返回照片的时候必须创建此字段

实体首部缓存相关字段

response的head里边可能还包括实体首部,实体首部是紧跟在response首部后边的。

①last-modified-time ——用来设置照片最后修改时间

②Exprire —— 设置文件过期时间

这个字段的作用和cache-control相同,不同的是它直接指定一个缓存过期时间点,容易受客户端时间的影响。

这也是一个遗留的字段,和cache-control同时存在的时候会被后者覆盖

缓存配置的一些注意事项

① 只有get请求会被缓存,post请求不会

② Etag在照片分布在多台机器上时,对于同一个照片,不同服务器生成的Etag可能不相同,此时就会导致304协议缓存失效,客户端还是直接从server取照片。可以自己修改服务器端etag的生成方式,根据照片内容生成同样的etag。

③ 系统上线,更新照片时,可以在照片uri后边附上照片修改时间、svn版本号、文件md5 等信息,这样可以避免用户预告到缓存的旧的文件

④ 观察chrome的表现发现,通过链接或者地址栏访问,会先判断缓存是否过期,再判断缓照片是否更新;F5刷新,会跳过缓存过期判断,直接请求服务器,判断照片是否更新。

目前只能回忆起这些了,以后遇到了再补充吧~

tags:

上一篇  下一篇

相关:

Java异步回调机制实例解析

什么是回调?今天傻傻地截了张图问了下,然后被陈大牛回答道“就一个回调…”。此时千万个草泥马飞奔而过哈

Linux中df命令的11个例子

df 即“可用磁盘”(disk free),用于显示文件系统的磁盘使用情况。默认情况下 df 命令将以每块 1K 的单位

益生菌酸奶,到底有多大好处?

什么是益生菌?细菌无处不在,它们同样存在于人类体表和体腔内,形成大量微生物群,人体正常菌群种类约500-1

几分钟内就要人命的羊水栓塞,到底是什么?

这几年,随着信息的发达,越来越多的羊水栓塞案例被报道出来。2014年8月10日湘潭产妇死亡事件,在社会上引起

人类如何避免重蹈恐龙的覆辙?

在我们的地球历史上,恐龙曾是一个强盛的物种,但是它们依然没有走出地球半步,于6500万年前在一次小行星撞

到了2018年,伦敦出租车就将换成零排放的吉利TX5

2013 年,中国吉利集团以 1104 万英镑的价格收购了拥有 70 余年历史的伦敦出租车公司。也就是说,你在伦敦

5款经典时尚单品,它们的名字都从何而来?

大部分服装和鞋子的命名总是简单粗暴,经常就来自外形和功能,比如阔腿裤、高领毛衣、高跟鞋、过膝靴……

时尚品牌这样玩科技:戴眼镜看秀,以及,店里看货网上下单

Tommy Hilfiger有了一个“新玩具”。 上周,Tommy Hilfiger宣布用虚拟显示技术做了一个 VR 头戴式设备。 简

英国建筑大师的这片豪宅盖了8年,位于杭州西溪湿地公园

英国建筑大师 David Chipperfield 因在杭州造了九树公寓而在杭州小有声望。但是在国际上,让 David Chippe

姑娘们,这个冬天你需要这些这些,还有这些毛衣

秋冬季节,谁的衣橱里都少不了有几件毛衣。但相对来说,毛衣也是最不容易穿出时尚感的单品。因为材质的关系

站长推荐: