当前位置: 开发笔记 > 编程语言 > 正文

web缓存分享

作者： | 来源：互联网 | 2023-10-12 01:11

1.用户层DNS浏览器DNS查找顺序：浏览器DNS缓存-本地系统DNS缓存-本地计算机HOSTS文件-ISPDNS缓存-递归搜索浏览器DNS缓存浏览器会按

1.用户层

1. DNS

浏览器DNS查找顺序&＃xff1a;浏览器DNS缓存->本地系统DNS缓存->本地计算机HOSTS文件->ISP DNS缓存->递归搜索

1. 1. 浏览器DNS缓存

浏览器会按照一定频率缓存DNS记录&＃xff0c;&＃xff08;浏览器维护一张域名与 IP 地址的对应表&＃xff09;。

注&＃xff1a;可以通过 chrome://net-internals/#dns 查找目前Chrome中的DNS缓存。

1. 1. 本地DNS缓存

如果浏览器缓存中找不到需要的DNS记录&＃xff0c;那就去操作系统找。

注&＃xff1a;可以在终端通过ipconfig/displaydns 查找目前系统中的 DNS 缓存。

可以通过ipconfig/flushdns清除本地dns缓存

1. 1. 操作系统DNS缓存

本地HOSTS文件: Windows系统中位于C:\Windows\System32\drivers\etc

1. 1. ISP的DNS服务器

ISP(互联网服务提供商、联通电信移动)&＃xff0c;ISP有专门的DNS服务器应对DNS查询请求

1. 1. 根服务器

ISP的DNS服务器还找不到的话&＃xff0c;它就会向根服务器发出请求&＃xff0c;进行递归查询

1.1.5.1 DNS服务器查询方式&＃xff1a;

&＃xff08;1&＃xff09;递归查询

递归查询是一种DNS 服务器的查询模式&＃xff0c;在该模式下DNS 服务器接收到客户机请求&＃xff0c;

必须使用一个准确的查询结果回复客户机。

如果DNS 服务器本地没有存储查询DNS 信息&＃xff0c;那么该服务器会询问其他服务器&＃xff0c;并将返回的查询结果提交给客户机。

客户机和服务器之间的查询是递归查询

是递归查询告诉客户机IP

&＃xff08;2&＃xff09;迭代查询

DNS 服务器另外一种查询方式为迭代查询&＃xff0c;DNS 服务器会向客户机提供其他能够解析查询请求的DNS 服务器地址&＃xff0c;

当客户机发送查询请求时&＃xff0c;DNS 服务器并不直接回复查询结果&＃xff0c;而是告诉客户机另一台DNS 服务器地址&＃xff0c;

客户机再向这台DNS 服务器提交请求&＃xff0c;依次循环直到返回查询的结果为止。

拿juejin.im举例如何进行递归查询&＃xff1a;

1.LDNS向 Root Name Server&＃xff08;根域名服务器&＃xff0c;如com、net、im 等的顶级域名服务器的地址&＃xff09;发起请求&＃xff0c;此处&＃xff0c;Root Name Server 返回 im 域的顶级域名服务器的地址&＃xff1b;

2.LDNS 向 im 域的顶级域名服务器发起请求&＃xff0c;返回 juejin.im 域名服务器地址&＃xff1b;

3.LDNS 向 juejin.im 域名服务器发起请求&＃xff0c;得到 juejin.im 的 IP 地址&＃xff1b;

1. 浏览器

浏览器缓存机制&＃xff1a;

可以认为&＃xff0c;浏览器里有一个专门存放缓存规则的一个数据库&＃xff0c;也可以说是一个映射表&＃xff0c;把缓存资源信息&＃xff0c;同电脑磁盘中的实际文件的地址&＃xff0c;对应起来

浏览器第一次请求资源时图解&＃xff1a;

注意&＃xff1a;缓存规则从响应头里边获取

用户行为对缓存的影响&＃xff1a;

谷歌浏览器查看缓存文件&＃xff1a;

谷歌浏览器URL中输入chrome://version按下回车键&＃xff0c;chrome浏览器中会显示个人资料路径&＃xff0c;复制该路径&＃xff0c;缓存存储在Cache和Code Cache目录下。

图解一&＃xff1a;

图解二&＃xff1a;

1. 1. H5新特性&＃xff1a;DNS Prefetch&＃xff08;预获取&＃xff09;

即 DNS 预获取&＃xff0c;是前端优化的一部分。一般来说&＃xff0c;在前端优化中与 DNS 有关的有两点&＃xff1a;

减少 DNS 的请求次数
进行 DNS 预获取

典型的一次 DNS 解析需要耗费 20-120 毫秒&＃xff0c;减少DNS解析时间和次数是个很好的优化方式。DNS Prefetching 是让具有此属性的域名不需要用户点击链接就在后台解析&＃xff0c;而一些浏览器域名解析和内容载入是并行发生&＃xff08;而不是串行&＃xff09;。正因如此&＃xff0c;某些高延迟的域名的解析过程才不会卡住资源的加载&＃xff0c;减少用户的等待时间&＃xff0c;提升用户体验。

这样可以极大的加速&＃xff08;尤其是移动网络环境下&＃xff09;页面的加载。在某些图片较多的页面中&＃xff0c;在发起图片加载请求之前预先把域名解析好将会有至少 5% 的图片加载速度提升。

DNS Prefetch如何使用&＃xff1a;

1.信息告诉浏览器&＃xff0c;当前页面要做DNS预解析&＃xff1b;

2.使用标签来强制对DNS预解析&＃xff1b;

DNS Prefetch使用注意事项&＃xff1a;

dns-prefetch需慎用&＃xff0c;多页面重复DNS预解析会增加重复DNS查询次数&＃xff1b;

你可以通过 chrome://net-internals/#dns 查找目前系统中的 DNS 缓存和 Chrome 中使用的情况。

1. 1. 强缓存

到底什么是强缓存&＃xff1f;强在哪&＃xff1f;其实强是强制的意思。当浏览器去请求某个文件的时候&＃xff0c;服务端就在respone header里面对改文件做了缓存配置。缓存的时间、缓存类型都由服务端控制&＃xff0c;具体表现为&＃xff1a;
respone header 的cache-control&＃xff0c;常见的设置是max-age public private no-cache no-store等

如下图,
设置了cahe-control:max-age&＃61;315360000,public,immutable

注&＃xff1a;

Memory Cache&＃xff1a;内存中的缓存&＃xff0c;主要包含的是当前中页面中已经抓取到的资源,例如页面上已经下载的样式、脚本、图片等。读取内存中的数据肯定比磁盘快,内存缓存虽然读取高效&＃xff0c;可是缓存持续性很短&＃xff0c;会随着进程的释放而释放。一旦我们关闭 Tab 页面&＃xff0c;内存中的缓存也就被释放了。

计算机中的内存一定比硬盘容量小得多&＃xff0c;操作系统需要精打细算内存的使用&＃xff0c;所以能让我们使用的内存必然不多。

当我们访问过页面以后&＃xff0c;再次刷新页面&＃xff0c;可以发现很多数据都来自于内存缓存

内存缓存在缓存资源时并不关心返回资源的HTTP缓存头Cache-Control是什么值&＃xff0c;同时资源的匹配也并非仅仅是对URL做匹配&＃xff0c;还可能会对Content-Type&＃xff0c;CORS等其他特征做校验。

Disk Cache&＃xff1a;存储在硬盘中的缓存&＃xff0c;读取速度慢点&＃xff0c;但是什么都能存储到磁盘中&＃xff0c;比之 Memory Cache 胜在容量。

在所有浏览器缓存中&＃xff0c;Disk Cache 覆盖面基本是最大的。它会根据 HTTP Herder 中的字段判断哪些资源需要缓存&＃xff0c;哪些资源可以不请求直接使用&＃xff0c;哪些资源已经过期需要重新请求。并且即使在跨站点的情况下&＃xff0c;相同地址的资源一旦被硬盘缓存下来&＃xff0c;就不会再次去请求数据。

max-age表示缓存的时间是315360000秒&＃xff08;10年&＃xff09;&＃xff0c;public表示可以被浏览器和代理服务器缓存&＃xff0c;代理服务器一般可用nginx来做。immutable表示该资源永远不变&＃xff0c;但是实际上该资源并不是永远不变&＃xff0c;它这么设置的意思是为了让用户在刷新页面的时候不要去请求服务器&＃xff01;啥意思&＃xff1f;就是说&＃xff0c;如果你只设置了cahe-control:max-age&＃61;315360000,public 这属于强缓存&＃xff0c;每次用户正常打开这个页面&＃xff0c;浏览器会判断缓存是否过期&＃xff0c;没有过期就从缓存中读取数据&＃xff1b;但是有一些 "聪明" 的用户会点击浏览器左上角的刷新按钮去刷新页面&＃xff0c;这时候就算资源没有过期&＃xff08;10年没这么快过&＃xff09;&＃xff0c;浏览器也会直接去请求服务器&＃xff0c;这就是额外的请求消耗了&＃xff0c;这时候就相当于是走协商缓存的流程了&＃xff08;下面会讲到&＃xff09;。如果cahe-control:max-age&＃61;315360000,public再加个immutable的话&＃xff0c;就算用户刷新页面&＃xff0c;浏览器也不会发起请求去服务&＃xff0c;浏览器会直接从本地磁盘或者内存中读取缓存并返回200状态&＃xff0c;看上图的红色框&＃xff08;from memory cache&＃xff09;。这是2015年facebook团队向制定 HTTP 标准的 IETF 工作组提到的建议&＃xff1a;他们希望 HTTP 协议能给 Cache-Control 响应头增加一个属性字段表明该资源永不过期&＃xff0c;浏览器就没必要再为这些资源发送条件请求了。

强缓存流程&＃xff1a;

所以强缓存步骤已经很清晰了&＃xff1a;

第一次请求 a.js &＃xff0c;缓存表中没该信息&＃xff0c;直接请求后端服务器。
后端服务器返回了 a.js &＃xff0c;且 http response header 中 cache-control 为 max-age&＃61;xxxx&＃xff0c;所以是强缓存规则&＃xff0c;存入缓存表中。
第二次请求 a.js &＃xff0c;缓存表中是 max-age&＃xff0c; 那么命中强缓存&＃xff0c;然后判断是否过期&＃xff0c;如果没过期&＃xff0c;直接读缓存的a.js&＃xff0c;如果过期了&＃xff0c;则执行协商缓存的步骤了。

强缓存总结

1.cache-control: max-age&＃61;xxxx&＃xff0c;public
客户端和代理服务器都可以缓存该资源&＃xff1b;
客户端在xxx秒的有效期内&＃xff0c;如果有请求该资源的需求的话就直接读取缓存,statu code:200 &＃xff0c;如果用户做了刷新操作&＃xff0c;就向服务器发起http请求

2.cache-control: max-age&＃61;xxxx&＃xff0c;private
只让客户端可以缓存该资源&＃xff1b;代理服务器不缓存
客户端在xxx秒内直接读取缓存,statu code:200

3.cache-control: max-age&＃61;xxxx&＃xff0c;immutable
客户端在xxx秒的有效期内&＃xff0c;如果有请求该资源的需求的话就直接读取缓存,statu code:200 &＃xff0c;即使用户做了刷新操作&＃xff0c;也不向服务器发起http请求

4.cache-control: no-cache
跳过设置强缓存&＃xff0c;但是不妨碍设置协商缓存&＃xff1b;一般如果你做了强缓存&＃xff0c;只有在强缓存失效了才走协商缓存的&＃xff0c;设置了no-cache就不会走强缓存了&＃xff0c;每次请求都回询问服务端。

5.cache-control: no-store
不缓存&＃xff0c;这个会让客户端、服务器都不缓存&＃xff0c;也就没有所谓的强缓存、协商缓存了。

1. 1. 协商缓存

上面说到的强缓存就是给资源设置个过期时间&＃xff0c;客户端每次请求资源时都会看是否过期&＃xff1b;只有在过期才会去询问服务器。所以当某天&＃xff0c;客户端请求该资源时发现其过期了&＃xff0c;这是就会去请求服务器了&＃xff0c;而这时候去请求服务器的这过程就可以设置协商缓存。

触发条件&＃xff1a;

Cache-Control 的值为 no-cache &＃xff08;不强缓存&＃xff09;
或者 max-age 过期了 &＃xff08;强缓存&＃xff0c;但总有过期的时候&＃xff09;

也就是说&＃xff0c;不管怎样&＃xff0c;都可能最后要进行协商缓存&＃xff08;no-store除外&＃xff09;

虽然强缓存命中&＃xff0c;但是也有 ETag 和 Last-Modified &＃xff0c;这两个就是协商缓存的相关规则。

ETag&＃xff08;被请求变量的实体值&＃xff09;&＃xff1a;每个文件有一个&＃xff0c;改动文件了就变了&＃xff0c;可以看似md5

Last-Modified&＃xff1a;文件的修改时间

注意&＃xff1a;为什么要有etag&＃xff1f;
你可能会觉得使用last-modified已经足以让浏览器知道本地的缓存副本是否足够新&＃xff0c;为什么还需要etag呢&＃xff1f;HTTP1.1中etag的出现&＃xff08;也就是说&＃xff0c;etag是新增的&＃xff0c;为了解决之前只有If-Modified的缺点&＃xff09;主要是为了解决几个last-modified比较难解决的问题&＃xff1a;

1.一些文件也许会周期性的更改&＃xff0c;但是他的内容并不改变(仅仅改变的修改时间)&＃xff0c;这个时候我们并不希望客户端认为这个文件被修改了&＃xff0c;而重新get&＃xff1b;

2.某些文件修改非常频繁&＃xff0c;比如在秒以下的时间内进行修改&＃xff0c;(比方说1s内修改了N次)&＃xff0c;if-modified-since能检查到的粒度是秒级的&＃xff0c;这种修改无法判断(或者说UNIX记录MTIME只能精确到秒)&＃xff1b;

3.某些服务器不能精确的得到文件的最后修改时间。

每次http返回来 response header 中的 ETag和 Last-Modified&＃xff0c;在下次请求时在 request header 就把这两个带上&＃xff08;但是名字变了ETag-->If-None-Match&＃xff0c;Last-Modified-->If-Modified-Since &＃xff09;&＃xff0c;服务端把你带过来的标识&＃xff0c;资源目前的标识&＃xff0c;进行对比&＃xff0c;然后判断资源是否更改了。

这个过程是循环往复的&＃xff0c;即缓存表在每次请求成功后都会更新规则。

1. 第n次请求成功时&＃xff1a;

2. 缓存表中更新该资源的 ETag 值

3. 第n&＃43;1次请求&＃xff1a;

从缓存表中取该资源最新的ETag&＃xff0c;然后加在 request header 中, 注意变名字了&＃xff0c;由 ETag -- > If-None-Match

协商缓存流程&＃xff1a;

协商缓存步骤总结&＃xff1a;

请求资源时&＃xff0c;把用户本地该资源的 ETag 同时带到服务端&＃xff0c;服务端和最新资源做对比。

如果资源没更改&＃xff0c;返回304&＃xff0c;浏览器读取本地缓存。

如果资源有更改&＃xff0c;返回200&＃xff0c;返回最新的资源。

注意&＃xff1a;协商缓存无论如何&＃xff0c;都要向服务端发请求的&＃xff0c;只不过&＃xff0c;资源未更改时&＃xff0c;返回的只是header信息&＃xff0c;所以size很小&＃xff1b;而资源有更改时&＃xff0c;还要返回body数据&＃xff0c;所以size会大。

2.代理层

cdn缓存就是在浏览器和服务器间增加的一层缓存&＃xff0c;缓存一些html、图片、css、xml等静态资源。

无cdn&＃xff1a;

用户在浏览网站的时候&＃xff0c;浏览器能够在本地缓存网站中的图片或者其他文件的副本&＃xff0c;这样用户再次访问该网站的时候&＃xff0c;浏览器就不用再下载全部的文件&＃xff0c;减少了下载量意味着提高了页面加载的速度。

有cdn&＃xff1a;

如果中间加上一层CDN&＃xff0c;那么用户浏览器与服务器的交互如下&＃xff1a;

客户端浏览器先检查是否有本地缓存是否过期&＃xff0c;如果过期&＃xff0c;则向CDN边缘节点发起请求&＃xff0c;CDN边缘节点会检测用户请求数据的缓存是否过期&＃xff0c;如果没有过期&＃xff0c;则直接响应用户请求&＃xff0c;此时一个完成http请求结束;如果数据已经过期&＃xff0c;那么CDN还需要向源站发出回源请求(back to the source request),来拉取最新的数据。

2.1 CDN加速原理&＃xff1a;

通过动态域名解析&＃xff0c;网友的请求被分配到离自己最快的服务器。CDN服务器直接返回缓存文件或通过专线代理原站的内容。

网络加速&＃43;内容缓存&＃xff0c;有效提供访问速度

2.2 CDN缓存什么内容&＃xff1a;

缓存html、图片、css、xml等静态资源&＃xff0c;不缓存含有&＃xff1f;的动态地址、jsp、php&＃xff0c;js文件也不缓存【除非特殊设置】

缓存原站返回HTTP状态为20*或304&＃xff0c;不缓存其他状态(例如404&＃xff0c;500&＃xff0c;503)

2.3 CDN缓存的缺点&＃xff1a;

CDN的分流作用不仅减少了用户的访问延时&＃xff0c;也减少的源站的负载。但其缺点也很明显&＃xff1a;当网站更新时&＃xff0c;如果CDN节点上数据没有及时更新&＃xff0c;即便用户再浏览器使用Ctrl &＃43;F5的方式使浏览器端的缓存失效&＃xff0c;也会因为CDN边缘节点没有同步最新数据而导致用户访问异常。

扩展&＃xff1a;

推荐阅读

go
知识图谱——机器大脑中的知识库

本文介绍了知识图谱在机器大脑中的应用，以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例，说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案，如搜索关键词"Marie Curie"，会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革，不仅美国的微软必应，中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]

蜡笔小新 2023-12-14 10:06:19
function
基于layUI的图片上传前预览功能的2种实现方式

本文介绍了基于layUI的图片上传前预览功能的两种实现方式：一种是使用blob+FileReader，另一种是使用layUI自带的参数。通过选择文件后点击文件名，在页面中间弹窗内预览图片。其中，layUI自带的参数实现了图片预览功能。该功能依赖于layUI的上传模块，并使用了blob和FileReader来读取本地文件并获取图像的base64编码。点击文件名时会执行See()函数。摘要长度为169字。 ... [详细]

蜡笔小新 2023-12-14 17:06:58
function
PHP图片截取方法及应用实例

本文介绍了使用PHP动态切割JPEG图片的方法，并提供了应用实例，包括截取视频图、提取文章内容中的图片地址、裁切图片等问题。详细介绍了相关的PHP函数和参数的使用，以及图片切割的具体步骤。同时，还提供了一些注意事项和优化建议。通过本文的学习，读者可以掌握PHP图片截取的技巧，实现自己的需求。 ... [详细]

蜡笔小新 2023-12-14 16:44:09
function
如何去除Win7快捷方式的箭头

本文介绍了如何去除Win7快捷方式的箭头的方法，通过生成一个透明的ico图标并将其命名为Empty.ico，将图标复制到windows目录下，并导入注册表，即可去除箭头。这样做可以改善默认快捷方式的外观，提升桌面整洁度。 ... [详细]

蜡笔小新 2023-12-14 16:17:05
hash
Java工具类库Hutool介绍及功能概述

本文介绍了Java工具类库Hutool，该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装，并提供了各种Util工具类。同时，还介绍了Hutool的组件，包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码，提高开发效率。 ... [详细]

蜡笔小新 2023-12-14 14:29:36
hash
Alink回归预测的不完善问题及期待

本文讨论了Alink回归预测的不完善问题，指出目前主要针对Python做案例，对其他语言支持不足。同时介绍了pom.xml文件的基本结构和使用方法，以及Maven的相关知识。最后，对Alink回归预测的未来发展提出了期待。 ... [详细]

蜡笔小新 2023-12-14 14:25:33
go
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
go
eclipse学习（第三章：ssh中的Hibernate）——11.Hibernate的缓存（2级缓存，get和load）

本文介绍了eclipse学习中的第三章内容，主要讲解了ssh中的Hibernate的缓存，包括2级缓存和get方法、load方法的区别。文章还涉及了项目实践和相关知识点的讲解。 ... [详细]

蜡笔小新 2023-12-14 00:31:35
java
高校天文共享平台开发过程中的思考与规划

本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面，并总结了项目存在的问题，如前后端未分离、代码混乱等。作者表示希望通过记录和规划，能够理清思路，进一步完善该平台。 ... [详细]

蜡笔小新 2023-12-13 18:08:58
java
Java验证码——kaptcha的使用配置及样式

本文介绍了如何使用kaptcha库来实现Java验证码的配置和样式设置，包括pom.xml的依赖配置和web.xml中servlet的配置。 ... [详细]

蜡笔小新 2023-12-13 13:58:25
java
问题2：重新命名或者移动数据文件、日志文件到新的位置

本文讨论了在数据库打开和关闭状态下，重新命名或移动数据文件和日志文件的情况。针对性能和维护原因，需要将数据库文件移动到不同的磁盘上或重新分配到新的磁盘上的情况，以及在操作系统级别移动或重命名数据文件但未在数据库层进行重命名导致报错的情况。通过三个方面进行讨论。 ... [详细]

蜡笔小新 2023-12-13 13:02:24
java
Python连接服务器失败：使用aiohttp模拟服务器出现错误问题及解决方法

本文介绍了在使用Python中的aiohttp模块模拟服务器时出现的连接失败问题，并提供了相应的解决方法。文章中详细说明了出错的代码以及相关的软件版本和环境信息，同时也提到了相关的警告信息和函数的替代方案。通过阅读本文，读者可以了解到如何解决Python连接服务器失败的问题，并对aiohttp模块有更深入的了解。 ... [详细]

蜡笔小新 2023-12-13 12:37:59
client
CentOS 6.5安装VMware Tools及共享文件夹显示问题解决方法

本文介绍了在CentOS 6.5上安装VMware Tools及解决共享文件夹显示问题的方法。包括清空CD/DVD使用的ISO镜像文件、创建挂载目录、改变光驱设备的读写权限等步骤。最后给出了拷贝解压VMware Tools的操作。 ... [详细]

蜡笔小新 2023-12-12 18:18:49
java
如何清除Eclipse中SVN用户的设置

本文介绍了如何清除Eclipse中SVN用户的设置。首先需要查看使用的SVN接口，然后根据接口类型找到相应的目录并删除相关文件。最后使用SVN更新或提交来应用更改。 ... [详细]

蜡笔小新 2023-12-12 14:42:31
header
C#导入、导出功能

导出功能protectedvoidbtnExport(objectsender,EventArgse){用来打开下载窗口stringfileName中 ... [详细]

蜡笔小新 2023-12-12 14:34:29

Tags | 热门标签

RankList | 热门文章