缓存穿透面试问题(缓存核心知识小抄)
缓存是为了减少数据库和服务器压力而产生的,在应用层编程时需主要考虑以下几种情况:
- 客户端缓存
- 服务端缓存
- 网络缓存(CDN缓存)
客户端缓存负责减轻服务端的存储和频繁的数据请求等压力。
例如,在QQ初始阶段,只有“会员”才可以把QQ表情存储在“云端”之上,因为腾讯内部并没有庞大的存储系统存储大量的QQ表情。
虽然现在腾讯已经取消了只有“会员”才可以存储QQ表情的限制,但是大部分QQ表情仍然默认存储在本地客户端。
客户端缓存大致可分为以下几种:
- 客户端本地文件缓存,包括图片、.txt文件、.doc文件等。
- 客户端本地HTTP、cookie等浏览器缓存。
- 客户端注册表。
- 客户端微型数据库(SQLite)。
- 客户端本地计算机内存。
服务端缓存主要是为了减少数据库压力和外部服务接口的压力,这也是实际编程中最常用的手段。
除减少数据库的压力外,缓存返回数据的响应速度比数据库要快。另外,尽可能不调用外部接口,因为外部接口无论WebSocket、WebService,还是HTTP,其响应速度都是不可控的。如果外部接口响应时间过长,也会影响自身性能。
服务端缓存大致分为以下几种:
- 容器缓存,如Tomcat、Nginx、JBoss、Servlet等。
- 中间件缓存,如MongoDB、Elasticsearch、Redis、RocketMQ、Kafka、ZooKeeper等。
- JDK缓存,如磁盘缓存、堆内缓存、堆外缓存等。
- 页面静态化缓存,如FreeMaker、Thymeleaf等。
- 文件管理,如FastDFS等。
01
缓存的命中率
缓存的命中率指的是“缓存查询的次数”与“总查询次数”的比值。在多级缓存下,可以调研每一级缓存的命中率,以便调整代码。若某缓存命中率过低,则很可能是缓存穿透问题。02
缓存回收方式
- 基于时间:当某缓存超过生存时间时,则进行缓存回收。或者当某缓存最后被访问后超过某时间仍然没有被访问,则进行缓存回收。
- 基于空间:当缓存超过某大小时,则进行缓存回收。
- 基于容量:当缓存超过某存储条数时,则进行缓存回收。
- 基于引用:软引用和弱引用缓存会在JVM堆内存不足时进行缓存回收。
03
缓存回收策略
- 先进先出(First In First Out,FIFO):一种简单的淘汰策略,缓存对象以队列的形式存在,如果空间不足,就释放队列头部的(先缓存)对象,一般用链表实现。
- 最近最久未使用(Least Recently Used,LRU):是根据访问的时间先后进行淘汰的,如果空间不足,就释放最久没有被访问的对象(上次访问时间最早的对象)。
- 最近最少使用(Least Frequently Used,LFU):根据最近访问的频率进行淘汰,如果空间不足,就释放最近访问频率最低的对象。
04
缓存的设计模式
(1)Cache Aside模式:首先读取缓存中的数据,若缓存没有命中,则读取DB。当DB需要更新时,直接删掉缓存中的数据。由于实现简单,因此是最常用的一种设计模式,适用于读操作多的情况。(2)Read/Write through模式:在读取时先到缓存中查询数据是否存在。如果存在,则直接返回。如果不存在,则由缓存组件负责从数据库中同步加载数据,此数据永不过期。在写入时,先查询要写入的数据在缓存中是否存在。如果存在。则更新缓存中的数据,并且由缓存组件把数据同步更新到数据库中。Read/Write through模式初步屏蔽了底层数据库操作,但是当把数据从缓存组件写入DB时,有可能出现异常无法正确写入的情况。因而需要谨慎记录时间戳,以便跟踪维护处理数据。该方案适合对持久性要求较低的业务场景。
(3)Write Behind Caching(Write Back)模式:Write Behind Caching模式属于Read/Write through模式的进阶版,完全不考虑DB,增删改查全部通过缓存进行处理。如果读取不到数据,则直接认为该数据不存在,服务器会定期把缓存中的数据存储到DB中。一般高并发应用程序最常用的是Write Behind Caching设计模式,它是性能最好的设计模式,但是实现较为复杂,一旦服务器宕机则有可能导致大量数据丢失。
05
缓存测试应涵盖的内容
(1)当前程序是否有可能出现缓存穿透、缓存击穿、缓存雪崩等常见问题。(2)缓存是否设置了最大位数及时间等功能,是否会出现内存溢出的现象。
(3)缓存能够节省各数据源多少比重的读取,例如进程内缓存节省了多少读取Redis的比重,Redis缓存节省了多少读取磁盘缓存的比重,磁盘缓存节省了多少读取MySQL的比重。
(4)App在无网或弱网环境下,是否可以正常打开及使用。例如网易云音乐在没有网络的情况下可以听一些本地缓存的歌曲。
(5)App在弱网转正常网络之后,缓存是否能被正常覆盖。
(6)各级缓存与数据库是否能够保持数据一致性,是否包含脏读、不可重复读等相关问题。
(7)缓存是否能够被手动删除或刷新,若遇到紧急状况是否能够进行可逆性操作。
(8)缓存的回收策略、回收方式等内容是否正常生效。
▼
本书摘自《高性能Java架构:核心原理与案例实战》一书,欢迎阅读此书了解更多高性能Java架构的内容。
▊《高性能Java架构:核心原理与案例实战》
张方兴 著
本书是按照程序设计与架构的顺序编写的,共13章。
第1章介绍学习高性能Java应了解的核心知识,为前置内容。
第2章和第3章讲解在编写代码之前,如何高效地为MySQL填充亿级数据,并对MySQL进行基准测试,以便在之后编程时有所比较。
第4章讲解在编写代码的过程中如何优化代码,使代码更高效。
第5章和第6章讲解在写好代码之后如何测试并优化场景响应速度。
第7章和第8章讲解在程序上线执行一段时间之后如何对MySQL进行主从复制、分库分表。
第9章讲解如何通过Prometheus和Grafana监控MySQL节点。
第10章和第11章讲解如何通过堆内缓存、堆外缓存(MapDB)和磁盘缓存解决MySQL数据库性能不佳的问题。
第12章讲解如何使用分布式锁Redisson解决实际应用中常见的数据一致性问题。
第13章简要介绍Java中的常见架构与工具。
本书不仅适合Java初学者、刚入行的编程人员,也适合对高性能、高并发感兴趣的程序员。
(京东满100减50,快快扫码抢购吧!)
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。