Spring Data JPA 流查询方法
来源:dev.to
2024-11-20 19:51:54
0浏览
收藏
哈喽!今天心血来潮给大家带来了《Spring Data JPA 流查询方法》,想必大家应该对文章都不陌生吧,那么阅读本文就都不会很困难,以下内容主要涉及到,若是你正在学习文章,千万别错过这篇文章~希望能帮助到你!
介绍
传统上,获取大量数据可能会导致内存资源紧张,因为它通常涉及将整个结果集加载到内存中。
=> 流查询方法通过提供一种使用 java 8 streams 增量处理数据的方法来提供解决方案。这可确保任何时候只有一部分数据保存在内存中,增强性能和可扩展性。
在这篇博文中,我们将深入研究流查询方法在 spring data jpa 中的工作原理,探索它们的用例,并演示它们的实现。对于本指南,我们使用:
- ide:intellij idea(推荐用于 spring 应用程序)或 eclipse
- java 版本:17
- spring data jpa 版本:2.7.x 或更高版本(与 spring boot 3.x 兼容)
<dependency> <groupid>org.springframework.boot</groupid> <artifactid>spring-boot-starter-data-jpa</artifactid> </dependency>注意:有关更详细的示例,请访问我的 github 存储库
1.什么是流查询方式?
spring data jpa 中的流查询方法允许我们以 stream 的形式返回查询结果,而不是 list 或其他集合类型。这种方法有几个好处:
高效的资源管理:增量处理数据,减少内存开销。
延迟处理:按需获取和处理结果,非常适合分页或批处理等场景。
与函数式编程集成:流符合 java 的函数式编程特性,支持过滤、映射和收集等操作。
=> 假设我们正在开发一个电子商务应用程序并希望:
- 检索在特定日期之后下订单的所有客户。
- 过滤总金额高于特定提供金额的订单。
- 按过去 6 个月内的订单总价值对客户进行分组。
- 返回数据作为客户名称及其总订单价值的摘要。
实体
-
客户:代表客户。
@setter @getter @entity @entity(name = "tbl_customer") public class customer { @id @generatedvalue(strategy = generationtype.identity) private long id; private string name; private string email; @onetomany(mappedby = "customer", cascade = cascadetype.all, fetch = fetchtype.lazy) private list<order> orders; }
-
订单:代表客户下的订单。
@setter @getter @entity(name = "tbl_order") public class order { @id @generatedvalue(strategy = generationtype.identity) private long id; private double amount; private localdatetime orderdate; @manytoone @joincolumn(name = "customer_id") private customer customer; }
存储库
-
customerrepository 用于选择客户及其在特定日期之后下的相关订单。我们使用 stream
public interface customerrepository extends jparepository<customer, long> { @query(""" select c from tbl_customer c join fetch c.orders o where o.orderdate >= :startdate """) @queryhints( @queryhint(name = availablehints.hint_fetch_size, value = "25") ) stream<customer> findcustomerwithorders(@param("startdate") localdatetime startdate); }注意:
- join fetch 确保订单被急切加载。
- @queryhints 用于向 jpa(例如 hibernate)提供额外提示以优化查询执行。
- 前 25 条记录由应用程序获取并处理。
- 处理完这些后,将获取接下来的 25 条记录,依此类推,直到处理完所有 100 条记录。
- 此行为最大限度地减少了内存使用量,并避免一次将所有 100 条记录加载到内存中。
服务
@service @requiredargsconstructor public class customerorderservice { private final customerrepository customerrepository; @transactional(readonly = true) public map<string, double> getcustomerordersummary(localdatetime startdate, double minorderamount) { try (stream<customer> customerstream = customerrepository.findcustomerwithorders(startdate)) { return customerstream // filter customers with orders above the threshold .flatmap(customer -> customer.getorders().stream() .filter(order -> order.getamount() >= minorderamount) .map(order -> new abstractmap.simpleentry<>(customer.getname(), order.getamount()))) // group by customer name and sum order amounts .collect(collectors.groupingby( abstractmap.simpleentry::getkey, collectors.summingdouble(abstractmap.simpleentry::getvalue) )); } } }这里是处理数据的服务类,有两个参数startdate和minorderamount。正如您所看到的,我们不使用 sql 查询进行过滤,而是将所有数据作为流加载,然后通过 java 代码进行过滤和分组。
控制器
@restcontroller @requestmapping("/customers") @requiredargsconstructor public class customerordercontroller { private final customerorderservice customerorderservice; @getmapping("/orders") public responseentity<map<string, double>> getcustomerordersummary( @requestparam @datetimeformat(iso = datetimeformat.iso.date_time) localdatetime startdate, @requestparam double minorderamount ) { map<string, double> ordersummary = customerorderservice.getcustomerordersummary(startdate, minorderamount); return responseentity.ok(ordersummary); } }
测试
=> 要创建测试数据,您可以在我的源代码中执行以下脚本或自己添加。
src/main/resources/dummy-data.sql
请求:
-
开始日期: 2024-05-01t00:00:00
- 最小订单金额:100
curl --location 'http://localhost:8090/customers/orders?startdate=2024-05-01t00%3a00%3a00&minorderamount=100'回应:
- 返回总金额等于或大于 minorderamount 的所有客户。
{ "Jane Roe": 500.0, "John Doe": 150.0, "Bob Brown": 350.0, "Alice Smith": 520.0 }3. 流与列表
=> 您可以使用 intellij profiler 监控内存使用情况和执行时间。有关如何添加和测试大数据集的更多详细信息,您可以在我的 github 存储库中找到
小数据集:(10 个客户,100 个订单)
- 流:执行时间(~5ms),内存使用(低)
- 列表:执行时间(~4ms),内存使用(低)
大型数据集(10.000 个客户,100.000 个订单)
- 流:执行时间(~202ms),内存使用(中等)
- 列表:执行时间(~176ms),内存使用(高)
性能指标
metric | stream | list |
---|---|---|
initial fetch time | slightly slower (due to lazy loading) | faster (all at once) |
memory consumption | low (incremental processing) | high (entire dataset in memory) |
memory consumption | low (incremental processing) | high (entire dataset in memory) |
processing overhead | efficient for large datasets | may cause memory issues for large datasets |
batch fetching | supported (with fetch size) | not applicable |
error recovery | graceful with early termination | limited, as data is preloaded |
spring data jpa 流查询方法提供了一种优雅的方式来高效处理大型数据集,同时利用 java streams 的强大功能。通过增量处理数据,它们减少了内存消耗并与现代函数式编程范例无缝集成。
您对流查询方法有何看法?在下面的评论中分享您的经验和用例!
下一篇文章见。快乐编码!
今天关于《Spring Data JPA 流查询方法》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!
版本声明
本文转载于:dev.to 如有侵犯,请联系study_golang@163.com删除

- 上一篇
- 如何安装和优化Windows 10操作系统

- 下一篇
- 为什么在 Node 节点上用 netstat 看不到 NodePort 类型 Service 的端口?
查看更多
最新文章
-
- 文章 · java教程 | 1小时前 |
- Docker在Java中的作用与容器化解析
- 249浏览 收藏
-
- 文章 · java教程 | 1小时前 | java 反射
- Java反射在白盒测试中的关键作用解析
- 358浏览 收藏
-
- 文章 · java教程 | 1小时前 |
- 编译检查异常与运行时异常的区别
- 154浏览 收藏
-
- 文章 · java教程 | 2小时前 |
- Java中类是什么?类的组成与结构解析
- 479浏览 收藏
-
- 文章 · java教程 | 2小时前 | 自动装箱拆箱
- 自动装箱拆箱空指针怎么防?
- 124浏览 收藏
-
- 文章 · java教程 | 2小时前 |
- JavaUDP通信详解:DatagramSocket使用教程
- 150浏览 收藏
-
- 文章 · java教程 | 2小时前 | java 创建线程
- Java创建线程的三种方式解析
- 137浏览 收藏
-
- 文章 · java教程 | 3小时前 |
- JavaUDP通信教程:DatagramSocket使用详解
- 390浏览 收藏
-
- 文章 · java教程 | 3小时前 |
- Java复制文件的多种方式解析
- 266浏览 收藏
-
- 文章 · java教程 | 3小时前 | 异常处理 JVM性能
- 创建异常真的慢吗?JVM性能实测解析
- 168浏览 收藏
-
- 文章 · java教程 | 4小时前 | java 读取资源文件
- JavagetResource方法详解及使用技巧
- 393浏览 收藏
-
- 文章 · java教程 | 4小时前 | java 重载重写
- Java重载与重写有何不同
- 276浏览 收藏
查看更多
课程推荐
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
查看更多
AI推荐
-
- 茅茅虫AIGC检测
- 茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
- 120次使用
-
- 赛林匹克平台(Challympics)
- 探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
- 137次使用
-
- 笔格AIPPT
- SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
- 138次使用
-
- 稿定PPT
- 告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
- 126次使用
-
- Suno苏诺中文版
- 探索Suno苏诺中文版,一款颠覆传统音乐创作的AI平台。无需专业技能,轻松创作个性化音乐。智能词曲生成、风格迁移、海量音效,释放您的音乐灵感!
- 138次使用
查看更多
相关文章
-
- 提升Java功能开发效率的有力工具:微服务架构
- 2023-10-06 501浏览
-
- 掌握Java海康SDK二次开发的必备技巧
- 2023-10-01 501浏览
-
- 如何使用java实现桶排序算法
- 2023-10-03 501浏览
-
- Java开发实战经验:如何优化开发逻辑
- 2023-10-31 501浏览
-
- 如何使用Java中的Math.max()方法比较两个数的大小?
- 2023-11-18 501浏览