java–SpringBatch–循环读取器/处理器/写入器步骤

作者：100斤的重口味_866 | 来源：互联网 | 2023-09-07 16:29

回答根据接受的答案代码,对该代码的以下调整对我有用：//helpermethodtocreateasplitflowoutofaLi

回答

根据接受的答案代码,对该代码的以下调整对我有用：

// helper method to create a split flow out of a List of steps private static Flow createParallelFlow(List steps) { SimpleAsyncTaskExecutor taskExecutor = new SimpleAsyncTaskExecutor(); taskExecutor.setConcurrencyLimit(steps.size()); Flow[] flows = new Flow[steps.size()]; for (int i = 0; i flows[i] = new FlowBuilder(steps.get(i).getName()).start(steps.get(i)).build(); } return new FlowBuilder("parallelStepsFlow") .split(taskExecutor) .add(flows) .build(); }

编辑

我已经将问题更新为正确循环的版本,但是随着应用程序的扩展,能够并行处理很重要,而且我仍然不知道如何在运行时动态地使用javaconfig …

精炼问题：如何在运行时动态创建一个读取器 – 处理器 – 写入器,例如5个不同的情况(5个查询意味着现在配置的循环为5)？

我的LoopDecider看起来像这样：

public class LoopDecider implements JobExecutionDecider { private static final Logger LOG = LoggerFactory.getLogger(LoopDecider.class); private static final String COMPLETED = "COMPLETED"; private static final String COnTINUE= "CONTINUE"; private static final String ALL = "queries"; private static final String COUNT = "count"; private int currentQuery; private int limit; @SuppressWarnings("unchecked") @Override public FlowExecutionStatus decide(JobExecution jobExecution, StepExecution stepExecution) { List allQueries = (List) jobExecution.getExecutionContext().get(ALL); this.limit = allQueries.size(); jobExecution.getExecutionContext().put(COUNT, currentQuery); if (++currentQuery >= limit) { return new FlowExecutionStatus(COMPLETED); } else { LOG.info("Looping for query: " + allQueries.get(currentQuery - 1)); return new FlowExecutionStatus(CONTINUE); } } }

基于查询列表(HQL查询),我想要每个查询的读取器 – 处理器 – 编写器.我当前的配置如下所示：

工作

@Bean public Job subsetJob() throws Exception { LoopDecider loopDecider = new LoopDecider(); FlowBuilder flowBuilder = new FlowBuilder<>(FLOW_NAME); Flow flow = flowBuilder .start(createHQL()) .next(extractData()) .next(loopDecider) .on("CONTINUE") .to(extractData()) .from(loopDecider) .on("COMPLETED") .end() .build(); return jobBuilderFactory.get("subsetJob") .start(flow) .end() .build(); }

步

public Step extractData(){ return stepBuilderFactory.get("extractData") .chunk(100_000) .reader(reader()) .processor(processor()) .writer(writer()) .build(); }

读者

public HibernateCursorItemReader reader(){ CustomHibernateCursorItemReader reader = new CustomHibernateCursorItemReader(); reader.setSessionFactory(HibernateUtil.getSessionFactory()); reader.setUseStatelessSession(false); return reader; }

处理器

public DynamicRecordProcessor processor(){ return new DynamicRecordProcessor(); }

作家

public FlatFileItemWriter writer(){ CustomFlatFileItemWriter writer = new CustomFlatFileItemWriter(); writer.setLineAggregator(new DelimitedLineAggregator(){{ setDelimiter(TARGET_DELIMITER); setFieldExtractor(new PassThroughFieldExtractor()); }} ); return writer; }

目前,该过程适用于单个查询.但是,我实际上有一个查询列表.

我最初的想法是循环步骤并将步骤传递给查询列表,并为每个查询读取 – 进程 – 写入.这对于并行分块也是理想的选择.

但是,当我将查询列表作为参数添加到extractData步骤时,对于每个查询,我创建一个步骤,返回一个步骤列表,而不是预期的单个步骤.工作开始抱怨它需要一步而不是一系列步骤.

另一个想法是创建一个自定义MultiHibernateCursorItemReader与MultiItemResourceReader具有相同的想法,但我真的在寻找一个更开箱即用的解决方案.

@Bean public List extractData(@Value("#{jobExecutionContext[HQL]}") List queries){ List steps = new ArrayList(); for (String query : queries) { steps.add(stepBuilderFactory.get("extractData") .chunk(100_000) .reader(reader(query)) .processor(processor()) .writer(writer(query)) .build()); } return steps; }

题
如何循环步骤并将其集成到作业中？

解决方法:

不要将您的步骤,读者,处理器和作者实例化为Spring-Beans.没有必要这样做.只有你的作业实例必须是一个Spring Bean.

因此,只需从步骤,读取器,编写器和处理器创建者方法中删除@Bean和@StepScope配置,并在需要时将其实例化.

只有一个catch,你必须手动调用afterPropertiesSet().例如.：

// @Bean -> delete // @StepScope -> delete public FlatFileItemWriter writer(@Value("#{jobExecutionContext[fileName]}") String fileName){ FlatFileItemWriter writer = new FlatFileItemWriter(); writer.setResource(new FileSystemResource(new File(TARGET_LOCATION + fileName + TARGET_FILE_EXTENSION))); writer.setLineAggregator(new DelimitedLineAggregator(){{ setDelimiter(TARGET_DELIMITER); setFieldExtractor(new PassThroughFieldExtractor()); }} ); // ------- ADD!! writer.afterPropertiesSet(); return writer; }

这样,您的步骤,读取器,编写器实例将自动“步长”,因为您明确地为每个步骤实例化它们.

如果我的回答不够明确,请告诉我.然后我会添加一个更详细的例子.

编辑

一个简单的例子：

@Configuration public class MyJobConfiguration { @Autowired private JobBuilderFactory jobBuilderFactory; @Autowired private StepBuilderFactory stepBuilderFactory; List filenames = Arrays.asList("file1.txt", "file2.txt"); @Bean public Job myJob() { List steps = filenames.stream().map(name -> createStep(filename)); return jobBuilderFactory.get("subsetJob") .start(createParallelFlow(steps)); .end() .build(); } // helper method to create a step private Step createStep(String filename) { { return stepBuilderFactory.get("convertStepFor" + filename); // !!! Stepname has to be unique .chunk(100_000) .reader(createFileReader(new FileSystemResource(new File(filename)), new YourInputLineMapper())); .processor(new YourConversionProcessor()); .writer(createFileWriter(new FileSystemResource(new File("converted_"+filename)), new YourOutputLineAggregator())); .build(); } // helper method to create a split flow out of a List of steps private static Flow createParallelFlow(List steps) { SimpleAsyncTaskExecutor taskExecutor = new SimpleAsyncTaskExecutor(); taskExecutor.setConcurrencyLimit(steps.size()); List flows = steps.stream() // we have to convert the steps to a flows .map(step -> // new FlowBuilder("flow_" + step.getName()) // .start(step) // .build()) // .collect(Collectors.toList()); return new FlowBuilder("parallelStepsFlow").split(taskExecutor) // .add(flows.toArray(new Flow[flows.size()])) // .build(); } // helper methods to create filereader and filewriters public static ItemReader createFileReader(Resource source, LineMapper lineMapper) throws Exception { FlatFileItemReader reader = new FlatFileItemReader<>(); reader.setEncoding("UTF-8"); reader.setResource(source); reader.setLineMapper(lineMapper); reader.afterPropertiesSet(); return reader; } public static ItemWriter createFileWriter(Resource target, LineAggregator aggregator) throws Exception { FlatFileItemWriter writer = new FlatFileItemWriter<>(); writer.setEncoding("UTF-8"); writer.setResource(target); writer.setLineAggregator(aggregator); writer.afterPropertiesSet(); return writer; } }

推荐阅读

bit
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
bit
C#学习教程：在Console中工作但在Windows窗体中不工作的异步代码分享

本文分享了一个关于在C#中使用异步代码的问题，作者在控制台中运行时代码正常工作，但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机，但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]

蜡笔小新 2023-12-14 15:56:00
bit
Spring特性实现接口多类的动态调用详解

本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍，以及getBeansOfType方法的应用，解决了在实际工作中遇到的接口及多个实现类的问题。同时，文章还提到了SPI使用的不便之处，并介绍了借助ApplicationContext实现需求的方法。阅读本文，你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]

蜡笔小新 2023-12-14 03:24:19
main
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
jar
XML介绍与使用的概述及标签规则

本文介绍了XML的基本概念和用途，包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则，包括标签的尖括号和合法标识符的组成，标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读，读者可以对XML的基本知识有一个全面的了解。 ... [详细]

蜡笔小新 2023-12-13 17:39:50
datetime
SpringJdbcTemplate的使用详解

本文详细介绍了Spring的JdbcTemplate的使用方法，包括执行存储过程、存储函数的call()方法，执行任何SQL语句的execute()方法，单个更新和批量更新的update()和batchUpdate()方法，以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]

蜡笔小新 2023-12-13 14:27:11
datetime
org.apache.catalina.LifecycleEvent类的使用及代码示例

标题： ... [详细]

蜡笔小新 2023-12-13 11:03:10
filter
关于Linq to sql 实现模糊查询 string数组

前景：当UI一个查询条件为多项选择，或录入多个条件的时候，比如查询所有名称里面包含以下动态条件，需要模糊查询里面每一项时比如是这样一个数组条件：newstring[]{兴业银行, ... [详细]

蜡笔小新 2023-12-13 09:34:59
main
Java学习笔记之面向对象编程（OOP）

本文介绍了Java学习笔记中的面向对象编程（OOP）内容，包括OOP的三大特性（封装、继承、多态）和五大原则（单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则）。通过学习OOP，可以提高代码复用性、拓展性和安全性。 ... [详细]

蜡笔小新 2023-12-13 08:44:30
web
CSS3选择器的使用方法详解，提高Web开发效率和精准度

本文详细介绍了CSS3新增的选择器方法，包括属性选择器的使用。通过CSS3选择器，可以提高Web开发的效率和精准度，使得查找元素更加方便和快捷。同时，本文还对属性选择器的各种用法进行了详细解释，并给出了相应的代码示例。通过学习本文，读者可以更好地掌握CSS3选择器的使用方法，提升自己的Web开发能力。 ... [详细]

蜡笔小新 2023-12-14 14:37:52
main
Java高并发程序设计学习-线程安全的概念与synchronized

本文介绍了Java高并发程序设计中线程安全的概念与synchronized关键字的使用。通过一个计数器的例子，演示了多线程同时对变量进行累加操作时可能出现的问题。最终值会小于预期的原因是因为两个线程同时对变量进行写入时，其中一个线程的结果会覆盖另一个线程的结果。为了解决这个问题，可以使用synchronized关键字来保证线程安全。 ... [详细]

蜡笔小新 2023-12-13 15:43:03
process
C语言指针的应用与价值探讨与阐述

本文探讨了C语言中指针的应用与价值，指针在C语言中具有灵活性和可变性，通过指针可以操作系统内存和控制外部I/O端口。文章介绍了指针变量和指针的指向变量的含义和用法，以及判断变量数据类型和指向变量或成员变量的类型的方法。还讨论了指针访问数组元素和下标法数组元素的等价关系，以及指针作为函数参数可以改变主调函数变量的值的特点。此外，文章还提到了指针在动态存储分配、链表创建和相关操作中的应用，以及类成员指针与外部变量的区分方法。通过本文的阐述，读者可以更好地理解和应用C语言中的指针。 ... [详细]

蜡笔小新 2023-12-13 15:02:30
stream
java 模拟get post请求_Java后台模拟发送http的get和post请求，并测试

个人学习使用：谨慎参考1Client类importcom.thoughtworks.gauge.Step;importcom.thoughtworks.gauge.T ... [详细]

蜡笔小新 2023-12-13 14:20:23
stream
HDFS2.x新特性

一、集群间数据拷贝scp实现两个远程主机之间的文件复制scp-rhello.txtroothadoop103:useratguiguhello.txt推pushscp-rr ... [详细]

蜡笔小新 2023-12-13 13:52:40
main
[大整数乘法] java代码实现

本文介绍了使用java代码实现大整数乘法的过程，同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率，并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]

蜡笔小新 2023-12-13 11:21:32

100斤的重口味_866

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章