热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

要做一个驾考考试系统怎么建数据库题库就是那1000多道题批量导入数据库中

JavaBS怎么上传一个pdf文件并将里面的内容读取出来写入到数据库中求解
Java B/S  怎么上传一个pdf文件  并将里面的内容读取出来写入到数据库中            求解

4 个解决方案

#1


读取pdf可以使用poi或itext进行处理,但要实现导入的话,就要看pdf中题库是否有规律了,没规律的话基本没戏。

一般导入的是cvs或excel文件,处理起来比较方便
导入pdf格式的还真没处理过,主要还是要解析pdf文件的内容为试题,处理起来就会比较麻烦了

#2


pdf题库有规律    pdf内容是试题  标号  题目  选项   之类的东西  用什么方法解析导入数据库

#3


引用 1 楼 cgs1999 的回复:
读取pdf可以使用poi或itext进行处理,但要实现导入的话,就要看pdf中题库是否有规律了,没规律的话基本没戏。

一般导入的是cvs或excel文件,处理起来比较方便
导入pdf格式的还真没处理过,主要还是要解析pdf文件的内容为试题,处理起来就会比较麻烦了


pdf题库有规律    pdf内容是试题  标号  题目  选项   之类的东西  用什么方法解析导入数据库

#4


引用 3 楼 yx179141043 的回复:
Quote: 引用 1 楼 cgs1999 的回复:

读取pdf可以使用poi或itext进行处理,但要实现导入的话,就要看pdf中题库是否有规律了,没规律的话基本没戏。

一般导入的是cvs或excel文件,处理起来比较方便
导入pdf格式的还真没处理过,主要还是要解析pdf文件的内容为试题,处理起来就会比较麻烦了


pdf题库有规律    pdf内容是试题  标号  题目  选项   之类的东西  用什么方法解析导入数据库


读取pdf的内容,可参考下面的文章
http://kailab.blog.163.com/blog/static/189695071201131452038876/

至于怎么解析,可以直接将pdf文件的文本读取出来,然后对文本内容进行解析,几种解析方法:
(1)逐行文本解析,如行内容有标号,则识别为题目,如行内容有A、B、C、D之类的内容格式,则识别为题目的选项...;
(2)逐块文本解析,若pdf中的题目很有规律,比如每5行一题(题目1行,4个选项每行一个选项,共5行),那么处理时就可以每5行作为一块进行解析处理;
(3)使用正则表达式进行解析,编写题目的正则表达式,然后将pdf文本内容中,正则表达式匹配的内容拿出来逐个作为一个题目进行解析处理;

推荐阅读
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • Mac OS 升级到11.2.2 Eclipse打不开了,报错Failed to create the Java Virtual Machine
    本文介绍了在Mac OS升级到11.2.2版本后,使用Eclipse打开时出现报错Failed to create the Java Virtual Machine的问题,并提供了解决方法。 ... [详细]
  • t-io 2.0.0发布-法网天眼第一版的回顾和更新说明
    本文回顾了t-io 1.x版本的工程结构和性能数据,并介绍了t-io在码云上的成绩和用户反馈。同时,还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后,详细介绍了t-io 2.0.0版本的更新内容,包括更简洁的使用方式和内置的httpsession功能。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • Voicewo在线语音识别转换jQuery插件的特点和示例
    本文介绍了一款名为Voicewo的在线语音识别转换jQuery插件,该插件具有快速、架构、风格、扩展和兼容等特点,适合在互联网应用中使用。同时还提供了一个快速示例供开发人员参考。 ... [详细]
  • 1,关于死锁的理解死锁,我们可以简单的理解为是两个线程同时使用同一资源,两个线程又得不到相应的资源而造成永无相互等待的情况。 2,模拟死锁背景介绍:我们创建一个朋友 ... [详细]
  • PHP中的单例模式与静态变量的区别及使用方法
    本文介绍了PHP中的单例模式与静态变量的区别及使用方法。在PHP中,静态变量的存活周期仅仅是每次PHP的会话周期,与Java、C++不同。静态变量在PHP中的作用域仅限于当前文件内,在函数或类中可以传递变量。本文还通过示例代码解释了静态变量在函数和类中的使用方法,并说明了静态变量的生命周期与结构体的生命周期相关联。同时,本文还介绍了静态变量在类中的使用方法,并通过示例代码展示了如何在类中使用静态变量。 ... [详细]
  • 后台获取视图对应的字符串
    1.帮助类后台获取视图对应的字符串publicclassViewHelper{将View输出为字符串(注:不会执行对应的ac ... [详细]
  • 本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念,以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器,包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实,适合初学者了解Tomcat的基础知识。 ... [详细]
  • 《数据结构》学习笔记3——串匹配算法性能评估
    本文主要讨论串匹配算法的性能评估,包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库,可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n),通过随机取出长度为m的子串作为模式P,在文本T中进行匹配,统计平均复杂度。对于成功和失败的匹配分别进行测试,分析其平均复杂度。详情请参考相关学习资源。 ... [详细]
  • Nginx使用(server参数配置)
    本文介绍了Nginx的使用,重点讲解了server参数配置,包括端口号、主机名、根目录等内容。同时,还介绍了Nginx的反向代理功能。 ... [详细]
  • 本文分享了一个关于在C#中使用异步代码的问题,作者在控制台中运行时代码正常工作,但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机,但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]
  • Java序列化对象传给PHP的方法及原理解析
    本文介绍了Java序列化对象传给PHP的方法及原理,包括Java对象传递的方式、序列化的方式、PHP中的序列化用法介绍、Java是否能反序列化PHP的数据、Java序列化的原理以及解决Java序列化中的问题。同时还解释了序列化的概念和作用,以及代码执行序列化所需要的权限。最后指出,序列化会将对象实例的所有字段都进行序列化,使得数据能够被表示为实例的序列化数据,但只有能够解释该格式的代码才能够确定数据的内容。 ... [详细]
author-avatar
mobiledu2502887427
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有