首页 > 编程语言 >java上传文件大小限制 java实现大文件上传

java上传文件大小限制 java实现大文件上传

时间:2023-09-01 18:48:39浏览次数:36  
标签:文件 java 文件大小 信息 表单 源码 接收 上传

 一. 大文件上传基础描述:

WEB框架中,对于浏览器上传文件的请求,都有自己的处理对象负责对Http MultiPart协议内容进行解析,并供开发人员调用请求的表单内容。

比如:

框架中使用类似CommonsMultipartFile对象处理表二进制文件信息。

.NET 中使用HtmlInputFile/ HttpPostedFile对象处理二进制文件信息。

优点:使用框架内置对象可以很方便的处理来自浏览器的MultiPart二进制信息请求,协议分析操作不用开发人员参与。

缺点:其接收数据包过程完全被封闭在框架内置对象中,直到本次请求信息处理(接收)完毕后,才允许开发人员从接口调取表单及文件内容。上传过程中的进度信息无法访问,无法上传大尺寸文件(比如几百兆以上的大文件二进制信息)。

目标:我们要在JAVA WEB框架中,依靠Filter过滤器的能力,实现不依靠框架内置对象,从浏览器请求字节流中解析MultiPart协议,取得本次用户请求的所有信息,包括多二进制文件信息及其他表单项信息。用户上传的文件尺寸将不受限制。而且在传输过程中,我们可以实时获得当前传输进度信息。

注:.NET框架中可依靠IHttpModule接口对象达到JAVA框架中Filter的能力,本文不做描述。

 

1.1 普通Post请求协议及MultiPart协议

为本次请求的内容长度字节,本例729366

为multipart/form-data,二进制多段表单

为多段表单信息的分隔符,这里为-----------------------------------7dflaxxxxxxxxxxx

name="file1",为本文件表单的单元名称,filename="untitled2.png"为该文件名,content-type: image/png为内容区文件格式

最下方的红框中为该文件的二进制信息。

MultiPart与普通的POST在协议结构上有明显区别,所以我们接下来的工作就是按字节流的方式接收MultiPart请求数据包,并对其进行分析。

1.2 可实时获取当前传输进度信息

Http头中获取本次请求内容区长度,即字节总量。由于我们可以从Filter中按字节单位接收来自浏览器的数据包,所以我们也能实时的获得当前接收字节量。因此我们可以实时的获得当前传输进度百分比,用当前接收的字节量除以接收时间即可获得当前传输率(字节/秒)。

  由此,我们可获得以下传输过程信息:

本次数据包总字节数
当前已接收的字节数
本次请求发起时间
当前进度节点时间
当前进度状态(初始状态,接收数据中,接收数据完毕等)
 

Id做标识(progId),在SERVER端放入Java框架中的一个公有内存区即可,在浏览器中我们可使用JS以一定时间间隔访问SERVER中的某一URL,以进度Id为标识,从SERVER的公有内存区获得当前请求的进度信息。取得信息后,即可实时操控进度条运行。

Java框架中,公有内存区为ServletContext对象(例,使用setAttribute方法,以键值对的形式将单个用户进度信息存入HashMap对象)。在.NET框架中,公有内存区为HttpApplicationState对象。

注:向公有内存区(HashMap对象)写操作时要进行同步锁控制(synchronized),因为公有内存区可能会产生多用户(多线程)并发操作的现象。

二. 问题点分析:

2.1 分段接收:

MultiPart数据包,字节数可能会很大(1G甚至以上),为了获取实时进度信息,以及内存开销控制,我们需要将接收过程分成多段处理,即将数据包分段循环接收(例:每次循环只接收64K数据,期间即可更新当前的进度信息)。

 

2.2 完整数据包解析?/部分数据包实时解析?

  普通的解析协议方式是,将数据包全部接收后,再进行解析。以下有两种方式实现。

MultiPart数据量来说,这种方式会占用大量内存(比如一个用户正在上传1G的数据,那么内存区必须接收到全部1G数据后才能进行解析,如果多用户同时操作会导致服务器崩溃),这种方式不可用。

  数据包全部写入文件后再加载入内存:只能解决在接收过程中开启小内存并分段写入文件,当数据全部写入文件后,还需要加载入内存中进行整体协议分析,也会突发性导致内存开销过大,导致服务器崩溃,这种方式也不可取。

(比如64K)即可完成任务。

  但这种方式会面临本次接收的分段信息内含有多个表单项信息及剩余的不完整表单信息,或本次接收的分段信息实际上不包含任何表单信息,仅仅是大文件二进制信息的一个片段。所以,这种方式在编码上会带来一定的复杂度。

 

​编辑

 

 

三. 源码解析

3.1 项目构成要点

 

Spring框架来实现“大文件传输”功能,要点设计结构图如下:

​编辑

Filter对象:

MultiPart原始数据的Filter,用以在Spring内置对象之前接收用户请求。需要在Web.xml中进行配置,Web启动后,该Filter即启动,当用户请求到来时需要判断该MultiPart数据信息是否合法,接收并进行解析。

ServletInputStream/BufferedInputStream对象:

read进行分段循环接收。 

getBoundarySectFromBuf()函数:

Form表单信息,或者部分表单信息,或者二进制文件片段信息。对于表单信息分析后填充表单数据结构,对于二进制文件信息需要写文件。该函数需要完成边接收边解析边写文件的重要工作。

ProgressInfo对象:

,描述了一次上传请求的进度信息。该对象会用来被客户端轮询请求,以获得当前传输大文件过程中的进度信息。

FormPart对象及listFormPart集合:

对于单个Form表单的描述。listFormPart为本次请求的全部表单描述集合。即供后续代码调用的全部表单项内容。

Controller层getProgInfo()处理函数:

Progesss ID对应的进度信息对象ProgressInfo,以XML的形式返回给浏览器。该函数会被客户端轮询请求。

multi-form.jsp页面:

(Input,Textarea,File等)。该页面还将显示用于本次传输的进度条,传输状态,传输率等信息。页面中进度信息将使用js向服务器进行周期性轮询请求,获得及显示。

upload-result.jsp页面:

Input表单,及File表单信息。

3.2 重点模块解析

3.2.1 服务器端:

3.2.2 浏览器端:

本节可参考示例代码中注释)

四. 扩展及相关

4.1断点续传:

HTTP协议中的Content-Range关键字(在HTTP Header中),向服务器发请求,服务器接收请求后,查看Content-Range属性的文件偏移量,从而发送后续文件二进制信息给浏览器。比如网络蚂蚁类的下载软件,即开启多线程利用Content-Range关键字将某个网络资源分布接收,最终整合保存在本地。

WEB中我们所使用的上传文件断点续传功能,大多是需要下载ActiveX控件来实现。即相当于在本地下载了一个应用程序,同服务器间文件传输协议也不用使用HTTP协议,可自定义协议完成。

HTTP协议进行上传文件的断点续传目前还比较少,据说利用Ajax 中的Slice方法把本地文件分成多个HTTP包POST给服务器,而服务器需要将这些包接收后并整合来实现。操作方式比较复杂,本人没尝试过,有感兴趣的朋友可深入探讨。

4.2本项目待完善要点:

JS框架(Ext JS, JQuery)等都需要更深入的支持。

Filter的配置信息,对文件上传信息进行核查或过滤,比如不能上传某些扩展名的文件,文件上传尺寸控制,另存后的文件名唯一性控制等也都需要更细致的描述。

附件文件列表:

MultiPart数据包信息

JS脚本

upload_result.jsp:用于显示上传结果的表单项集合页面

,Filter。用来处理全部上传过程。

Controller层的Spring Bean对象,用来获取当前的进度信息。

​编辑

​编辑

​编辑

​编辑

 

视频演示:

 

windows控件安装,,linux-deb控件包安装,linux-rpm控件包安装,php7测试,php5测试,vue-cli-测试,asp.net-IIS测试,asp.net-阿里云(oss)测试,asp.net-华为云(obs)测试,jsp-springboot测试,ActiveX(x86)源码编译,ActiveX(x64)源码编译,Windows(npapi)源码编译,macOS源码编译,Linux(x86_64)源码编译,Linux(arm)源码编译,Linux(mips-uos)源码编译,Linux(mips-kylin-涉密环境)源码编译,sm4加密传输,压缩传输,

示例下载地址

源代码文档

asp.net源码下载jsp-springboot源码下载jsp-eclipse源码下载jsp-myeclipse源码下载php源码下载csharp-winform源码下载vue-cli源码下载c++源码下载

详细配置信息及思路

标签:文件,java,文件大小,信息,表单,源码,接收,上传
From: https://www.cnblogs.com/songsu/p/17672644.html

相关文章

  • 【校招VIP】java语言考点之关键字static
    考点介绍:static考点是面试的高频考点,一般从容易到难提问,比如从static的含义和理解、到JVM的存储或者到线程安全性,再到单例模式等。答案详情解析和文章内容可扫下方海报二维码或点击链接即可查看!一、考点题目1、在java中,类Cat里面有个公有方法sleep(),该方法前有static修饰,则可......
  • Java错题记录1
    下列对接口的说法,正确的是()A:接口与抽象类是相同的概念B:若要实现一个接口为普通类则必须实现接口的所有抽象方法C:接口之间不能有继承关系D:一个类只能实现一个接口 正确答案:B A接口与抽象类是不同的概念。抽象类是用于捕捉子类的通用特性,接口是抽象方法......
  • Java-泛型
    1.泛型介绍泛型的本质是参数化类型,这样在具体使用的时候可以临时确定是什么类型。泛型可以应用在类、接口、方法、集合中,被称为泛型类、泛型接口、泛型方法。Java在语法上支持泛型,但是在编译阶段会进行所谓的“类型擦除”(TypeErasure),将所有的泛型表示(尖括号中的内容)......
  • 深入解析 Java 抽象工厂模式:创建跨平台图形绘制工具的设计与实现
    深入解析Java抽象工厂模式:创建跨平台图形绘制工具的设计与实现抽象工厂模式(AbstractFactoryPattern)是Java中一种常用的设计模式,它属于创建型模式的一种。该模式提供了一种创建一系列相关或相互依赖对象的接口,而无需指定具体实现类。在本文中,我们将详细介绍抽象工厂模式的概......
  • Java:commons-codec实现byte数组和16进制字符串转换
    (目录)commons-codec文档https://commons.apache.org/proper/commons-codec/https://mvnrepository.com/artifact/commons-codec/commons-codec坐标<dependency><groupId>commons-codec</groupId><artifactId>commons-codec</artifact......
  • LatexEasy | JavaScript集成公式编辑器
    在线示例https://latexeasy.com/en/demo/sdk使用方式基础使用方式<iframeid="liveEditor"frameborder="0"style="width:100%;height:400px;border:0;outline:none;"src="https://latexeasy.com/editor"></if......
  • Java之关闭进程端口
    我们运行Java程序,经常会遇到端口号被占用的情况。关闭的命令如下:1.查找进程号(如查找8903端口对应的进程号)netstat-ano|findstr89032.根据进程号杀掉端口(如杀掉进程号为42988的进程)taskkill/f/pid42988执行效果如下图 ......
  • Java 迪杰斯特拉 算法实现
    在这里记录下自己写的迪杰斯特拉代码。思路本质是贪心算法:开始时设定两个集合:S,T;S存入已经遍历的点,T存所有未遍历的点;首先将起点放入S中,更新T中所有节点的权重(和起点联通的节点更新权重,其他节点权重设为无穷大);在T中寻找权重最低的点(假设是M点),将M点放入S中,同时更新T里所有节......
  • Java是一种广泛使用的面向对象编程语言
    Java是一种广泛使用的面向对象编程语言,具有以下特性:平台无关性:Java语言编写的程序可以在不同的操作系统和硬件平台上运行,因为Java语言通过Java虚拟机(JVM)实现了平台无关性。面向对象:Java是一种完全面向对象的编程语言,支持封装、继承和多态等面向对象的基本特性。强类型语言:Java是一......
  • Java Swing查看字体和设置全局字体
    查看支持的字体以下代码用于运行时在控制台打印支持的字体GraphicsEnvironmentgEnv=GraphicsEnvironment.getLocalGraphicsEnvironment();finalStringAvailableFontFamilyNames[]=gEnv.getAvailableFontFamilyNames();Stream.of(AvailableFontFamilyNames).forEach(Sys......