Java从url链接下载文件

时间：2022-08-23 20:00:23浏览次数：141

标签：Java String url inputStream File new 链接 conn

最近需要测试部分下载接口，于是便写了一个这个代码，通过Java编码实现从URL下载文件

import org.apache.commons.lang.StringUtils;
import java.io.*;
import java.net.*;

public class DownloadsFile {

    /**
     * 从Url中下载文件
     *
     * @param urlStr url的路径
     * @throws IOException
     */
    public static void downloadByUrl(String urlStr, String savePath) {

        try {
            URL url = new URL(urlStr);
            HttpURLConnection conn = (HttpURLConnection) url.openConnection();
            //设置超时间为5秒
            conn.setConnectTimeout(5 * 1000);
            //防止屏蔽程序抓取而返回403错误
            conn.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");
            //设置部分请求头信息，根据自己的实际需要来书写，不需要的也可以删掉
            conn.setRequestProperty("api_token","Bearer_");
            conn.setRequestProperty("Cookie","XXL_JOB_LOGIN_IDENTITY=");
            //得到输入流
            InputStream inputStream = conn.getInputStream();
            //获取自己数组
            byte[] getData = readInputStream(inputStream);
            //文件保存位置
            File saveDir = new File(savePath);
            if (!saveDir.exists()) { // 没有就创建该文件
                saveDir.mkdir();
            }
            //获取文件名及后缀
            String headerField = conn.getHeaderField("Content-Disposition");
            String[] split = headerField.split("\"");
            String fileName = URLDecoder.decode(split[1], "utf-8");
						//开始写入
            File file = new File(saveDir + File.separator + fileName);
            FileOutputStream fos = new FileOutputStream(file);
            fos.write(getData);
            fos.close();
            inputStream.close();
            System.out.println("the file: " + url + " download success");
        } catch (Exception e) {
            e.printStackTrace();
        }

    }

    /**
     * 从输入流中获取字节数组
     *
     * @param inputStream
     * @return
     * @throws IOException
     */
    private static byte[] readInputStream(InputStream inputStream) throws IOException {
        byte[] buffer = new byte[4 * 1024];
        int len = 0;
        ByteArrayOutputStream bos = new ByteArrayOutputStream();
        while ((len = inputStream.read(buffer)) != -1) {
            bos.write(buffer, 0, len);
        }
        bos.close();
        return bos.toByteArray();
    }

    /**
     * 若URL为https://www.w3school.com.cn/example/xmle/note.xml这种
     * 则可以使用如下的方法，从下载路径中分割出文件的名字及后缀
     * 若为另一种http://10.10.101.101:8080/open/download/45
     * 需要从响应头中获取，具体看代码
     * @param url
     * @return
     */
    private static String getFileName(String url) {
        return StringUtils.substringAfterLast(url, "/");

    }

    public static void main(String[] args) {
        try {
            String filePath = "https://docs.spring.io/spring-framework/docs/4.2.0.RC1/spring-framework-reference/pdf//spring-framework-reference.pdf";
            filePath = "https://www.w3school.com.cn/example/xmle/note.xml";
            filePath="http://10.10.101.101:8080/open/download/45";
            downloadByUrl(filePath, "Documents");
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

注：正常直接利用conn.getHeaderField("Content-Disposition")获取到的响应头信息格式是

Content-Disposition: attachment; filename="%A7%84%E8%8C%83-20220715.docx"

但是只需要filename部分，且filename编码乱码，因此首先使用字符串的分割方法将filename分割出来：

String.split("\"")

分割之后的数据又因为上传时起编码的问题，会是乱码，使用：

URLDecoder.decode()

将编码后的中文再解码，便可以得到原始的文件格式。

标签：Java,String,url,inputStream,File,new,链接,conn
From： https://www.cnblogs.com/jiliangqian/p/16617593.html

4.超链接、图片、音频、视频
1.超链接：<a>·href：链接的地址·title：鼠标放上去显示的文字·target：_self在当前窗口打开（默认值）、_blank在新窗口打开、_parent把文档载入父窗口或包含了超链接引用的框......
【Java基础】数组中的异常：下标越界和空指针异常
编译时都不会报错。1.数组下标越界java.lang.ArrayIndexOutOfBoundsException//下标越界int[]arr=newint[]{1,2,3,4,5};for(inti=0;......
【Java基础】操作数组的工具类Arrays
1.常用方法方法描述booleanequals(int[]a,int[]b)判断两个数组是否相等，顺序不一样也返回falseStringtoString(int[]a)输出数组信息voidfill(int[]......
跟狂神学Java Day1
WINDOWS10的四种截屏快捷键简介经过测试得出四种有效方法：截取部分屏幕快捷键为Ctrl+alt+A或Ctrl+shift+Xsave保存为图片地址Markdown学习Day1标题：标题二级标题三级......
【Java基础】数组中的常见算法：二分查找算法
1.实现二分查找算法要求数组必须是有序的。把中间的值和要查询的值进行比较，相等则返回索引下标arr[middle]>number，则让尾索引等于middle-1，arr[middle]<number，则让开始......
eureka 出现Failed to configure a DataSource: 'url' attribute is not specified an
首选要声明一下SpringBoot版本和SpringCloud的版本要兼容的参考官网：https://spring.io/projects/spring-cloud#overview我使用的版本是springboot2.3.9.RELEASEsprin......
JavaScript基础回顾知识点记录6-操作元素样式和事件对象（介绍基本使用）
js中操作元素样式通过js修改元素内联样式（设置和读取的都是内联样式）获取当前元素显示的样式<html> <head> <metacharset="utf-8"> <title></title> </head> <......
Java: 为Word文档添加水印
Java:为Word文档添加水印添加水印是文档操作中一个非常实用的功能，通过给文档添加指定文字或图片水印既可以标识文档的状态，也可以维护文档版权，丰富其外观。在这篇文章中，我......
十年老程序员：C、Python、Java 不可兼得，专心学好一门编程语言就行！
序言哈喽兄弟萌，很多铁铁在刚开始学编程的时候，总是避免不了看到某些哗众取宠的博主发的视频或者文章，说建议同时学好几门语言，一尝试发现，同时学好几个编程语言确实没有压......
JavaScript之Object.assign()方法详解
Object.assign()方法用于将所有可枚举属性的值从一个或多个源对象复制到目标对象。它将返回目标对象。语法：Object.assign(target,...sources)target：目标对象。sourc......

Java从url链接下载文件

相关文章

赞助商

阅读排行