首页 > 编程语言 >java 下载网络图片

java 下载网络图片

时间:2023-02-15 12:05:20浏览次数:51  
标签:document java String url import null 下载 图片

 

java 如何下载网络图片

CreateTime--2017年9月30日11:18:19

Author:Marydon

说明:根据网络URL获取该网页上面所有的img标签并下载符合要求的所有图片

所需jar包:jsoup.jar

import java.io.BufferedInputStream;
import java.io.BufferedOutputStream;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;
import java.util.ArrayList;
import java.util.List;
import java.util.UUID;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

/**
* 图片批量下载工具类
* @author Marydon
* @create time 2016-9-3下午2:01:03
* @update time 2017年9月30日11:07:02
* @E-mail:[email protected]
*/
public class ImgDownloadUtil {

/**
* 根据URL获取网页DOM对象
* @param url
* 网址
* @return DOM对象
*/
public static Document getHtmlDocument(String url) {
Document document = null;
URL urlObj = null;
try {
// 1.建立网络连接
urlObj = new URL(url);
// 2.根据url获取Document对象
document = Jsoup.parse(urlObj, 5000);// 单位:毫秒超时时间

} catch (MalformedURLException e) {
System.out.println("世界上最遥远的距离就是没有网,检查设置!");
e.printStackTrace();
} catch (IOException e) {
System.out.println("您的网络连接打开失败,请稍后重试!");
e.printStackTrace();
}

return document;
}

/**
* 根据URL获取网页源码
* @param url
* 网址
* @return 网页源码
*/
public static String getHtmlText(String url) {
String htmlText = "";
Document document = null;
URL urlObj = null;
try {
// 1.建立网络连接
urlObj = new URL(url);
// 2.根据url获取Document对象
document = Jsoup.parse(urlObj, 5000);// 单位:毫秒超时时间
// 3.根据dom对象获取网页源码
htmlText = document.html();
} catch (MalformedURLException e) {
System.out.println("世界上最遥远的距离就是没有网,检查设置!");
e.printStackTrace();
} catch (IOException e) {
System.out.println("您的网络连接打开失败,请稍后重试!");
e.printStackTrace();
}

return htmlText;
}

/**
* 操作Dom对象获取图片地址
* @param document
* Dom对象
* @return 图片地址集合
*/
public static List<String> getImgAddressByDom(Document document) {
// 用于存储图片地址
List<String> imgAddress = new ArrayList<String>();
if (null != document) {
// <img src="" alt="" width="" height=""/>
// 获取页面上所有的图片元素
Elements elements = document.getElementsByTag("img");
String imgSrc = "";
// 迭代获取图片地址
for (Element el : elements) {
imgSrc = el.attr("src");
// imgSrc的内容不为空,并且以http://开头
if ((!imgSrc.isEmpty()) && imgSrc.startsWith("http://")) {
// 将有效图片地址添加到List中
imgAddress.add(imgSrc);
}
}
}

return imgAddress;
}

/**
* 根据网络URL下载文件
* @param url
* 文件所在地址
* @param fileName
* 指定下载后该文件的名字
* @param savePath
* 文件保存根路径
*/
public static void downloadFileByUrl(String url, String fileName, String savePath) {
URL urlObj = null;
URLConnection conn = null;
InputStream inputStream = null;
BufferedInputStream bis = null;
OutputStream outputStream = null;
BufferedOutputStream bos = null;
try {
// 1.建立网络连接
urlObj = new URL(url);
// 2.打开网络连接
conn = urlObj.openConnection();
// 设置超时间为3秒
conn.setConnectTimeout(3 * 1000);
// 防止屏蔽程序抓取而返回403错误
conn.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");
// 3.得到输入流
inputStream = conn.getInputStream();
bis = new BufferedInputStream(inputStream);

// 文件保存位置
File saveDir = new File(savePath);
if (!saveDir.exists()) {
saveDir.mkdirs();
}
// 文件的绝对路径
String filePath = savePath + File.separator + fileName;
File file = new File(filePath);
// 4.
outputStream = new FileOutputStream(file);
bos = new BufferedOutputStream(outputStream);
byte[] b = new byte[1024];
int len = 0;
while ((len = bis.read(b)) != -1) {
bos.write(b, 0, len);
}
System.out.println("info:" + url + " download success,fileRename=" + fileName);
} catch (MalformedURLException e) {
System.out.println("世界上最遥远的距离就是没有网,检查设置");
System.out.println("info:" + url + " download failure");
e.printStackTrace();
} catch (IOException e) {
System.out.println("您的网络连接打开失败,请稍后重试!");
System.out.println("info:" + url + " download failure");
e.printStackTrace();
} finally {// 关闭流
try {
if (bis != null) {// 关闭字节缓冲输入流
bis.close();
}

if (inputStream != null) {// 关闭字节输入流
inputStream.close();
}
if (bos != null) {// 关闭字节缓冲输出流
bos.close();
}
if (outputStream != null) {// 关闭字节输出流
outputStream.close();
}

} catch (IOException e) {
e.printStackTrace();
}
}
}

}

测试

public static void main(String[] args) {
// 1.确定网址
String url = "javascript:void(0)";
// 2.获取该网页的Dom对象
Document document = getHtmlDocument(url);
// 3.获取该网页所有符合要求的图片地址
List<String> imgAddresses = getImgAddressByDom(document);
String imgName = "";
String imgType = "";
// 4.设置图片保存路径
String savePath = "C:/Users/Marydon/Desktop";
// 5.批量下载图片
for (String imgSrc : imgAddresses) {
// 5.1图片命名:图片名用32位字符组成的唯一标识
imgName = UUID.randomUUID().toString().replace("-", "");
// 5.2图片格式(类型)
imgType = imgSrc.substring(imgSrc.lastIndexOf("."));
imgName += imgType;
// 5.3下载该图片
downloadFileByUrl(imgSrc, imgName, savePath);
}
}

 

 相关推荐:

  • ​​Java读取并下载网络文件​​
  • ​​javaWeb 批量下载图片​​

 

 

作者:​​Marydon​​



标签:document,java,String,url,import,null,下载,图片
From: https://blog.51cto.com/u_15964717/6059073

相关文章

  • JAVA中的Comparable接口和自定义比较器
    Java中的自然排序自然排序定制排序自然排序TreeSet集合在存储数据时有一定的顺序,它会将一些数据进行比较,比较调用的是comparaTo()方法,该方法是在Comparable中定义的,自然排......
  • Java NIO:Buffer、Channel 和 Selector详解
    本来要一起介绍非阻塞IO和JDK7的异步IO的,不过因为之前的文章真的太长了,有点影响读者阅读,所以这里将它们放到另一篇文章中进行介绍。Buffer一个Buffer本质上是内存......
  • 重学Java-第六章 Java运算符
    6.1算术运算符​ Java语言提供了执行加减乘除四则运算的运算符。算数运算符被用在数学表达式中,可以使用任意嵌套的小括号,其作用与数学中相同。下表列出了算术运算符:......
  • 重学Java-第二章 Java快速入门
    2.1在Windows上安装Java2.1.1下载安装包打开Oracle官网的JDK下载地址,推荐下载JDK1.8版本,1.8版本是目前企业使用最多的版本,下拉找到Java8,选择windows平台。​ ......
  • 重学Java-第三章 Java基本语法
    3.1基本语法​ 编写Java程序时,应注意以下几点:大小写敏感:Java是对大小写敏感的,这就表示标识符Hello和hello是不同的。类名:对所有的类来说,类名的首字母应大写,若类名由......
  • 重学Java-第四章 Java变量
    4.1什么是变量​ 在程序设计中,变量是指一个包含值的存储地址以及对应的符号名称。从定义上来看,变量大概可以分为两部分:变量的名字和变量的值,可通过变量来访问变量值。......
  • 重学Java-第五章 Java数据类型
    5.1概述​ Java语言的数据类型可以分为基本数据类型(primitivedatatype)和引用型数据类型(referencedatatype)5.2基本数据类型5.2.1整数类型​ Java语言提供了......
  • 【OpenCV】图片尺寸放缩示例程序
    这次示例程序分别演示了用resize、pyrUp、pyrDown来让源图像进行放大缩小操作#include<opencv2/opencv.hpp>#include<opencv2/imgproc/imgproc.hpp>#include<opencv2/highgu......
  • 【OpenCV】—图像金子塔与图片尺寸缩放
    序言:继续,继续,开干!!!本节学习OpenCV中的函数pyrUp和pyrDown对图像进行向上和向下采样,以及了解专门用于缩放图像尺寸的resize函数的用法文章目录​​1、引言​​​​2、关于图......
  • java 字符串如何直接转LocalDateTime?
    1.情景展示在实际开发过程中,可能会遇到将前端传的日期格式转成LocalDateTime插入到数据库的情况,如何将日期转成LocalDateTime呢?2.原因分析在Java8中,日期类不同于以......