通过Webbrowse获取页面的图片并下载

时间：2022-09-22 13:58:36浏览次数：86

标签：src sPath url Webbrowse 获取 2C 页面下载图片

代码参考连接：https://bbs.huaweicloud.com/blogs/307065#:~:text=C%23 网络编程之webBrowser获取网页url和下载网页中图片 1 一. 界面设计界面设计如下图所示%2C添加控件如图%2C设置webBrowser1其Anchor属性为Top、Bottom、Left、Right%2C实现对话框缩放%3B设置groupBox1其Dock (定义要绑到容器控件的边框)为Buttom%2C实现当浏览器缩放时groupBox1始终在最下边%3B设置listBox其HorizontalScrollbar属性为True%2C显示水平滚动条. 2,三. 运行结果运行结果如下图所示%3A点击"浏览"按钮可以实现浏览网页%2C点击"获取"可以获取网页的URL并显示在listBox控件中%2C最后点击"下载"把图片保存到E盘目录下%2C下面就是浏览百度时下载的logo图标. ... 4 五. 正则表达式

前提

因为最近使用了webbrowse爬取页面数据需要把页面的图片下载下来。

正文

显示通过webbrowse的Navigate()方法加载数据
webbrowse中有3种方式获取相关需要的特定数据。
获取的数据通过正则表达式进行匹配对应的img的src路径，进行相关的判断，然后下载下来，存放到指定路径。项目是代码的相关实现

MatchCollection matches;
List<string> imglist = new List<string>();//获取这个内容中所以的img的src标签
matches = Regex.Matches(item["PartContent2"].ToString(), @"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>", RegexOptions.IgnoreCase);
foreach (Match match in matches)
       {
          imglist.Add(match.Value.ToString());
       }
	 foreach(var img in imglist)
                {
                    string content = img;    //获取图片url
                    Regex reg = new Regex(@"<img.*?src=""(?<src>[^""]*)""[^>]*>", RegexOptions.IgnoreCase);
                    MatchCollection mc = reg.Matches(content);        //设定要查找的字符串
                    foreach (Match m in mc)
                    {
                        string url = m.Groups["src"].Value;
						//判断图片中有没有下载路径
                        if (!url.Contains("http"))
                        {
                            url = "http://当前页url" + m.Groups["src"].Value;
                        }
                        try
                        {
                            WebRequest request = WebRequest.Create(url);//图片src内容
                            WebResponse response = request.GetResponse();
                            //文件流获取图片操作
                            Stream reader = response.GetResponseStream();
                            string imgsrc = url.Split('/')[url.Split('/').Length - 1];//截取图片的最后一个字的名称
                            string sPath = "D://Pictuers/" ;//图片存储位置
                            if (!Directory.Exists(sPath))
                            {
                                Directory.CreateDirectory(sPath);
                            }
                            sPath += "/"+ imgsrc;        //图片路径命名 
                            FileStream writer = new FileStream(sPath, FileMode.OpenOrCreate, FileAccess.Write);
                            byte[] buff = new byte[512];
                            int c = 0;                                           //实际读取的字节数   
                            while ((c = reader.Read(buff, 0, buff.Length)) > 0)
                            {
                                writer.Write(buff, 0, c);
                            }
                            //释放资源
                            writer.Close();
                            writer.Dispose();
                            reader.Close();
                            reader.Dispose();
                            response.Close();
                        }

标签：src,sPath,url,Webbrowse,获取,2C,页面,下载,图片
From： https://www.cnblogs.com/stupidparsley/p/16715781.html

axios实现实时获取文件上传/下载进度
<template><div><button@click="downLoad">下载</button><p>下载进度:{{downLoadProgress}}</p></div></template><script......
Typora软件下载与markdown语法的使用
Typora软件下载与markdown语法的使用一、Typora下载1.Typora的简介Typora是一款轻量级文本编辑器，文本阅读器，是目前最火爆的文本编辑器。Typora中格式，字体，主题样式都是......
什么是SPA页面，它的优缺点？
什么是SPAspa是单页面应用(singlepagewebapplication),浏览器会一开始就加载所需要的html、css、javascript。一旦页面加载完毕，整个页面就不会因为用户的操作而重新加......
Uni-app页面生命周期
uni-app 支持如下页面生命周期函数：文档：https://uniapp.dcloud.net.cn/tutorial/page.html#lifecycle函数名说明平台差异说明最低版本onInit监听页面初始化，其参数......
angular入门---Store页面
Angular入门篇2预期效果:新项目配置1.首先使用"ngnewStore"指令在Angular文件夹下创建一个新项目。下面利用vscode打开项目进行操作(部分插件已安装)。2.找到pac......
判断页面是后头，还是重新载入，还在用 performance.navigation.type吗？已经过时了
使用：performance.getEntries()[0].type返回的值有4种：enumNavigationTimingType{"navigate","reload","back_forward","prerender"}; ......
根据图片地址下载图片到本地
publicstaticvoidmain(String[]args){Stringurls="http://rongcloud-web.qiniudn.com/docs_demo_rongcloud_logo.png";Stringpath="d:/p......
iframe嵌入其他项目页面，iframe实现自适应高度
项目上面遇到html页面中使用iframe嵌入另一个项目的vue页面，vue页面没有限制高度，vue页面的高度会随着内容的变化而变化，而iframe的高度不会变化，这样就形成了一个滚动条。现......
使用linux时遇到的问题,ifconfig -a 报错不能找到命令，提示下载。
1.问题截图 2.解决办法首先查看占用的进程然后杀死进程接下来输入如下命令当前......
Android使用ViewPager2实现页面滑动切换
Android使用ViewPager2实现页面滑动切换作者：QiShare转载地址：https://juejin.cn/post/70655660992233472131.引言在很多应用中，我们经常会看到多个页面之间滑动切换......

通过Webbrowse获取页面的图片并下载

前提

正文

相关文章

赞助商

阅读排行