易语言爬虫网络请求保存图片

1 网页_访问_对象介绍

详细参考：http://e.125.la/fun-1161.html
本教程基于精易模块网页_访问_对象属性

2 参数介绍

参数名	类型	备注
网址	文本型	完整的网页地址,必须包含http://或者https://
访问方式	整数型	0=GET 1=POST 2=HEAD 3=PUT 4=OPTIONS 5=DELETE 6=TRACE 7=CONNECT
提交信息	文本型	"POST"专用自动UTF8编码

3 请求案例

3.1 GET请求

.版本 2
.支持库 spec

网页_访问_对象 (“http://127.0.0.1/”, 0, , , , , , , , , , , , , )
局_返回 ＝ 到文本 (网页_访问_对象 (“https://www.920vip.net/”, 0, , , , , , , , , , , , , ))
局_返回 ＝ 编码_utf8到gb2312 (局_返回)  ' 转码，不然乱码显示
调试输出 (局_返回)

3.2 POST请求

.版本 2
.支持库 spec

.子程序 http测试, 文本型
.局部变量 请求网址, 文本型
.局部变量 局_返回, 文本型
.局部变量 json, 类_json
.局部变量 code, 文本型
.局部变量 msg, 文本型
.局部变量 param, 文本型
.局部变量 bool, 逻辑型
.局部变量 headers, 文本型


调试输出 (“=====”)

请求网址 ＝ “http://127.0.0.1:8081/test”
param ＝ “secret=” ＋ “U2Fs*************yzm2p” ＋ “&msg=666”
headers ＝ “authorization:abcdef” ＋ #换行符 ＋ “name:charles”

局_返回 ＝ 到文本 (网页_访问_对象 (请求网址, 1, param, , , headers, , , , , , , , , ))
局_返回 ＝ 编码_utf8到gb2312 (局_返回)  ' 转码，不然乱码显示

bool ＝ json.解析 (局_返回)
.如果真 (bool)
    调试输出 (局_返回)
    code ＝ json.取属性对象 (“code”)
    msg ＝ json.取属性对象 (“msg”)
    调试输出 (code)
    调试输出 (msg)
.如果真结束


返回 (“0”)

易语言爬虫网络请求保存图片_易语言

5 爬虫获取图片

精益模块

正则匹配网页图片

.版本 2
.支持库 spec

.子程序 __启动窗口_创建完毕
.局部变量 url, 文本型
.局部变量 获取网页源码, 文本型


url ＝ “https://www.couragesteak.com”

' 获取网页源码
获取网页源码 ＝ 到文本 (网页_访问 (url, , , , , , , , , , , , ))
调试输出 (获取网页源码)

' 正则匹配照片数量
img_num ＝ 正则_匹配批量_图片地址 (获取网页源码, url)
调试输出 (“照片数量为：” ＋ 到文本 (img_num))


.版本 2
.支持库 spec

.子程序 正则_匹配批量_图片地址, 整数型, 公开, 匹配网页所有（已显示）图片地址。成功返回匹配的数量，失败返回0。
.参数 源文本, 文本型, , 欲被匹配的文本
.参数 domain_url, 文本型, , 网站主域名
.局部变量 局_正则, 正则表达式类, , , 此类为精易模块里面的正则类，精易模块下载地址：http://ec.125.la/
.局部变量 局_匹配数, 整数型
.局部变量 匹配文本, 文本型
.局部变量 局_计次, 整数型

.如果真 (局_正则.创建 (“src *= *['#引号]*(\S+)[#引号']”, 源文本, 假, 假, 真, 真) ＝ 假)
    信息框 (“正则创建失败，请检查正则表达式语句是否有误！”, #错误图标, , )
    返回 (0)
.如果真结束
局_匹配数 ＝ 局_正则.取匹配数量 ()

img_num ＝ 0
.如果真 (局_匹配数 ＝ 0)
    信息框 (“匹配失败，请检检查正则语句是否有误，数量：0”, #错误图标, , )
    返回 (0)
.如果真结束
.计次循环首 (局_匹配数, 局_计次)

    匹配文本 ＝ 局_正则.取子匹配文本 (局_计次, 1)
    .如果真 (取文本右边 (匹配文本, 4) ＝ “.gif” 或 取文本右边 (匹配文本, 4) ＝ “.jpg” 或 取文本右边 (匹配文本, 4) ＝ “.png”)
        调试输出 (“======”)
        ' 调试输出 (取文本左边 (匹配文本, 4))
        调试输出 (局_正则.取子匹配文本 (局_计次, 1))

        .如果真 (取文本左边 (匹配文本, 4) ＝ “http”)
            img_num ＝ img_num ＋ 1

            加入成员 (图片_列表, 局_正则.取子匹配文本 (局_计次, 1))
            ' 下载次数 ＝ 下载次数 ＋ 1
        .如果真结束
        .如果真 (取文本左边 (匹配文本, 4) ≠ “http”)
            调试输出 (“不是全部链接”)
            img_num ＝ img_num ＋ 1
            加入成员 (图片_列表, domain_url ＋ 局_正则.取子匹配文本 (局_计次, 1))
        .如果真结束

        输出调试文本 (“匹配文本 ” ＋ 到文本 (局_计次) ＋ “ 中的子匹配文本 1：” ＋ 局_正则.取子匹配文本 (局_计次, 1))
        ' 透明标签2.标题 ＝ “状态：正在导入”
    .如果真结束

.计次循环尾 ()
返回 (img_num)

下载图片

写到文件 (“E:\dev\易语言开发\qrcode_cs.jpg”, HTTP读文件 (“https://static.couragesteak.com/common/qrcode_cs.jpg”))

标签：计次,匹配,请求,局部变量,爬虫,正则,网页,文本,易语言
From： https://blog.51cto.com/u_16006123/6120319

易语言爬虫网络请求保存图片

1 网页_访问_对象介绍

2 参数介绍

3 请求案例

3.1 GET请求

3.2 POST请求

5 爬虫获取图片

相关文章

赞助商

阅读排行

易语言 爬虫 网络请求 保存图片

1 网页_访问_对象介绍

2 参数介绍

3 请求案例

3.1 GET请求

3.2 POST请求

5 爬虫获取图片

相关文章

赞助商

阅读排行

易语言爬虫网络请求保存图片