有勇气的牛排博客

易语言 爬虫 网络请求 保存图片

有勇气的牛排 676 易语言 2023-05-18 23:00:29

1 网页_访问_对象介绍

详细参考:http://e.125.la/fun-1161.html
本教程基于精易模块网页_访问_对象属性

2 参数介绍

参数名 类 型 备注
网址 文本型 完整的网页地址,必须包含http://或者https://
访问方式 整数型 0=GET 1=POST 2=HEAD 3=PUT 4=OPTIONS 5=DELETE 6=TRACE 7=CONNECT
提交信息 文本型 "POST"专用 自动UTF8编码

3 请求案例

3.1 GET请求

.版本 2 .支持库 spec 网页_访问_对象 (“http://127.0.0.1/”, 0, , , , , , , , , , , , , ) 局_返回 = 到文本 (网页_访问_对象 (“https://www.920vip.net/”, 0, , , , , , , , , , , , , )) 局_返回 = 编码_utf8到gb2312 (局_返回) ' 转码,不然乱码显示 调试输出 (局_返回)

3.2 POST请求

.版本 2 .支持库 spec .子程序 http测试, 文本型 .局部变量 请求网址, 文本型 .局部变量 局_返回, 文本型 .局部变量 json, 类_json .局部变量 code, 文本型 .局部变量 msg, 文本型 .局部变量 param, 文本型 .局部变量 bool, 逻辑型 .局部变量 headers, 文本型 调试输出 (“=====”) 请求网址 = “http://127.0.0.1:8081/test” param = “secret=” + “U2Fs*************yzm2p” + “&msg=666” headers = “authorization:abcdef” + #换行符 + “name:charles” 局_返回 = 到文本 (网页_访问_对象 (请求网址, 1, param, , , headers, , , , , , , , , )) 局_返回 = 编码_utf8到gb2312 (局_返回) ' 转码,不然乱码显示 bool = json.解析 (局_返回) .如果真 (bool) 调试输出 (局_返回) code = json.取属性对象 (“code”) msg = json.取属性对象 (“msg”) 调试输出 (code) 调试输出 (msg) .如果真结束 返回 (“0”)

image.png

5 爬虫获取图片

精益模块

正则匹配网页图片

.版本 2 .支持库 spec .子程序 __启动窗口_创建完毕 .局部变量 url, 文本型 .局部变量 获取网页源码, 文本型 url = “https://www.couragesteak.com” ' 获取网页源码 获取网页源码 = 到文本 (网页_访问 (url, , , , , , , , , , , , )) 调试输出 (获取网页源码) ' 正则匹配照片数量 img_num = 正则_匹配批量_图片地址 (获取网页源码, url) 调试输出 (“照片数量为:” + 到文本 (img_num)) .版本 2 .支持库 spec .子程序 正则_匹配批量_图片地址, 整数型, 公开, 匹配网页所有(已显示)图片地址。成功返回匹配的数量,失败返回0。 .参数 源文本, 文本型, , 欲被匹配的文本 .参数 domain_url, 文本型, , 网站主域名 .局部变量 局_正则, 正则表达式类, , , 此类为精易模块里面的正则类,精易模块下载地址:http://ec.125.la/ .局部变量 局_匹配数, 整数型 .局部变量 匹配文本, 文本型 .局部变量 局_计次, 整数型 .如果真 (局_正则.创建 (“src *= *['#引号]*(\S+)[#引号']”, 源文本, 假, 假, 真, 真) = 假) 信息框 (“正则创建失败,请检查正则表达式语句是否有误!”, #错误图标, , ) 返回 (0) .如果真结束 局_匹配数 = 局_正则.取匹配数量 () img_num = 0 .如果真 (局_匹配数 = 0) 信息框 (“匹配失败,请检检查正则语句是否有误,数量:0”, #错误图标, , ) 返回 (0) .如果真结束 .计次循环首 (局_匹配数, 局_计次) 匹配文本 = 局_正则.取子匹配文本 (局_计次, 1) .如果真 (取文本右边 (匹配文本, 4) = “.gif” 或 取文本右边 (匹配文本, 4) = “.jpg” 或 取文本右边 (匹配文本, 4) = “.png”) 调试输出 (“======”) ' 调试输出 (取文本左边 (匹配文本, 4)) 调试输出 (局_正则.取子匹配文本 (局_计次, 1)) .如果真 (取文本左边 (匹配文本, 4) = “http”) img_num = img_num + 1 加入成员 (图片_列表, 局_正则.取子匹配文本 (局_计次, 1)) ' 下载次数 = 下载次数 + 1 .如果真结束 .如果真 (取文本左边 (匹配文本, 4) ≠ “http”) 调试输出 (“不是全部链接”) img_num = img_num + 1 加入成员 (图片_列表, domain_url + 局_正则.取子匹配文本 (局_计次, 1)) .如果真结束 输出调试文本 (“匹配文本 ” + 到文本 (局_计次) + “ 中的子匹配文本 1:” + 局_正则.取子匹配文本 (局_计次, 1)) ' 透明标签2.标题 = “状态:正在导入” .如果真结束 .计次循环尾 () 返回 (img_num)

下载图片

写到文件 (“E:\dev\易语言开发\qrcode_cs.jpg”, HTTP读文件 (“https://static.couragesteak.com/article/common/qrcode_cs.jpg”))

留言

专栏
文章
加入群聊