当前位置:AIGC资讯 > 数据采集 > 正文

易语言采集网页html,易语言采集网页图片源码例程

易语言采集网页图片源码例程,源码是采集meitulu网站的内容。

.版本 2

.支持库 spec

.子程序 采集图片

.局部变量 网址, 文本型

.局部变量 返回文本1, 文本型

.局部变量 正则表达式, 正则表达式类

.局部变量 文件夹数量, 整数型

.局部变量 计次1, 整数型

.局部变量 文件夹名, 文本型

.局部变量 文件夹位置, 文本型

.局部变量 图片地址, 文本型

.局部变量 图片数量, 整数型

.局部变量 计次2, 整数型

.局部变量 图片, 字节集

.局部变量 addr_temp, 文本型

网址 = “https://www.meitulu.com/guochan/”

.如果 (组合框1.内容 ≠ “1”)

网址 = 网址 + 组合框1.内容 + “.html”

.否则

' 本源码来自三叶资源网(www.sanye.cx)

.如果结束

返回文本1 = 编码_utf8到gb2312 (到文本 (网页_访问_对象 (网址, 1)))

调试输出 (返回文本1)

正则表达式.创建 (#正则, 返回文本1)

文件夹数量 = 正则表达式.取匹配数量 ()

.计次循环首 (文件夹数量, 计次1)

图片地址 = 正则表达式.取子匹配文本 (计次1, 1)

文件夹名 = 正则表达式.取子匹配文本 (计次1, 2)

图片数量 = 到整数 (正则表达式.取子匹配文本 (计次1, 3))

文件夹位置 = 保存位置 + “\” + 文件夹名

目录_创建 (文件夹位置)

.计次循环首 (图片数量, 计次2)

addr_temp = 子文本替换 (图片地址, “0.jpg”, 到文本 (计次2) + “.jpg”, , , 真)

图片 = 网页_访问 (addr_temp, , , , , “Referer: https://www.meitulu.com/guochan/”, , , , )

写到文件 (文件夹位置 + “\” + 到文本 (计次2) + “.jpg”, 图片)

.计次循环尾 ()

.计次循环尾 ()

提示框 (“采集成功!”)

文件下载

解压密码:

来源:三叶资源网,欢迎分享,公众号:iisanye,(三叶资源网⑤群:21414575)

更新时间 2023-11-08