当前位置:AIGC资讯 > 数据采集 > 正文

火车头采集的文件发布到服务器上,火车头采集器图片采集上传设置

教程总目录:

前面我们写了基础的标题和文章采集,下面介绍下图片的采集。

图片采集不是必须的,但是图片可以丰富网站的内容,具体我也不清楚对网站的SEO有什么影响。我测试采集图片和不采集图片收录没区别,我见到的一些采集站,大部分也是不采集图片的!

如果采集数据量比较大的话可以选择不采集图片。

正文开始

首先是火车头采集器上的设置。

我们以这个文章为例:https://server.zzidc.com/serverhosting/3117.html

这个里面有一张图片,并且也是前面我们教程里用做示范的网站。

声明:本人目前没使用任何景安的产品(以前用过),也对他产品印象不好。仅做教程示例,没有推荐他产品的意思。

我们直接打开前面教程创建的那个火车头采集任务。

在内容采集规则-内容-文件下载里面

选择:将相对地址补全为绝对地址、下载图片

文件地址必须包含:uploads/allimg

这个必须包含是根据不同网站来设置的,比如本文教程里文章图片地址是:

https://server.zzidc.com/uploads/allimg/191015/1-191015150925U2.png

那么除掉前面他网站域名和后面会产生变化的文件名和日期格式的目录名之外剩余的基本就是我们想要的内容,所以我这里让图片文件地址必须包含uploads/allimg。

为什么这么做?

因为他有可能在文章里加入图片广告,图片广告为了便于修改,大部分都是采用单独目录内放图片广告的方式。这样以后该广告比较容易。新老文章都能一次修改掉。

文件保存

更新时间 2023-11-08