MIPCMS站长工具使用教程【数据采集】

  • 时间:
  • 浏览:18531 °C
  • 来源:TRAI技术屋


1.点击【数据采集】进入操作界面。


2.在左侧框内空白处,右键单击新建任务。


3.任务配置

1)任务名称:填写新建的本条任务名称;

2)目标地址:就是要采集的目标网站URL。如果只采集一个页面,直接填网页URL,如:http://www.baidu.com/list.html;如果是分页模式填写URL变量,

如要采集http://www.baidu.com/list_1.html

http://www.baidu.com/list_2.html

http://www.baidu.com/list_3.html

http://www.baidu.com/list_4.html

http://www.baidu.com/list_5.html

......,

http://www.baidu.com/list_100.html

这么些页面,就填写http://www.baidu.com/list_[1,100].html,“[1,100]”实在英文状态下输入。

3)前面字符:

和火车头配置差不多,打开 目标页面,右键查看网站源代码。找到要采集的文章内容页链接,找到链接“http://”前面的字符,填写此处。

4)后面字符:和“前面字符”一样,找到链接后面的字符,填写此处。

5)测试:测试时建议目标地址填写一个单页的地址。

如果测试成功,在右侧测试url处会返回采集到的文章内容也地址。

最后记得点击保存!

4.内容设置:


同样右键单击左侧空白处,新建字段:


1)字段名:这里需要注意下,有两个固定的字段名:标题和内容

字段其实就是你想要采集文章页什么内容,你就添加几个字段就可以了。

2)前文本:比如你要采集文章页标题,那么前文本就是标题前面的内容(打开文章页查看源代码)。

3)后文本:和前文本一样,标题后面的内容。

4)前后缀:如果想在采集到的字段内容前面或者后面添加自定义内容,那么就在这里设置。

5)内容替换:

被替换的内容,就是采集到的字段内容有自己不想用的,填写此处。替换内容,就是把不想用的字段内容替换成为想要替换的内容。

最后点击添加替换文本,再最后一定要点击【保存】。

6)全部字段添加完之后,可以选择一个文章页URL进行测试。


测试提示采集到的内容都是自己想要的,那么恭喜你,最复杂的采集工作完成了!

5.图片本地


图片本地化就是将采集的内容中,图片下载到自己的网站。

1)只有选择开启图片本地化,功能才会实现。

2)ftp其它我就不多说了,端口默认是21,其它可自己修改。这里主要说一下图片地址1图片地址2

图片地址1:这个是填写采集目标地址的网站域名,如采集的是http://www.baidu.com/list.html,那么就填写http://www.baidu.com

图片地址2:也就是你要发布的网站域名,如:http://www.wodezhandian.com

3)图片存放目录:

这个无需手动填写,这里需要你配置完FTP后,点击【连接】,选择文件名(双击可打开子目录),选择要存放图片的目录。

最后点击【保存】。

6.在线发布


1)发布开关:选择后有效。

2)发布站点:填写自己的站点,如:http://www.baidu.com

3)插件密码:在自己的MIPCMS站点后太火车头插件里面进行配置。

4)文章标题:这个就是前面设置的字段名,例如:字段名为标题,这里就填写“【标题】”;

5)文章内容:和文章标题一样,例如:字段名为内容,这里就填写“【内容】”;

6)分类序号:想把采集到的文章发布到站点的那个分类下,这里就填写该分类下的ID,自行到自己的站点后台查看。

7)用户序号:可以不填,也可以添加自己站点后台添加的管理员UID。

8)文章标签:如果标签是采集的,那么这里和文章标题内容一样,例如:字段名为标签,这里填写“【标题】”;如果是自己填写,那么这里就是填写自己想要的文章标签,例如:MIPCMS,站长工具,seo教程(多个标签用英文逗号隔开)。

9)发布时间:这里如果不填写,发布的文章就是默认当前时间。如果填写就是自己填写的发布时间,格式:2020年2月3日12时45分1秒

10)配置项填完之后,可以点击【测试】,如果提示发布成功,以及自己站点有文章数据,那么就成功。最后记得点击【保存】。

7.运行任务:

上面所以配置完成之后,我们关闭【新建任务】窗口,此时就可以看到自己窗口的任务了。


选择要运行的任务,右键单击,选择运行即可。

注意:数据采集、图片本地化、在线发布是为一体的。也就是说,如果你在新建任务的时候,选择了“开启图片本地化”和“开启在线发布”,采集完一条数据后,会自行图片本地化和在线发布。如果你未选择“开启图片本地化”和“开启在线发布”,那么只会进行数据采集,不会图片本地化和在线发布。此时想要重新开启该任务的图片本地化和在线发布,请选择编辑任务,进行开启,然后再重新运行任务。此时会重新采集和图片本地化以及在线发布处理。



TRAI技术屋语录

猜你喜欢

搜狗新站,无需邀请用代码提交sitemap

搜狗新站,无需邀请用代码提交sitemap

2020-03-27

MIPCMS站长工具新版V3.1.1发布

MIPCMS站长工具3.1.1(1.新增智能AI创作和伪原创,2.新增收录查询)

2020-03-24

【模块】精易模块V8.1.0 发布【2020.03.01】

精易模块,让易语言更易,技术屋

2020-03-18

MIPCMS站长工具 新版V3.1.0发布!

一款集百度链接提交,神马数据提交,MIP数据提交等为一体的自动化SEO软件!

2020-03-12

MIPCMS站长工具 新版V3.0.9

最新版 自动化站长工具

2020-02-25