MIPCMS火车头采集使用教程「小白必看」

作者: RC模板 发布于: 2019-08-09 15:59:59阅读: 903

在群里潜水了那么久,发现很多的朋友总是在火车头使用时存在各种各样的问题!下面就统一来说说关于MIPCMS搭配火车头发布模块以及火车头的一些实用教程。

1、火车头发布模块搭建

1)在安装好MIPCMS后,插件中有一个火车头插件,我们给安装好,如图:



2)发布模块搭建(PS:以火车头7.6版本为例,其实方法都是一样的!但是火车头不同版本界面可能不太相同。)

①打开火车头后,点击上方发布,选择新建

②打开后选择内容发布参数,进行内容发布参数填写


③发布内容参数填写

发表地址后缀:填写MIPCMS火车头采集器插件中的免登录直接发布接口(PS:直接从斜杠开始复制即可,如果需要发布到定时发布插件中,那就选择免登录定时发布接口)

POST数据内容:

最少需要新建三个字段:password(密码)、title(标题)、content(内容)

可选新建字段:cid(对应栏目id)、keywords(关键词)、tags(tag标签)以及publish_time(发布时间)

自己采集数据中包含哪些参数就新建对应的字段即可,无需全部都写上。

填写好以后如下图(记得下方要写上系统名称后保存)


3、新建发布配置

这里我们一共需要填写三个地方即可

①选择自己新建的发布模块(不要搞错了!)

②选择编码:UTF-8(这里没有第二个选项,因为MIP模板编码全部都是UTF-8)

③登入操作,网站根网址填写自己域名即可,选择最后一个不需要登入&HTTP请求。

全部填写完成后如下图:

4、测试配置

在我们之前的工作都完成后,点击测试配置,让我们来测试一下看看是否存在问题。点击后打开,在每个标签后方填写一些内容,然后发表文章测试,如下图:


发布是否成功可看下方返回结果,如图:


注:此时网页源代码显示的是一些编码:{"msg":"\u53d1\u5e03\u6210\u529f","data":null,"code":1,"url":null},我们可以通过unicode编码转换查看即可!如果发布失败,请对照以上步骤仔细检查!


2、火车头采集规则简介

其实,这个其实也是非常简单的!无非就是找规律,我们随便找一个企业站来测试(我们以站长之家为例)

1)获取列表页URL(获取SEO栏目下的所有列表页的URL)

新建任务==》站长之家SEO栏目

找规律:

第一页的URL为:http://www.chinaz.com/web/seo/

第二页的URL为:http://www.chinaz.com/web/seo/2.shtml

第三页的URL为:http://www.chinaz.com/web/seo/3.shtml

第四页的URL为:http://www.chinaz.com/web/seo/4.shtml

...

根据翻页,我们可以看到这个栏目总共有471个列表页,唯独首页不相同其他页面均是id+1.shtml那么我们在起始网址中可以这么去填充了,看下图:


注:此处需要先点击添加,后点击完成,再去单独添加一下首页的链接(单挑链接填充即可)

2)获取内容页URL 

获取内容页URL可以用我们下面的多级列表获取了!还是找规律,找到列表页开始与结束的位置,如图:



找到列表中包含文章URL的位置,且除去URL都相同的代码,如图:


下面我们就可以去填充火车头的多级列表了,填充好了以后如下图(PS:处理好了以后记得保存,然后点击测试一下是否能获取到内容页链接):


3)采集内容及标题

点击测试网址采集后,可直接点击内容页URL进入第二步!

找到文章的标题开头与结尾的HTML标签,如图:


文章正文也是:


如此即可将我们需要的数据采集了!但是具体数据里面的代码以及编码还是需要根据个人需求再进行过滤处理(例如:替换使用火车头里面的html过滤、内容替换等等功能)。


4)发布管理

发布管理就是需要使用我们上面所说的WEB发布配置了,将我们的web发布配置好后,选择启用方式一:WEB在线发布至网站,添加我们做的web发布配置即可。

至此,简单的火车头使用就结束了,当然火车头还是非常强大的!更多强大的功能还是需要我们再进行挖掘的!当然,前面所说的关于火车头的发布还有疑问的,可以联系本人,点击右方选择QQ,本人会不定期给各位朋友做解答。当然,会员可直接在会员群进行询问,我会努力做到有问必答的!