火车头采集

记得很多年前玩过一段时间火车头采集,当时找人写的发布模块和采集规则。当时安卓才出来没有几年,那个时候就是做的安卓下载站,采集了一个知名的下载站。几个小时,一个网站就充实了。采集还是真的非常强大。

现在在弄一个游戏的资源站,这个游戏的某个分类资源上传操作虽然简单,但是非常枯燥耗时。当时就想到用火车头直接采集源站。下班回家,淘宝找人写发布模块,好多人都只是有发布模块,不写采集规则。于是就百度Wordpress发布模块,还真有大神分享最新的发布模块。至于规则,几年前研究火车头的时候也自己写过。虽然几年了,但是还是记得一些。自己动手开始写,总体来说还是比较简单,筛选网址、筛选标题、筛选内容、文件下载、内容替换等。最后测试完美,开始采集测试自动发布文章、上传图片等。

采集了一个分类,大概采集了300篇文章、600多文件,均发布成功。弄完都凌晨1点了,把源站其他分类栏目全部配置好,然后开始执行。等它自动采集,睡觉。

早上起来,发现电脑黑屏了。打开一看,原来是默认电脑无动作多久自动息屏。昨天晚上配置完的分类也没有采集好,赶着上班,算了,晚上回家在采集吧。

到公司上班,想登陆一下源站,看看还有什么可以采集的。结果。。。

源站直接链接数据库出错,我想应该是检测到大流量访问,然后故意关了吧。

关于火车头

火车头分为收费版和免费版,免费版诸多限制,比如不能下载文件、不能在线自动上传文件等。目前最新版本V9,在网上找了好久的绿色版本,终于找到了一个7.6的版本。功能基本一样,只是界面有点变化。

共有 2 条评论

    1. 大缺缺说道:

      哈哈哈

发表评论

电子邮件地址不会被公开。 必填项已用*标注