盒子云管家 发表于 2020-1-2 19:35:29

[小说站源码]新版PTCMS4.2.8含采集规则及运行环境

版本说明:
   ptcms小说特点,最大的特点就是特别省硬盘,因为没有保存小说内容,硬盘最少是要500G,最好1T以上。比较吃服务器资源,之前网上泛滥的ptcms3.0,也玩过只有带了个百度实时推送,挂了几个月收录一个首页悲惨收尾。
其他说明:搭建教程回复可见**** Hidden Message *****

盒子云管家 发表于 2020-1-2 19:48:04

采集教程:
安装了ptcms4.2.8小说程序以后,很多小伙伴不知道怎么配置采集教程,今天来介绍一下具体的采集方法。导入采集规则,选择新站点,添加新书打勾。其他默认(以后如果因为源站改动规则失效,可以找人写下那个失效站点的规则,然后导入,选择这个老站点,覆盖掉对应的站点和规则就行)点击测试,先测试下规则能不能用,再加入后台任务计划。采集时间间隔默认是600,我嫌时间太长,设置成60。然后启动运行就行,我这里已经是开启的了,如果提示主线进程状态失败,时间也是1970,采集不了的,那说明你还没配置cron。现在就能自动采集了,但是因为ptcms的特性,自动采集每天也就几百,有的人网站刚建好,小说太少,嫌慢,希望自己先主动采集多少本,后面再挂着自动采集,现在来说明下一般选用后台离线采集,选择规则,自定义页面,填入要采集的页面,比如说https://www.biquge.info/paihangbang_postdate/1.html这个页面,是第一页,第二页只是后面的1变成2。可以用这个页码代码来代替比如说https://www.biquge.info/paihangbang_postdate/.html比如我要采集这个页面的1-5页,就可以如下图这样写。好了教程就到这里,我没用里面的书号采集,书号采集容易出现采集到废的小说或很多没封面的。

dfxhua 发表于 2020-1-3 10:12:54

站长能多提供一些能用的采集规则吗

cocwan 发表于 2020-1-3 21:01:35

有没有试过的分享下 好与不好用

wanghgh 发表于 2020-1-3 22:11:54

感谢站长提供的源码

若疯狂 发表于 2020-1-7 10:00:23

小说网站,下载看看

ycdl01 发表于 2020-2-5 12:22:09

感谢站长提供的源码

小石头 发表于 2020-2-16 00:16:10

看看                  
页: [1] 2 3 4
查看完整版本: [小说站源码]新版PTCMS4.2.8含采集规则及运行环境