火车头采集内容发布dede自定义字段

作者&投稿:亢钩 (若有异议请与网页底部的电邮联系)
跪求 火车头采集 dede自定义字段 web发布模块教程。解决给高分~

用这款吧,不需要找发布模块,软件内置了,下载就可以用,比较省心,而且简单,功能也绝对比火车强,我用了很久了。相当好用

完全没看懂你想问什么,你是想说需要采集某个标签然后发布到DEDE还是其他的意思?
如果是采集标签,首先讲采集部分,需要针对该采集部分添加一个标签去采集,具体的就是在火车头的那个采集规则里添加,
发布部分需要在DEDE中后台添加字段,然后修改火车头发布模块(如果dede原本就带有的话就不需要修改)

DEDE使用火车采集器实现的自动实时发布文章和更新HTMl的功能。

一,为什么有这个想法:

使用火车发布文章,有三大不足。
需要登陆发布,受DEDE系统限制太大
就是一次发布的数量有限制,可能造成一次性发布太多遭K的恶果
如果网站首页是静态文件,则不能更新首页,用户就不知道网站的更新情况
如果没有一台可以一直运行的服务器,使用火车采集器的自动更新功能就不太现实
火车采集器的自动更新功能是收费的,呵呵。
自己需要咯,想挑战一下自己咯等。

二,Do it.

首先想到,让火车发布大量数据,且将文章属性设置为未审核状态,这个问题很简单,使用DEDEv5.3.1时却遇到DEDE的一个Bug。就是未审核的文章居然会在前台显示。先是对DEDE一气臭骂,后来找了一些原因,发现了DEDEv5.3.1中的一个Bug.经修复后可以实现未审核的文章不在前台显示。1月13号到DEDE报告Bug以后,1月14号DEDE出的补丁中修复了这个问题,呵呵,所以,1月15号,就是今天咯,开始正式整理此开发文档。
实际发现,发布和保存大量未审核文章不成问题,难在如何实现随机激发发布功能。想了很久,觉得使用时间限制最好。当前台JS调用了审核文章的链接,传递一个访问用户的信息,程序取得用户的IP并保存为SESSION信息,此时,审核一篇文章并生成文章与首页静态文件。一个用户在一定的时间内,只能激活限定数量的文章,且,发布时使用此用户的IP信息,呵,挺个性的。
激活文章,生成文章静态页和首页静态文章,受网站模板的影响,可能会比较慢,则会出现首页未生成完页面就被关闭的问题。所以,最好的办法是,在发布时文章时就生成文章静态文件,然后把文章设置为未审核状态。激活文章时则只需要很短的查询。首页或者列表页尽量使用动态页,这两个问题不好处理,只能以此法代之。
完整的过程就是,发布文档时,将文档设置为未审核状态;调用程序时,先判断上一次查询的缓存有没有超时,如果超过缓存时间,则清除缓存,以显示最新的文章。清除缓存以后,查询出一定数量属性为未审核的文档,将Archives和Arctiny表中的未审核属性取消,并更新一下文档的Pubdate字段,实现一点随机化。最后写入缓存,禁止缓存有效期内的重复更新!

三,文件使用方法:

发布文档时请把文档属性设置为未审核状态,即发布时提交的文档属性参数为:arcrank=-1,这时为动态浏览;
如果你想生成静态文档,请将文档状态设置为正常浏览状态,即arcrank=0;然后修改默认文档添加程序。
如:arcticle_add.php,在文件最下边“//生成HTML”处添加一段代码:

//生成HTML
InsertTags($tags,$arcID);
$artUrl = MakeArt($arcID,true,true);

if($artUrl=='')
{
$artUrl = $cfg_phpurl."iew.php?aid=$arcID";
}
$dsql->ExecuteNoneQuery("UPDATE `cmsxx_archives` SET `arcrank`='-1' WHERE (`id`='$arcID');");
$dsql->ExecuteNoneQuery("UPDATE `cmsxx_arctiny` SET `arcrank`='-1' WHERE (`id`='$arcID');");

然后,上传New.php到你的网站根目录,到Dede后台设置系统基本设置中,将性能选项卡中的arclist标签调用缓存时间设置为一个合适的数,如3600表示一个小时刷新一次缓存。
最后,在模板文件顶部调用一段代码即可:
“ <script type=”text/javascript” src=”{dede:global.cfg_cmsurl/}/new.php”></script> ”。
支持的参数:
no=每次随机更新的数量,为空时默认为5;
typeid=栏目ID,为空则是全站数据
order=排序方式,支持Desc:倒序,Asc:顺序,Rand:随机,默认为随机查询。
如:“ <script type=”text/javascript” src=”{dede:global.cfg_cmsurl/}/new.php?no=100&typeid=2&order=desc”></script> ”
排序为Desc的时候,是按先发布的文章先审核的方式进行发布的,Asc反之,Rand为随机。
四,这是我们在数据处理方面做的一个尝试,也许这种新的模式会是一次突破。祝大家使用愉快。有Bug或者建议请回复于后。
如何正式你想要的答案别忘采纳哦


火车头采集图片问题
是吗?表示我的v7火车头采集图片没出现过这种情况,是不是规则或者其它设置有问题呢。不妨把规则共享下,试试效果。

急!!求一段火车头纯正则替换,会的进。
不对不对,不能传参数,替换后就全部成了\\d*.jpg了。试试这个

怎么采集网页翻页,地址一样的列表?就是网页用了ajax内容变了,地址没变...
url: "demo.aspx\/getName", \/\/ajax访问的网址 data: "{strName:'" + strname + "'}", contentType: "application\/json", success: function (result) { alert(result.d); } }) }) });其中的 url 就是采集时的地址,而 data 就是返回值(通常为 JSON 格式...

豪华插混MPV传祺E9来了 就问腾势D9你怕不怕
在各个用车场景都能满足消费者的需求。33-39万元的预售价无疑是对35万+高端MPV市场投下了一颗重磅炸弹,等到正式上市之后,别说腾势D9了,同级其他车型的好日子可真就到头喽。【本文来自易车号作者侯云峰YC,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关】

dis测瞬时速度实验意义
D.小车在短时间内的平均速度等于此时刻的瞬时速度。3、某同学用DIS设计了一个测物体瞬时速度 的实验。在小车上固定挡光片,使挡光片的前 端与车头齐平、将光电门传感器固定在轨道侧 面,垫高轨道的一端。该同学将小车从同一位 置由静止释放,获得了如下几组实验数据。下 面表述正确的是( B )①...

30万价格,百万级享受,这就是中国品牌豪华MPV的扛鼎者
2022年9月,中国汽车流通协会和精真估联合发布《2022年度上半年中国汽车保值率报告》。报告显示,传祺M8三年保值率高达80.01%。在2022年10月J.D. Power发布的《2022中国汽车保值率研究报告》中,传祺M8以三年期保值率63.7%的成绩依旧问鼎自主品牌榜首,距离合资品牌车型奥德赛仅相差0.2个百分点,凸显出...

什么情况下转弯不打灯?
车辆转弯时的指示灯,具体操作方法:1、上“右”下“左”,转向灯基本都是往上打(顺时针)是向右转,往下打(逆时针)是往左转。这样设计也是为了符合人体感觉,更符合人体的操作思维。2、超车先打左转向再打右转向,按规定必须从左侧超车,所以需要先打左转向灯,等超车之后,要返回原车道时,再打...

大家好,问一下关于正则表达式转换,例如采集到 123150 ,换为 123.50...
原正则:(\\d+)1(\\d{2})替换为:\\1\\.\\2 如有问题,欢迎继续交流!

火车头采集器怎么设置正则过滤数字
1、打开您的火车头,并打开需要替换的字段,添加正则替换。2、输入正则替换语句。(\\d{2,100})意思是替换2位以上的数字,后面的100和前面的2一个意思!3、替换结果!第一张有数字2017 第二张为替换后的结果,已经去掉了2017

火车头采集器怎么设置正则过滤数字
1、打开您的火车头,并打开需要替换的字段,添加正则替换。2、输入正则替换语句。(\\d{2,100})意思是替换2位以上的数字,后面的100和前面的2一个意思!3、替换结果!第一张有数字2017 第二张为替换后的结果,已经去掉了2017

谢通门县18317813887: 火车头采集下来怎么发布到网站上? -
姚韵麦特: 1、运行火车头软件,点击发布到发布窗口界面;2、点击添加,依次选择发布接口,选择网站编码、填写后台路径、(因为是免登陆接口)选择不需要登录&http请求,然后获取列表看看是否成功,成功后请保持配置. (注意:如果无法获取列...

谢通门县18317813887: 火车头+dedecms能实现一键自动采集发布么? -
姚韵麦特: 用采集侠可以实现的,如果是用dedecms搭建网站的话,可以用采集侠进行采集,目前dedecms使用人数最多, 口碑最好的一款采集插件

谢通门县18317813887: 火车头的自定义标签要怎么发布? -
姚韵麦特: 这是一件非常容易但对于新手又是非常困难的事,你只知道在火车头上自定义一个标签,你可知道这个标签的意义是什么.(让我来为你将它简单化吧)比如你在火车头里自定义一个标签(姓名)如果你想将它成功的发布到织梦,(那么在你织梦系统的数据库里必须有(姓名)这样一个数据库字段.并且在火车头发布模板里加上该字段名称:如(&字段名=值)看着你上面采集的东西,应该都是在内容页里的吧.建议你在内容标签里把(从姓名到—证书机构的代码全采了.)比起你建数据库字段方便很多,加上又要修改发布模板.一想到这(杯具)啊.

谢通门县18317813887: 火车头怎么采集有图片的文章一起发布织梦后台 -
姚韵麦特: 免费的只能用FTP传上去 ...如果是用dedecms搭建网站的话,可以用采集侠进行...则利用火车头的下载图片的功能,然后再上传到服务器,再发布内容.就可以讲...

谢通门县18317813887: 火车头采集文章发布到dede后台,获取不了列表是什么原因 -
姚韵麦特: 第一,接口问题.第二,没有按照接口指示屏蔽后台登陆验证码.第三,账号密码错误.

谢通门县18317813887: dede怎么批量发布文章 -
姚韵麦特: 用采集,DEDE后台自带的 做好规则就可以用了 或者你用火车头采集也行

谢通门县18317813887: 火车头 DEDE发布问题
姚韵麦特: 采集规则编写的时候的编码问题

谢通门县18317813887: 谁用过火车头采集器,给我讲讲是什么意思?如何使用? -
姚韵麦特: 火车采集器(LocoySpider) 是一个供各大主流文章系统,论坛系统等使用的多线程内容采集发布程序.使用火车采集器,你可以瞬间建立一个拥有庞大内容的网站.系统支持远程图片下载,图片批量水印,Flash下载,下载文件地址探测,自制...

谢通门县18317813887: 我这么设置火车头采集器怎么不能替换内容 我想把双引号去掉 -
姚韵麦特: 1. 打开火车头采集器 2. 在【内容采集规则】里面找到【数据处理】 3. 点击那个+号,如图 4.然后选择内容替换/排除这一项5. 然后将你需要替换掉的双引号写在替换内容区,在被替换内容区留空 6.

谢通门县18317813887: 火车头采集器怎么用 -
姚韵麦特: 作为同时使用八爪鱼采集器和写爬虫的非技术的莫名其妙喜欢自己琢磨技术的互联网运营喵...我来谈谈心得感想. 八爪鱼有一些优势,比如学习成本低,可视化流程,快速搭建采集系统.能直接导出excel文件和导出到数据库中.降低采集...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网