第二步:采集内容规则
打开任意的目标站的内容页,找到标题、作者、来源、发布时间、正文内容对应的特征代码片段。获取方式和前面审查元素一样,最后测试一下目标内容页能否正常采集。
第三步:发布内容设置
①这里选择启用方式一:web在线发布到网站
刚开始添加发布配置的是空的,需要点击“Web发布配置管理”。
在弹出的对话框内,新建一个发布模块。跟一定要填写好根目录地址
http://127.0.0.1/lvshi/
②设置网站自动登陆(难点)
上图的第四个红框就是自动登陆设置,采取的是URL抓包的方法,继续往下看。
打开Fiddler,如果软件左侧很多url,可以按Ctrl+X删除,建议把浏览器其他无关的页面关闭。可以看到Fiddler工具里面会显示当前web的数据,由于是在本地测试,DedeCMS安装在htdocs的lvshi目录下,完整路径是
E:\APMServ5.2.6\www\htdocs\lvshi\dede\
找到相应的登陆url,点击
http://127.0.0.1/lvshi/dede/login.php?gotopage=%2Flvshi%2Fdede%2Findex.php
点击右侧的Inspectors按钮,显示代码如下(每个人的都不一样)。
分别复制下面红色的字体部分,填写到对应文本框内
User-Agent(User-Agent后面代码):Mozilla/5.0(windows NT 10.;WOW64)...(此处代码省略) 登陆地址后缀(GET:后面代码):/dede/login.php 来源地址后缀(Referer:后面代码):/dede/login.php?gotopage=%2Flvshi%2Fdede%2Findex.php 粘贴抓包获取的数据(Cookie:后面代码):CNZZDATA1000250736=2025245578-1461249721-http%253A%252F%252F127.0.0.1%252F%7C1461299919;..(此处代码省略)
把双击用户名、密码、验证码等,在弹出的对话框内,把对应的值替换成对应的标签。
用默认的标签进行替换规则,一般有[用户名]、[密码]、[验证码]等。
最后填写自定义的系统命名及版本号,保存模块即可。
发表评论
评论列表(条)