欢迎来到资源库(www.zyku.net)

工具资源

当前位置:首页 > 网站运营 > 工具资源 > 火车头采集器

火车头采集器使用post方法获得采集网址

时间:2020-04-08|栏目:工具资源|点击:|我要投稿

大家在采集列表分页的时候会遇到,点击下面的分页页面内容是改变了,但是浏览器地址却没有改变 ,这个种情况分页是post的方式,今天我们来说下这个种情况该如何获取分页,用这个网址

来做例子http://www.yidianda.com/category/two/1-7.html。

首先你要会使用fiddler抓包,(教程:http://bbs.locoy.com/spider-107387-1-1.html ),这里假设你已经掌握了fiddler的使用了,我们开启fiddler然后点击下面的分页看下fiddler都抓到了什么。

我们点击第三页和第5页, 抓包看看分别获取什么。

这里是第五页的抓包情况:

上图不好比较两者之间的区别,我们把结果保存的文本中来比较就很方便了,用按钮“View in Notepad” 把结果保存到文本中来比较:

按照上图的对比比较我们找到ec_p的值就是分页,这里大家明白了吧。

ec_crd=32&ec_p=5&id=1&pid=7&flag=1&sortType=&s_keyword=&s_minprice=&s_maxprice= 这些是提交的值 那采集器里如何设置呢?如下图

我们看到除了ec_p还有别的参数如ec_crd这些那这些是什么呢?我们去页面源代码里找下我们以ec_crd这个参数为例,别的一样处理。

这个源代码里的情况 我们最终要获取他的值也就是"32" 在采集如何获取呢

采集器里获取如下图设置,在采集器里像这样的参数叫做post随机值。

按照同样的方法把所有的随机值获取到,然后按照添加的顺序依次用[POST随机值1],[POST随机值2]……[POST随机值n]来表示。

(资源库 www.zyku.net)

上一篇:完美快速解决百度分享不支持HTTPS的问题

栏    目:工具资源

下一篇:word中批量修改图片大小的方法

本文标题:火车头采集器使用post方法获得采集网址

本文地址:https://www.zyku.net/gongju/1862.html

关于我们 | 版权申明 | 寻求合作 |

重要申明:本站所有的文章、图片、评论等内容,均由网友发表或上传并维护或收集自网络,仅供个人学习交流使用,版权归原作者所有。

如有侵犯您的版权,请与我们联系,我们将在24小时内进行处理、任何非本站因素导致的法律后果,本站均不负任何责任。

联系QQ:95148658 | 邮箱:mb8#qq.com(#换成@)

苏ICP备2020066115号-1

本网站由提供CDN加速/云存储服务