爬抓360补天厂商的域名
360补天这几天搞公益安全月的活动,奖励颇为丰富。
就是爬抓这些厂商的url。
查看源码,里面压根就没有看到这些厂商的内容。
于是用burp抓包分析。
返回数据中的company_id就是那个厂商的id了。
打开url就能看到链接
https://butian.360.cn/Loo/submit?cid=59567
我的思路是这样的,先获取每页的返回内容放到文件里。然后在用正则提取出company_id的内容。
最后在每个id在访问一遍用正则提取出url的内容。
爬到第9页后就出错了,比如是11就爬第一页的内容,第25就是第二页的内容。。
这就很神奇了,于是抓包分析分析。
发现是