curl是“模拟登录/信息采集”技术 跨域请求:① file_get_contents(); get方式请求② curl:get/post方式都可以请求③ snoopy:get、post方式请求④ 制作form表单submit提交请求:get、post都可以,单项请求 有的时候进行信息采集要求必须登录状态才可以此时就只能使用curl或snoopy
工具/原料
电脑,代码编辑器
一、模拟信息采集:
1
1. 模拟信息采集要求登录状态才可以采集相关的信息。 使用file_get_contents()向其他地址页面(本域名下)做请求被请求页面 与 请求页面 的session不能共享。原因:它们cookie中的session_id不是同一个信息
3
3.记录登录状态。
4
4.访问代码编写。
二、模拟登录信息采集(验证码):
1
1.域名1 向 域名2 (两个)做请求,采集“商品信息”
2
2.被采集出来的信息。
下一篇:搭建简单的web站点