多语言展示
当前在线:1166今日阅读:176今日分享:34

CURL采集技术

curl是“模拟登录/信息采集”技术 跨域请求:① file_get_contents(); get方式请求② curl:get/post方式都可以请求③ snoopy:get、post方式请求④ 制作form表单submit提交请求:get、post都可以,单项请求 有的时候进行信息采集要求必须登录状态才可以此时就只能使用curl或snoopy
工具/原料

电脑,代码编辑器

一、模拟信息采集:
1

1. 模拟信息采集要求登录状态才可以采集相关的信息。 使用file_get_contents()向其他地址页面(本域名下)做请求被请求页面 与 请求页面 的session不能共享。原因:它们cookie中的session_id不是同一个信息

3

3.记录登录状态。

4

4.访问代码编写。

二、模拟登录信息采集(验证码):
1

1.域名1 向 域名2 (两个)做请求,采集“商品信息”

2

2.被采集出来的信息。

推荐信息