从今天起,我将在这里更新一个系列的python简单爬虫到建立网站的实践手记。内容将会从最简单的开始,环境搭建,基本爬虫,入库,用Django建立可供用户访问的网站,网站部署。同时打算涉及简单的异步爬虫,piplibe,队列等等。为了方便,将使用django和sqlite3来作为例子, 虽然有时候这并不是最合适的场景。。最终目的:一个能用的自动更新的垃圾站下面进入正题。
买VPS,装环境
1
本文的一切操作都在vps上在Runabove建立最便宜的instance.选择魁省机房-Sandbox-M-Ubuntu14.10-输入Instace名字”PythonSpider”-FireUp!不出一分钟,VPS就建立好了。
2
用SSH 连接服务器
3
没骗你吧? 好了,看一眼能用就ctrl+c把服务器关掉。然后,再建立一个app
上一篇:爬虫如何防止数据重复爬取
下一篇:Python爬虫--正则表达式