ANACONDA
电脑
用python做数据分析不并是单单下载一个Python就可以了,还需要有模块、库。第三方的库往往是不会集成到Python。如果我们要把这些库和Python一起打包下载,并安装到电脑,那么我们可以选择安装另一个软件ANACONDA。
首先是下载安装。Anaconda提供了Python2.7和Python3.6两个版本。并且有32位和64位的区分。这里,我选择的是Python3.6的64位版本。在未来Python3x会逐步替代Python2x,所以建议选择Python3.6的版本。
在下载完这个软件后,接来就是安装了,安装过程极为简单。在安装目录这个过程中,选择选择其他的盘符,比如D盘。这样不会占用系统盘的空间,而导致时间久了,系统卡顿。之后,点击“next”,以后的步骤都是默认即可。
在安装ANACONDA完成之后,可以在“开始菜单”的所有程序中,找到Anacond3(64-bit)文件,这个文件中包含了各种数据分析的工具和软件,其中包括了“Jupyter”。Jupyter是一个交互式笔记本与IPython终端共享同一个内核,可以在其中运行Python语言。它是我们做数据分析最主要的工具。
我们运行一下Jupyter,会出现一个dos的黑窗。这个窗口请不要关闭它,过一段时间之后,程序会自动打开一个网页。这个网页是一个基于本地的服务,它的url是:http://localhost:8888/tree。它里面会列有一些文件,其实就是我们的C:\Users\Administrator路径下的文件。
我们选择新建一个文件。在类型下,选择Python3。此时页面会发生跳转到一个新的页面,在这个新页面下。这个新页面中有一个单元格,他的开头是In[]:。这一点它很类Ipython的界面。这个单元格中是可以输入Python的代码,并且运行结果会在下方显示。
我们一一个测试代码来演示一下,在这个环境中运行程序,并生成一个图表的效果。注意的是要在页面中生成图片必须要声明:%matplotlib inline。这样图表才会在页面中嵌入,否则图表是不会显示的。import matplotlib.pyplot as plt x=[1,2,3,4] y=[5,4,3,2] plt.figure() plt.subplot(221) plt.plot(x,y) plt.subplot(222) plt.bar(x,y) plt.subplots_adjust(wspace=0)plt.show()
当然我们可以做的不仅仅是画个图表这么简单。Python的强大无所不包,数分析只是小菜,我们来个复杂点的,一段代码进行网页自动采集国家统计局统计的CPI数据。并且以一个表格的形式在网页中显示。import requests,re,jsonfrom pandas import DataFrame,Seriesurl=u'http://data.stats.gov.cn/search.htm?s=CPI&m=searchdata&db=&p=0'res=requests.get(url)pat=re.compile(r'result':(\[.*?\])',re.S)m=pat.search(res.text)if m: print('success')mtt=json.loads(m.group(1))frame=DataFrame(tt)frame
喜欢本经验给点鼓励吧。
安装anaconda是要分清除自己的电脑是64位还是32位