多语言展示
当前在线:1788今日阅读:103今日分享:49

如何快速搭建基于Python语言的数据分析环境。

现在都流行大数据,各类大数据教程层出不穷。其中就有关于Python语言的大数据教程,但是这个Python的安装过程和各类模块是相互独立安装的,往往不能一步到位的。很多时候我们花费太多的时间在下载各类库,耽误了学习的热情。那么有没有快速搭建一个基于Python语言的数据分析环境的方法呢?看了这个经验,你就知道如何节省这个过程了!
工具/原料
1

ANACONDA

2

电脑

方法/步骤
1

用python做数据分析不并是单单下载一个Python就可以了,还需要有模块、库。第三方的库往往是不会集成到Python。如果我们要把这些库和Python一起打包下载,并安装到电脑,那么我们可以选择安装另一个软件ANACONDA。

2

首先是下载安装。Anaconda提供了Python2.7和Python3.6两个版本。并且有32位和64位的区分。这里,我选择的是Python3.6的64位版本。在未来Python3x会逐步替代Python2x,所以建议选择Python3.6的版本。

3

在下载完这个软件后,接来就是安装了,安装过程极为简单。在安装目录这个过程中,选择选择其他的盘符,比如D盘。这样不会占用系统盘的空间,而导致时间久了,系统卡顿。之后,点击“next”,以后的步骤都是默认即可。

4

在安装ANACONDA完成之后,可以在“开始菜单”的所有程序中,找到Anacond3(64-bit)文件,这个文件中包含了各种数据分析的工具和软件,其中包括了“Jupyter”。Jupyter是一个交互式笔记本与IPython终端共享同一个内核,可以在其中运行Python语言。它是我们做数据分析最主要的工具。

5

我们运行一下Jupyter,会出现一个dos的黑窗。这个窗口请不要关闭它,过一段时间之后,程序会自动打开一个网页。这个网页是一个基于本地的服务,它的url是:http://localhost:8888/tree。它里面会列有一些文件,其实就是我们的C:\Users\Administrator路径下的文件。

6

我们选择新建一个文件。在类型下,选择Python3。此时页面会发生跳转到一个新的页面,在这个新页面下。这个新页面中有一个单元格,他的开头是In[]:。这一点它很类Ipython的界面。这个单元格中是可以输入Python的代码,并且运行结果会在下方显示。

7

我们一一个测试代码来演示一下,在这个环境中运行程序,并生成一个图表的效果。注意的是要在页面中生成图片必须要声明:%matplotlib inline。这样图表才会在页面中嵌入,否则图表是不会显示的。import  matplotlib.pyplot as plt x=[1,2,3,4] y=[5,4,3,2] plt.figure() plt.subplot(221) plt.plot(x,y) plt.subplot(222) plt.bar(x,y) plt.subplots_adjust(wspace=0)plt.show()

8

当然我们可以做的不仅仅是画个图表这么简单。Python的强大无所不包,数分析只是小菜,我们来个复杂点的,一段代码进行网页自动采集国家统计局统计的CPI数据。并且以一个表格的形式在网页中显示。import requests,re,jsonfrom pandas import DataFrame,Seriesurl=u'http://data.stats.gov.cn/search.htm?s=CPI&m=searchdata&db=&p=0'res=requests.get(url)pat=re.compile(r'result':(\[.*?\])',re.S)m=pat.search(res.text)if m:    print('success')mtt=json.loads(m.group(1))frame=DataFrame(tt)frame

9

喜欢本经验给点鼓励吧。

注意事项

安装anaconda是要分清除自己的电脑是64位还是32位

推荐信息