深入浅出Python机器学习
上QQ阅读APP看书,第一时间看更新

2.3.3 pandas——数据分析的利器

pandas是一个Python中用于进行数据分析的库,它可以生成类似Excel表格式的数据表,而且可以对数据表进行修改操作。pandas还有个强大的功能,它可以从很多不同种类的数据库中提取数据,如SQL数据库、Excel表格甚至CSV文件。pandas还支持在不同的列中使用不同类型的数据,如整型数、浮点数,或是字符串。下面我们用一个例子来说明pandas的功能。在Jupyter Notebook中输入代码如下:

运行上述代码,会得到一个数据表如图2-13所示。

图2-13 pandas.Dataframe生成的数据表

同时,我们还可以从数据表中进行查询操作,例如我们想把不在北京的同学信息显示出来,可以输入下面这一行代码:

display(data_frame[data_frame.City != "北京"])
#显示所有不在北京的同学信息

运行结果如图2-14所示。

图2-14 显示所有不在北京的同学信息

现在我们对pandas有了一些初步的了解,在本书后面的内容中,我们还将深入讲解pandas的功能和用法。