Python金融数据分析(原书第2版)
上QQ阅读APP看书,第一时间看更新

第1章 Python金融分析概述

从本书第1版出版到现在,Python和许多第三方库都有了重要的更新——许多工具和特性已经被遗弃,转而支持新的工具和特性。本章将指导你如何获取最新的可用工具以及准备本书中将使用的环境。

本书需要的大部分数据集将从Quandl导入,这是一个为金融、经济和替代数据服务的平台。这些数据是由各种数据出版商提供的,包括联合国、世界银行、中央银行、贸易交易所、投资研究公司还有Quandl社区的成员。使用Python的Quandl模块,可以便捷地下载数据集并进行金融分析,从而获得有用的信息。

本书将使用pandas模块对时间序列数据进行操作。这个模块中的两个主要数据结构是Series对象和DataFrame对象,它们可用于绘制图表并使复杂的信息可视化。本章将介绍金融时间序列计算和分析的常用方法。

本章的目的是介绍建立工作环境的基础并讲解一些将在本书中使用的库。和其他软件包一样,这几年pandas模块也发生了巨大的变化。由于很多方法已经被废弃,以前编写的旧版本pandas接口代码已经无法使用。本书中使用的pandas是0.23版本,所有的代码都以这个版本为准。

本章讨论以下主题:

  • 为你的环境设置Python、Jupyter、Quandl以及其他的一些库
  • 从Quandl上下载数据集并绘制你的第一张图表
  • 绘制价格与成交量的关系图以及烛台图
  • 计算和绘制收益率图和累积收益率图
  • 绘制波动率图、直方图和Q-Q图
  • 可视化数据集之间的相关性并生成关联矩阵
  • 可视化简单移动平均线和指数移动平均线