Python金融数据分析(原书第2版)
上QQ阅读APP看书,第一时间看更新

2.3 因子模型的多元线性回归

许多Python包(如SciPy)都含有回归函数及多个回归函数的变体,statsmodels包可以提供统计模型的描述性统计与估计。你可以在Statsmodels官网https://www.statsmodels.org获得更多相关信息。

如果你的Python环境还没有安装Statsmodels,可以在命令行窗口运行以下命令进行安装:

042-01

005-02如果你安装的包已经存在于环境中,-U指令会告诉pip模块将你选择的包升级到最新的可用版本。

本例使用statsmodels模块的ols函数进行最小二乘回归分析。

假设我们已经构建一个含有7个因子的APT模型,该模型可以返回Y的值,下列数据集从t1t9的9个周期内获得。X1X7为每个周期内观察到的独立变量,因此该回归问题可表示为:

Y = Xi,1F1 + Xi,2F2 + … + Xi,7F7 + c

输入如下代码,对X值和Y值进行最小二乘回归:

043-01

输入以下代码来查看详细的回归数据:

043-02

OLS回归结果是一个很长的统计信息表,我们最关注的是APT模型的系数(如表2-2所示)。

表 2-2

043-03

coef这一列给出了常数c的回归系数值(从X1X7)。同样,我们可以使用params函数计算所求系数:

043-04

从上面的例子中可以看出,两种方法求得的系数值是相同的。