机器学习:Python实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

5.3 采用标准Python类库导入数据

Python提供了一个标准类库CSV,用来处理CSV文件。这个类库中的reader()函数用来读入CSV文件。当CSV文件被读入后,可以利用这些数据生成一个NumPy数组,用来训练算法模型。首先下载数据文件到应用目录下,并命名文件为pima.csv。这个文件中所有的数据都是数字,并且数据中不含有文件头。代码如下:

    from csv import reader
    import numpy as np
    # 使用标准的Python类库导入CSV数据
    filename='pima_data.csv'
    with open(filename, 'rt')as raw_data:
        readers=reader(raw_data, delimiter=',')
        x=list(readers)
        data=np.array(x).astype('float')
        print(data.shape)

执行结果如下:

   (768, 9)

代码非常简单,就不详细进行讲解了。详细内容请查阅Python的API介绍。