一、征信大数据简介
根据《征信业管理条例》,央行征信系统依法采集从事信贷业务的机构的信贷信息,以银行信贷信息为核心,还包括企业和个人基本信息以及反映其信用状况的非金融负债信息、法院信息和政府部门公共信息及费用缴纳信息,既有正面信息,也有负面信息。央行征信系统的数据具有全样本、大覆盖、跨周期的特点,不仅数据量大,而且最重要的是有大的价值,是典型的金融大数据。此外,经过仅10多年的征信系统建设,央行征信系统的数据质量经过不断完善,得到了很好的保证。
(一)数据规模大
截至2017年底,征信系统已经收录了9.5亿个自然人(其中有信贷记录的自然人为4.8亿个)、2506万户企业及其他组织(其中有信贷记录的企业及其他组织为686万户)。截至2017年底,征信中心每月接收10万个报文,更新13亿条个人征信业务信息,0.4亿条企业征信业务信息。
(二)金融信息种类全
目前,征信系统基本接入了国内各类正规放贷机构。商业银行、汽车金融公司及消费金融公司已基本全部接入;通过互联网等多种方式接入了1729家小额贷款公司和1782家融资性担保公司等小微机构;通过发起行组织一口接入,帮助七成以上村镇银行接入征信系统;此外民营银行、信托公司、财务公司、租赁公司、资产管理公司、保险公司、证券公司加快接入征信系统。证券融资信息、信用保证保险信息、约定回购式证券交易信息、股票质押式回购交易信息、非金融企业债券融资信息等也逐步纳入征信系统,征信数据信息内涵不断丰富。
(三)数据质量好
数据质量是征信机构的生命线。征信中心多措并举,保证征信数据质量。征信系统制定完善的接口规范,所有接入机构严格按照接口规范报送数据,稳定报送三个月数据后,才开通查询权限。征信中心为解决商业银行对接口规范理解的偏差,广泛开展培训工作,并对业务多、报送数据比重大的金融机构开展非现场两端核对和现场检查工作,进一步保障数据质量。同时建立数据质量量化评价制度,让数据报送机构持续重视数据质量问题。
(四)时间跨度长
从1992年到2006年,我国逐渐建立起全国集中统一的企业和个人征信系统,征信系统正式运行至今已有十二年,存储了较长时间的信用信息。同时,主要商业银行还将新中国成立以来的历史数据全量上报至征信系统,所以,征信数据时间跨度长,积累了较长时间序列的信用主体基本信息及借贷信息。
(五)数据仍不够全面
随着我国信贷业的快速发展,金融创新深化,银行业的部分创新型信贷业务因接口规范的限制未能报送至征信系统,大量表外、非标业务也游离在征信系统的报送范围之外。另外,近些年来,互联网金融快速发展,人人贷(Person - to - Person,P2P)、现金贷等超短期贷款因为与传统信贷业务的模式不同,尚未接入征信系统,因此征信系统采集的数据还不能完全反映信用主体的负债信息。
尽管从微观层面看,征信系统采集的数据还不能完全反映信用主体的负债信息,尚不足以对部分信用主体进行完整评估,但从宏观层面看,征信系统基本覆盖了我国银行信贷信息,征信大数据是非常接近总体的样本数据,虽有局限性,但仍然是具有极高价值的产业经济分析的一手数据。