对外经济贸易大学 21 0000
摘 要:随着近年来数据搜集处理技术和消费需求的快速发展,征信行业从国外的一个小众金融服务子行业发展成为国际,国内的热点话题。征信作为信息技术和金融交叉融合的一个领域,适逢互联网的兴起和大数据的到来。
关键词:大数据征信;互联网金融;
征信业务均是以数据为基础的,所以数据与征信有着天然的联系。当基于数据的决策和运营使企业获得巨大利润,个人隐私的保护以及产品服务的便利,大数据征信成为主流趋势。
大数据征信对互联网金融的重要意义
1.1互联网金融的基本含义及特点
互联网金融(ITFIN)是指传统金融机构与互联网企业利用互联网技术和信息通信技术实现资金融通、支付、投资和信息中介服务的新型金融业务模式。
互联网金融的迅速发展,主要源于四个重要特点:1)交易成本相对低廉:借助互联网平台,可以直接进行信息发布,定价,商品匹配,减少了人力、物力的投入,很大程度上降低了交易成本。2)交易迅速便捷:只需要在网络上进行沟通交流,速度更快,效率更高。3)数据价值巨大:大数据及电商企业的快速崛起,推动了互联网金融业发展。人们在享受互联网金融带来的便捷同时,监管部门为了保护消费者权益,要求的实名制网上购物,网上交友等等的一些企业及个人的行为,几乎完全暴露在网络空间中,形成海量数据。而这些数据无疑就是资源,其中的商业价值是无穷的。4)迭代更新快,监管难度强,风险系数高。随着大数据技术的发展,加上金融在经济领域的活跃性,很多产品如雨后春笋的冒出来了,例如支付宝,余额宝,花呗以及网络银行,网络证券等等。国家当前缺乏对互联网金融的相关监管措施,一些不法分子趁机实施诈骗活动,在没有相关法律制度的约束下,对网络安全造成了威胁。
1.2 互联网金融对征信系统的依赖
传统的征信体系,效率低,速度慢,覆盖率低,无法满足现阶段的互联网金融的业务。大数据技术推动了互联网征信系统不断完善,需对海量数据进行处理、加工、验证,探索和挖潜大数据技术,不仅实现了对数据、图像、音频、文字等结构和非结构化数据快速、高效整合、分析、处理,还建立动态、连续的模型,预测数据的未来趋势走向,这对互联网金融发展,起着决定性的作用。
2.大数据征信在互联网金融应用中的特点
大数据征信主要借助模型来分析和预判当前存在的风险。简单点来讲,可以依据信用评分,判断还款人当前偿债能力、是否有主动还款意愿、是否存在恶意拖欠等欺诈风险,大数据征信在互联网金融体系中发挥巨大作用。源于其如下几个特点。
2.1覆盖人群广泛
随着互联网的高速发展,现有的大数据征信已然已经不局限于商业银行和政府部门,基于互联网的个人交易及社交信息也会被纳入大数据征信的范畴,与传统意义上的征信体系有所不同。据新闻媒体统计,截至2020年12月底,征信系统一共收录了11亿的自然人,6092.3万户的企业及其他组织;其中,收录小微企业3656.1万户、个体工商户1167万户。如此可见,互联网的开放性大大提高了大数据征信的覆盖范围。
2.2信息维度多元化
为了确保大数据征信的全面性和系统性,应确保信息来源渠道广泛,才能提高信用评估准确性。传统大数据征信的数据来源主要借助历史信贷记录评判客户是否具备经济能力,随着大数据技术的发展,当前征信系统还包括个人消费记录、交易行为等半结构化数据,可以判断客户的偿债能力。大数据覆盖面广,对网上消费激励、共享单车租借情况都能全面获取,甚至生活缴费等都能收录到大数据系统,全方面展现个人资金偿付能力,信息真实度及大众信任指数较高。
2.3数据来源丰富
现如今,个人在网上的交易行为、浏览行为都可以收录至大数据系统。例如电商、互联网金融、共享经济等场景均可以通过大数据、云计算、数据挖掘等技术,运用数学建模等形式计算,为客户出具个性化的专属信用评估报告。其采集周期长,使用频率高,同时信息更新也及时。比如芝麻信用,月月更新,显示的信用指数对电商经济具有重要意义。
3大数据征信在互联网金融中的应用流程
大数据技术不断创新发展,渗透到各领域,互联网金融企业采纳大数据征信技术,在数据采集,数据处理,数据分析和挖掘过程中发挥巨大作用。大部分人可能对数据征信比较抽象,简单来讲,就是把分散在不同的授信机构聚龙在一块,然后处理加工得出一份完整的征信报告。这份征信报告可以挖掘风险,解决信息不完整,减少交易成本。
3.1数据采集
数据采集的方式有很多种,普通的互联网采集可以通过爬虫技术。由于数据量大及数据的隐私性,很多物联网公司均有独有的采集工具。例如:Cloudera的Flume,Hadoop的Chukwa,Facebook的Scribe等,这种专用工具均选用分布式架构,速度快,性能高。
3.2数据预处理
针对海量数据进行分析时,因为数据库太大,数据难免出现冗余或不完整等,低质量的数据将导致低质量的挖掘结果,故需进行简单的清洗和预处理工作。目前缺乏对数据预处理相关标准,常用流程为:去除唯一属性、处理缺失值、属性编码、数据标准化正则化、特征选择、主成分分析。
3.3数据挖掘与分析
数据分析是提取数据中有价值的信息展开思考,比如统计平均数、标准差等等,而数据挖掘是针对海量数据进行分析及挖掘出未知、有参考意义的信息。比如针对个人网上行为挖掘出用户潜在需求信息,促进交易的达成。相比较传统的数据分析,数据挖掘具有实用性强,便捷有效的特征。数据挖掘常用的模型有很多种,可采用分类,神经网络,贝叶斯方法,决策树,关联规则等多种不同的分析方式进行信息挖掘。
3.4数据服务
大数据征信在互联网金融领域的深入渗透,延展了诸多有关征信相关服务和产品。征信产品可就提供的综合数据分析和挖掘,生成征信报告,协助客户判别和决策,有效的减少了风险和促进交易的快速达成。大数据使得互联网服务较为广域,从传统面向单一金融服务业,而不断向保险业、汽车行业等跨领域渗透,甚至在医疗护理等经济和社会领域等延展业务。基于数据资源、分析及决策服务,面向金融机构的征信产品与征信报告区别较大,只提供当月时点数据的服务,可以查询客户近30个月的相关征信信息,动态的呈现了个人消费者的征信变化,更精确地划分了风险等级和风险类别。
4大数据征信在互联网金融的应用场景
大数据征信不仅要收集海量数据,并在数据基础上进行回归分析,能根据网上行迹和交易细节中反映企业和个人的性格及信用指数,获得的信息可靠性更强,同时业能根据海量数据预测未来趋势。
4.1高频交易和算法交易
交易者为了获取经济价值最大化,一般会采取上述两种交易方式。高频交易的目的主要是分析如何从交易市场中赚钱,可以实现快捷交易,控制交易成本。交易者应借助金融大数据技术,对交易者的交易记录全面分析。算法交易主要控制各环节冗余部分,避免受到市场冲击,控制交易成本。如:在基金收盘最后环节,通过算法交易可以快速识别基金未来发展走势,为决策者提供精准信息,获取的更大的利益价值。
4.2进行市场情绪分析
每个交易者都会对市场有自己的看法,看法主要体现在每一笔订单,市场参与者的看法的总和即是所谓的市场情绪。大约6年前,对冲基金从Facebook、博客、聊天室等社交平台中提取市场情绪信息开发出算法交易,大大提高了基金的汇报率。对冲基金也称之为避险基金或套期保值基金,外国专家查德•彼得于2008年筹集了100万元建立了对冲基金,通过社交网站分析企业情绪,确定基金的交易策略,该基金的回报率在2010年高达40%。2014年世界杯,百度借助大数据市场情绪分析,对于四分之一决算及十六强预测中,准确度达到100%,从那时起,国内大数据在预测方面的独特作用逐渐显露。
4.3提高风险的管理力度
通过对大量小型企业交易数据的收集,金融机构并对其交易内容,经营状况、资金需求及行业发展具体分析,协助解决小型企业经营中遇到的问题。现如今的支付宝的借呗,京东的金条等小额贷款模式,也为弱势群体提供了便利。
5大数据征信在互联网金融的具体应用
我国当前金融体系有待于加强,用户群体庞大,但缺乏精准性,影响大数据征信开展,针对性的互联网金融产品较少,仍离不开央行征信,规模较大公司可以独自构建信用评价体系,而小规模企业职能从第三方服务机构获得征信服务。
5.1联网金融的风控体系分类
互联网金融的风控体系包括中小互联网金融公司及大型电商交易体系。其中中小互联网金融公司可以通过自身获取的一手数据为征信系统提供基础数据,帮助征信机构构建信用评价体系。大型电商交易体系类似于京东、淘宝等,通过分析电商交易记录相关信息为征信系统提供数据信息。
5.2阿里为例的大数据征信使用
央行的征信系统通过调查各大银行记录及社会机构相关信用记录,为各大银行或个人提供征信查询服务,缺乏对互联网公司数据的获取。随着我国互联网网民数量的增加,互联网数据量贩式增长,为降低风险输出,阿里最早是通过淘宝、支付宝等支付记录判断个人征信情况,同时结合卖家销售数据及银行流水作为参考依据,进行挖掘分析建立信用体系。2013年,阿里为获取社交大数据,花5.86亿美元来收购新浪微博的18%股份来完善大数据。2015年1月,阿里旗下蚂蚁金服于推出了首个个人信用评分-芝麻信用,阿里这些动作主要是构建完善的征信评估体系。阿里平台不断探寻更加新颖的合作模式,与商户共同开展蚂蚁微带、芝麻信用等,为微小企业和个人提供便捷服务,满足人们个人金融和生活缴费类需求。生活类服务包括人们日常生活消费如水、电、煤、物业费、电话费、网络费等,可以真实的反应用户财务支出情况,为征信数据收集提供基础资料。
5.2大数据征信的推动与发展
我国有关大数据法律仍存在盲区,人们对互联网信息的不信任,难以得到妥善保护。因此,提高了对征信重视和应用。首先,应构建完善的保护机制。加强监管力度,针对目前互联网金融体系设置专项管理机构,针对个人隐私管理完善法律制度,促进信息整合效率和分析效率。日常工作中应细化工作,提升自身职业道德,增强自律意识,完善相关制度体系。其次,应增加多元化的数据仓库。数据库的建立需要大量基础信息,数据间存在一定的内在关联,避免数据孤岛的现象。最后,提高人们对于大数据征信认知。借助多媒体渠道提高对大数据征信的宣传,借鉴成功的经验,提高社会的广泛共识度。
6结束语
在当前互联网金融蓬勃发展的态势下,征信管理系统也要随着产业发展有所强化,彼此相互促进,逐步形成健康成熟有序的金融体系。因此要积极促进大数据征信发展,正确管理金融风险,推动我国经济继续高质量发展。
参考文献:
[1]常振芳. 互联网金融信用体系建设和风险管理研究[D].南京大学,2018.
[2]李晓刚. 互联网金融个人征信体系建设研究[D].浙江大学,2017.
[3]周大林. 基于大数据征信的商业银行小微企业信贷风险控制研究[D].安徽大学,2017.
[4]姜俊琳. 大数据时代的征信创新与发展研究[D].浙江大学,2016.
[5]于欣言. 大数据在互联网金融征信中的应用研究[D].首都经济贸易大学,2016.
作者简介:卢元元(1992-),女,汉族,江苏人,本科,对外经济贸易大学统计学院在职人员高级课程研修班学员。研究方向:统计学-大数据分析