1. 问题提出
“互联网+”背景下,大数据技术正迅速迈入金融行业,其中另类数据(alternative data)——作为传统金融数据的重要补充,被给予了广泛的关注。另类数据是指由征信机构和数据服务机构等收集并进行加工整理的、用于放贷机构授信决策的、在传统的借贷信息采集范围之外的其他信息,例如新闻舆情、社交平台数据和电商数据等 [1]。2017年《新一代人工智能发展规划》提出,建立金融大数据系统,建立金融风险智能预警与防控系统。2019年政府工作报告提出,激励加强普惠金融服务,切实使中小微企业融资紧张状况有明显改善。而对中小企业另类数据的采集能够一定程度上把握其信贷风险,从而有效解决这一难题。另类数据能够一定程度上解决中小企业因信用评级数据不足而导致的融资难问题,在提高银行贷款效率的同时,也响应了国家关于发展普惠金融的政策号召。
银行目前的贷款审查依然是以传统数据为主,传统金融数据主要包括企业的财务报表、银行信贷记录等,这些数据具有规范化、可用性的特点。任健(2012)认为,银行对贷款对象进行可行性的研究,确定贷款投向、投量,往往只注重依靠贷款“三查”,对日常的资料积累和信息收集不够重视,对市场状况、影响因素及变化趋势预见不力,把握不准,最终导致贷款决策失误,产生贷款风险 [2]。可以看出,传统金融数据不够全面、不够真实的缺点阻碍了贷款风险管理,而另类数据Volume (大量)、Variety (多样)、Velocity (高速)、Value (价值)的4V优势则弥补了这一不足。
“互联网+”时代,大数据技术已经日趋成熟。对于大数据,麦肯锡全球研究所对于大数据的定义是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。这一定义主要强调了大数据的数量和规模特征,庞淑娟(2015)提出了基于建模大数据可以应用于个人贷款信用风险预警、信用卡申请审批等 [3]。董立武(2019)提出运用大数据信息技术完善商业银行与客户之间的业务管理信息平台,利用云信息管理平台不同的信贷业务的信息进行收集管理,从而实现信息的跟踪与分析,从客户的信息中找到隐藏的潜在风险,并根据风险程度采取相应的解决措施 [4]。大数据在贷款风险管理中的用处主要是从庞大的数据量中挖掘出可用的信息,另类数据虽然在数据量、处理方式以及应用模式都与大数据类似,但是另类数据主要来源于借款人日常的生产生活,因此更加真实、及时,在贷款风险管理上的可靠度也更高。本文在前人研究基础之上,分析现有情况,提出另类数据应用措施使商业银行能够更精准地识别贷款风险。
2. 另类数据应用于银行贷款风险管理的必要性
2.1. 完善信用评级
另类数据作为传统金融数据的补充,有利于解决信用评级领域痛点。虽然我国的征信系统正不断完善,但仍有大量消费者处于信用盲区,无法获得信用评级。另外,现有的信用评级指标一定程度上限制了潜在的优质借贷者,使得放贷者无法精准地控制风险,放贷数量也受到了限制。在这种情况下,另类数据的获取、分析和应用可以改进银行的传统承销机制,将其与分析技术结合可以评估之前未标记过的客户和规模较小的客户,帮助更多人获得或提升信用评级,解决中小企业融资难的问题。
2.2. 验证借款人信息的真实性
传统的金融数据很有可能存在伪造和统计错误的情况。而另类数据主要来源于个人日常活动、商业过程和传感器,信息处理方获得的多为原始数据,降低了在计算、编制中出现错误的可能性,而且生产生活中的数据伪造难度较大,可以体现借款者真实的活动轨迹。
2.3. 动态追踪借款人还款能力变化
在传统的贷款模式下,银行在发放贷款尤其是短期贷款之后,很难获得关于借款人的新动态,贷款风险也随之增加。而另类数据体量大、传输速度快,这也有利于及时全面地追踪检查借款人的经营情况和还款能力,促进精准贷后管理,强化信贷风险控制的同时也能够夯实资产质量。
3. 另类数据应用于贷款风险管理的有利条件与制约因素
3.1. 有利条件
3.1.1. 另类数据来源丰富、体量巨大
另类数据主要来源于个人活动、商业活动和监测工具获取的数据,在互联网时代社交媒体、新闻评论和网络搜索等都记录了个人活动的数据,而交易数据、企业数据和政府收集的数据则产生于商业活动,监测工具比如卫星图像和地理定位等也提供了大量的数据。商业银行可以与政府、数据处理商等达成合作,从多个渠道获取需要的另类数据。
3.1.2. 另类数据处理技术发展迅速
随着大数据和人工智能的发展,另类数据的处理和应用有了日益坚固的技术支持。商业银行已经拥有高性能的计算机,能够引进先进的数据处理办法,在软硬件条件上满足另类数据处理的需要。此外,随着另类数据的兴起,专业的另类数据提供商不断增加,如金融数据服务商Wind在2019年已经开始收录另类数据,也有更多的金融科技公司不断研发、改进另类数据处理技术,为商业银行应用另类数据提供了可行性。
3.1.3. 有“互联网+”背景下大数据应用的基础
大数据技术已经日臻成熟,云计算和人工智能也提高了数据处理的效率,降低了成本。大数据广泛地应用于商业银行的经营活动中,如拓展渠道、个性化服务、精准营销、小微企业信贷、信用管理和风险管理等方面 [5]。银行在应用另类数据的初期也可以从这些领域着手,结合已有的大数据应用经验,不断扩展另类数据的应用范围和程度。
3.2. 制约因素
3.2.1. 另类数据的自身缺陷
1) 缺少优质可用的数据。大多数另类数据的数据长度往往很短,通常来说另类数据集的历史数据长度是5年以内(2到3年比较常见) [6]。短期数据难以追踪借款人的过去资信,一定程度上降低了信息的可靠度。2) 处理的难度较高。对于非结构化数据以及日益增长的文本数据和多媒体数据,对其进行分析处理需要相应的技术,如自然语言处理和人工智能。而且部分数据的产生具有主观性,这是在后期难以修正的,另类数据中的个人数据如社交评论、网络搜索等主观性较高,而个人数据在另类数据中的占比很大。3) 另类数据取得的合法性问题和监管问题。目前多数网站已经采取了反数据爬取的措施,增加了数据获取的难度,同时数据的获取是否会侵犯用户隐私还没有明确的规定,数据取得的合理合法性以及未来对于数据获取的约束存在极强的不确定性。对于冗杂的隐蔽数据,如果全面禁止商业收集和使用,就会影响相关行业发展,也会使监控成本飙升,但是如果不监控其使用,难以保证数据不被滥用 [7]。
3.2.2. 数据分散导致难以构成贷款客户全方位画像
另类数据也存在“数据孤岛”问题,分散于不同机构与部门的数据缺少共享平台和互通渠道 [8]。商业银行需要客户的信息,如网购记录、社交平台评论、芝麻信用积分等,对客户提供的传统数据进行辅助验证,但这些数据因为来源不同由多个数据供应商掌握,商业银行需要从多个数据供应商处购买,贷款成本大幅度增加,又提高了中小客户的贷款难度。贷款后对于客户信息的更新也要从多个平台进行整理,信息反馈链复杂,降低了贷款风险管理的效率。
3.2.3. 银行贷款领域对另类数据重视程度不足
银行的贷款客户可以分为大客户和中小客户,大客户主要是一些大型企业,其资信状况良好,可以提供完整的财务报表等传统金融数据,是银行贷款的主要流向对象。而中小客户,包括中小企业和个人,很难提供正规的财务、信用数据,信用风险较高,商业银行因其盈利性的本质大多不愿意将贷款发放给中小企业和没有征信记录的个人。即使另类数据可以作为补充,银行考虑到信息收集难度、贷款成本和研发费用,也不愿意通过应用另类数据来拓展中小贷款客户以及完善贷款风险管理制度,银行的重视程度不足也制约了另类数据在贷款领域的发展。
3.2.4. 银行缺乏相关技术和人才储备。
我国商业银行有贷款审查制度,银行按照固定的流程和标准审查借款人的相关情况。在另类数据大规模应用前,银行没有成熟的技术和专业的人才将其落实,而开发技术、培养人才以及制定规范的制度需要较高的成本。此外,中小银行对高端技术人才的吸引力较小,这也一定程度上制约了另类数据的发展。
4. 国内外另类数据应用经验
美国的FICO公司是使用预测分析技术和数据科学来提高运营决策效率方面的行业开创者,它通过对自身相关资源的整合,向新兴市场提供信用评分,释放了30亿信用缺失的消费者的经济活力,帮助放贷者为全球无法享受银行服务或者有限银行服务客户提供合适的信贷服务。FICO普惠金融的全球评分计划,对于建设符合中国国情的征信体系,有着很好的启示意义,可以充分利用另类数据来扩大普惠金融人群的覆盖面 [9]。国内商业银行可以借鉴FICO建立统一的、利用大数据和另类数据的信用评级系统,为无信用记录的人提供信用评级并挖掘出潜在优质客户。银行对于利用另类数据进行信用评分具有较高的需要,其担心拒绝没有信用评级的消费人群,这就意味着拒绝可能存在的盈利空间。一些信用合格者,如新移民者,没有借贷记录,但是可能具有还款意愿和能力。通过另类数据对这些群体进行评级,银行可以找到信用水平较高的潜在客户,在可接受风险范围内,增加新客户、提高盈利能力。
全国小微企业金融服务标杆浙江泰隆商业银行,派信贷员实地蹲点采集企业一手信息,比如商店的客流量、交易金额、货架的品种丰富度和服务员的态度,依据这些信息决定是否贷款及贷款额度。这一方式既提高了贷款的安全性,也为更多的潜在客户提供了贷款可能。商业银行可以学习浙江泰隆商业银行,开发和应用另类数据处理技术,培养专业化人才,通过实地调研获得可靠的另类数据,用于降低贷款风险。同时,将非结构化数据纳入信用体系,与数据供应商、处理商合作,进行资源整合,提高数据间的关联度,通过多个模型算法交叉验证数据的真实性。
5. “互联网+”背景下另类数据在银行贷款风险管理中的应用措施
5.1. 建立贷款领域应用的标准及规范
考虑到另类数据的复杂性,结合我国金融业发展现状,科学制定另类数据在贷款领域的应用标准及规范。国内金融行业应统一制定另类数据的获得、保密、使用、出售规范,明确使用范围和权限,对其进行严格的管理。其次,应该引导另类数据更好服务于贷款风险管理,对另类数据的应用进行整体规划,设定另类数据在贷款评级的标准,为贷款发放指标提供明确的依据。商业银行应强化内部管理,明确数据安全保障的责任与义务,做好数据安全风险评估,对数据设置不同的风险等级,从而加强安全防范。
5.2. 加强另类数据与传统数据的融合
另类数据作为传统数据的补充,其在贷款风险管理中的作用主要是验证传统数据的真实性、补足传统数据缺失。传统数据已经有了较为成熟的处理模式,企业财务报表、贷款记录、个人征信等都是处理后的可用性强的数据,另类数据也可以借鉴此模式,构建数据相互验证的模型,将非结构化数据在一定标准下进行结构化处理。此外,可以有目的性地搜寻需要补充的另类数据,降低不相关信息的干扰,提高评估的准确性。
5.3. 构建另类数据库,多维度完善信息
一方面,商业银行加强与数据供应商的合作,深入挖掘,尽可能全面地补充所需要的另类数据,如借款人网络消费记录、日常行为路径、社交平台发言等。另一方面,利用已有的公开数据补充数据库,如行政管理单位的工商、发票、税务、社保等真实经营数据以及司法、环保、征信机构的企业诉讼、失信、污染等数据,构建多维度的贷款信息数据库,将其应用于贷款风险管理。
5.4. 加大对另类数据的重视程度,促进金融普惠
另类数据应用受限的很大原因是商业银行对其的重视不足,商业银行应将促进金融普惠落实到日常贷款业务中。人民银行等机构应发挥领导作用,对于率先应用另类数据进行贷款风险管理的银行给予一定支持。前期的另类数据应用研发成本可以通过降低不良贷款率、扩大贷款范围得到补偿,另类数据的应用对于银行长远经营有着积极影响。
5.5. 拓展另类数据在贷款风险管理应用的深度
另类数据可以应用于贷款“三查”制度,帮助改进和完善银行贷款风险管理模式。在贷前调查时,另类数据可以辅助调查企业法人代表、企业资金、经营情况、贷款用途等,还可以对企业的资产负债表、利润表、现金流量表进行验证,防止企业进行财务报表伪造,其次银行应该注重扩充另类数据的种类,提高另类数据的可靠性,全面、客观评价贷款对象,并考虑对实际还款能力良好的借款人放款。在贷中审查时,将另类数据作为贷款对象提供资料的补充,了解贷款项目的可行程度,确定贷款量和贷款利率。在贷后检查时,银行可以使用实时的另类数据监测借款人的资信情况,并及时对贷款进行调整,可以提高贷款的安全性,优化银行资产质量。
基金项目
安徽大学2020年省大学生创新创业训练计划项目《“互联网+”背景下另类数据在银行贷款风险管理中的应用研究》(项目编号:202010357624)。