年初,ChatGPT的的横空出世引发一系列AI领域的连锁反应,大模型如何才能和各行业结合,解决产业难题成为各界关注的焦点问题。金融行业作为天然数据密集型行业,也是人工智能应用最早和最普遍的行业,加之金融机构从高利率高风险的运营模式转化为精细化的运营模式,获客方式、风控策略差异化加大,这也导致风控领域成为观察大模型落地的重要场景。
(资料图)
金融风控由“规则对抗”进入“模型对抗”怎么理解?不同金融机构对大模型的接受程度如何?风控大模型对于金融机构风控性能的提升有没有一些可以量化的指标来评判?风控大模型是如何嵌入金融机构场景的?带着上述问题,每日经济新闻记者专访了腾讯云天御首席科学家李超,以下NBD代表每日经济新闻。
腾讯云天御首席科学家 李超 受访者供图
金融机构不仅要敏捷迭代策略,还要迭代模型本身
NBD:金融风控由“规则对抗”进入“模型对抗”是怎么理解的?
李超:“模型应用,产业先行”正在成为大模型应用的共识,这在金融行业体现的尤为明显。金融行业作为天然的数据密集型行业,又是人工智能应用最早和最普遍的行业,无疑是大模型落地的最佳场景。但金融行业对信息的高精度的要求和严苛的数据合规要求,让行业大模型在金融场景的落地需要贴合自身发展现状。
作为金融行业的“命门”,风控基本完成了从人工审核到智能风控的变化。由于贷款业务线上化、数字化以后,人工审批的效率远远不能满足业务发展,于是以机器学习模型为代表的人工智能审核成为金融风控的重要手段和构成部分。风控模型就是把专家经验抽象成一系列风控策略集,提升判断风险的效率。譬如欺诈检测模型、准入模型、风险定价模型、额度管理等贯穿金融信贷业务的全生命周期。可以说,风控模型是金融风控体系的技术核心。
传统的风控模型主要依托于金融机构的历史金融数据和专家经验,呈现出“静态模型+动态策略规则”的特征,即整体风控模型的框架不变,调整具体策略的阈值,例如以前针对有过三次逾期记录的用户申请不予通过,现在有可能根据欺诈态势调整为有过一次逾期记录的才不予通过。但在金融机构面临的内外部趋势变化下,金融机构不仅要敏捷迭代策略,还要迭代模型本身,构建以“动态模型+动态策略规则”为代表的“模型对抗”能力。
NBD:做大模型要有海量的数据,那我们的数据来源有哪些?是由金融机构授权后我们再去针对性的建模,还是会有一个普适性的模型去应对?
李超:关于大模型这件事,目前在行业里边讨论的比较多的是大语言模型(LLMS),就是ChatGPT,也是让这件事情得到大家更深入的关注。ChatGPT本身是一个大语言模型,它是无监督的自然语言处理分析的模型,用来解决聊天机器人这样一些场景。
今天我们讨论的金融风控大模型,依托腾讯云行业大模型和腾讯安全20多年黑灰产对抗经验沉淀,主要解决的问题并不是偏文本分析的场景,而是关于金融风控的欺诈识别大模型,本身是机器学习模型,并不是大语言模型。这个东西在训练的时候,更多应用了金融风控场景里面特有的风控样本。
我们最早做定制化服务的时候,其实并没有通过大模型,也就是基于Foundation model+迁移学习的机制,客户会根据自身客户收集的样本来去构建垂直场景的风控模型。虽然能够实现定制化的欺诈模式识别,但是在这过程中也发现通常客户自身积累的样本能力和速度是非常局限的,单纯用传统的机器学习方式给客户做模型的构建,很难去建设好既精准又稳定的风控模型。
基于我们在人工智能算法不断的深入研究,开始用到迁移学习的机制,逐渐发展到成为新一代基于大模型的模型对抗范式。它最主要的特点就是能够根据过往我们所积累的黑灰产一些样式和一些模型,把其中有用的知识通过知识蒸馏的方式收取出来,通过技术的手段,把这些知识形成基础模型,叫做Foundation model,Foundation model不同于一个通用模型,不需要直接去服务具体的场景,而是一个知识库。在这个“知识库”基础上,客户基于一些样本提示,就能够灵活地生成适配各个场景和不同金融机构的风控模型。
大模型助力金融机构风控建模:反欺诈效果提升20%,建模时间缩短90%
NBD:风控大模型对于银行、消金、互金这些金融机构风控性能的提升有没有一些可以量化的指标来评判?
李超:客户通过金融风控大模型来构建风控模型相比传统的风控建模方案,一般会有20%左右的反欺诈效果提升,建模时间也就是从样本收集、模型训练到部署上线的过程从以前的2周到现在仅需要2天。
另外,大模型让定制建模变得更加可行。在客户样本非常少或者没有的情况下,我们也能进行定制建模,同时这种定制建模的稳定性会比传统模型更稳定、更可用。所以这种大模型的核心价值,更多是使定制建模成为可能。
以某金融客户为例,建模效率提升60%。该金融机构自身渠道和客群变化比较快,客户的风控团队遵循风险动态治理的风控理念,需不断根据风险的变化迭代风控模型。然而基于传统的专家联合建模方式在效率和成本上都难以满足客户需求,腾讯云助力该客户实现了全流程自动化的风控建模,模型迭代周期从17天缩短到3天,风控模型迭代效率得到了极大的提升。
另外,某银行客户在小样本条件下建模性能提升20.5%,该客户因业务冷启动阶段欺诈样本积累不足,在风控建模阶段面临小样本训练难题,传统风控建模方式难以满足客户对模型性能的要求。使用金融风控大模型,客户基于少量提示样本就迁移得到适配自身业务场景的定制模型,相比于传统的建模方式模型KS(Kolmogorov-Smirnov,区分度)性能提升20.5%,在跨场景的泛化性测试上性能提升53%。
NBD:这个模型具体是怎么运作的?怎么嵌入金融机构场景的?
李超:我们首先是用一种对抗学习的方式把所有模型里面的有用知识抽取出来,再通过知识蒸馏的方式把这些有用的知识融合进一个Foundation model,基于这个大基础模型就能够快速生产出来新的模型。
当过往的知识越来越多的时候,对于场景样本的需求就会越来越少。大模型的整个逻辑,就是把过往所有知识全部加工在Foundation model里,这个Foundation model好比一个能够自动生产模型的机器人,只需要给它小量的场景样本提示,就能够生产出来对应场景的专属模型出来。生成的模型既有比较好的场景欺诈识别效果,又具备了通识能力,即模型泛化性。
从金融场景整体来看,目前更多场景是以贷前为主,贷中逐渐多了起来,贷后遇到的相对还是少一些。比较有代表性的是一些消金、互金公司,他们对审批流程做了很精细化的管理之后,在审批流程的很多环节都开始应用AI建模形式。因此也就有了定制建模的需求,贯穿在客户风险审批整个生命周期,比如反欺诈、客户分层、捞回、定额、定价,在很多环节都可以用大模型定制的方式。
不同金融机构的风控建模需求和挑战
NBD:在服务金融机构过程中,比如说银行、消金、互金,在服务的过程中,他们对于风控大模型的需求有没有哪些异同点是比较突出的?
李超:以我的经验来看,互金和消金对于新技术的应用比银行会更早一点,相对来说银行会更晚进入新技术应用的时期。
目前我们看到的是,整个银行业已经开始应用机器学习,不再像过去那样单一传统的线下手段或者评测的手段,已经广泛应用到机器学习模型评分机制,但是很多还没有建立起真正的敏捷迭代的动态风险管理迭代机制。当一个风控模型上线之后,不会轻易去进行更新。
互金公司的模型定制化需求是非常旺盛的,更愿意去尝试新的模型,消金介于银行和互金之间。很多互金公司、消金公司,他们的模型迭代非常快,有些3个月或者1个月就会迭代。很多互金公司,对不同金融产品不同渠道不同业务流程,都会做很多定制化的模型。
最近一年,很多金融机构已经开始意识到小样本的问题,他们发现定制出来的模型很快就会效果衰竭,所以模型需要非常快速的迭代,很大的原因就是小样本问题。
大模型出来后,很多金融机构更愿意使用大模型去构建更稳定的定制化模型,我们会把泛化能力更强、更广泛、多样化的信息给融合在模型里,消金、互金更多会使用大模型机制去实现模型快速迭代。
封面图片来源:视觉中国-VCG211323198264