AI大模型落地遇冷,金融机构加速探索技术路径
创始人
2025-03-10 22:40:41
0

金融机构竞相接入大模型,但其应用效果在金融领域并不理想,面临效率瓶颈、技术局限和“幻觉”问题等挑战。

年初以来,随着DeepSeek爆火,金融机构竞相开展大模型计划。工商银行近日宣布完成DeepSeek大模型私有化部署,“工银智涌”体系已覆盖信贷、风控等20余个业务条线,落地场景超200个,成为大行AI转型标杆。截至3月10日,已有20余家银行宣布接入Deepseek系列模型。目前,尽管金融机构对大模型的热情高涨,实际应用效果却并不如预期。

一方面,大模型在金融领域的应用效率并不理想,比如许多银行在引入大模型后,发现生成的内容需要大量人工干预,甚至在一些关键业务上,AI的可靠性不如人工处理。另一方面,尽管DeepSeek的开源特性推动金融业的“技术普惠”,但金融机构在应用过程中仍面临数据安全与合规的挑战。

业内人士表示,尽管金融机构对AI大模型的应用充满期待,但目前仍面临效率瓶颈、技术局限以及“幻觉”问题等多重挑战,在提升效率的同时解决上述问题,成为金融行业亟待攻克的难题。

高投入、低产出的瓶颈

在采访过程中,记者发现,AI大模型在金融行业的应用实际效果与预期仍有较大差距。

某大行员工对记者表示,在实际工作中,AI系统生成的内容常常需要大量人工干预,在一些关键业务上,AI的表现还不如人工处理可靠。

某股份行的科技部门负责人也表示,目前银行的业务主线流程中,大模型的切入还比较有限,主要集中在所谓的“边缘业务”。例如,智能报告系统虽然被视为一个亮点,但目前仍需要通过人工干预来解决幻觉等问题,无法完全依赖AIGC实现全自动化解决业务痛点。

比如,在辅助合同审核方面,尽管不少金融机构已经引入了AI大模型,但目前准确性欠佳。许多银行虽然优化了柜面流程,但由于机器的准确度不够,人工还需要再检查一遍,这并没有达到省事的效果。一位银行柜员对记者说:“机器审核的结果我们不敢完全信任,最后还是要靠人工复核,反而增加了工作量。”

不仅如此,AI大模型在处理关键金融业务时的专业辨别能力仍存在不足。例如,在信贷审批领域,大模型可能无法准确区分正常的贷款审批和潜在的贷款诈骗行为。

记者还从多家证券机构了解到,尽管一些金融大模型早已深入行业操作流程,但在文件报送、高频交易等重要环节,仍需依赖人工审核。一位证券机构交易员表示:“之前可能两个人做一个环节,花上两三个小时也就结束了,现在先让大模型做,还要给关键词、调整逻辑,最后还要核对一遍,前后花费的时间和自己做差不多,甚至还要多。”

此外,不少银行员工还关心大模型在授信流程中的应用。他们希望大模型能够生成尽调报告,并将数据整理成表格,从而减轻人工负担。然而,目前这一功能的实现也不太理想。一位股份行授信部门员工对记者说:“大模型生成的尽调报告内容不完整,数据表格也经常出错,我们只能当作参考,大部分工作还是要自己来。”

AI大模型“高投入、低产出”也成为金融机构面临的挑战。在成本方面,不少银行科技部门引入大模型的投入巨大,无论是服务采买还是运行所需的硬件资源,都是一笔不小的开支,但效益却难以量化。一位大行科技部门员工向记者透露:“我们引入大模型后,硬件设备的投入增加了近30%,但实际业务效率提升并不明显,这让管理层对后续投入产生了疑虑。”

某股份行员工还向记者透露,该行此前斥巨资打造AI系统,但运行结果不尽如人意。“我们投入了大量资源,但实际收益却微乎其微。”该员工表示,这个系统一半的时间被用于演示PPT,另一半的时间则被用于修复系统漏洞。

去“幻觉”的探索

随着人工智能技术在金融领域的广泛应用,AI大模型的“幻觉”问题逐渐成为行业关注的焦点。所谓“幻觉”,是指AI大模型生成的内容与现实不符或缺乏依据的现象,这在金融领域可能导致严重的信息误导和风险。

“大模型的幻觉现象主要由多个因素共同作用,其中训练数据的质量、金融领域的复杂性以及模型架构设计是关键影响因素。”数字经济学者、工信部信息通信经济专家委员会委员、DCCI互联网研究院院长刘兴亮对记者表示。

北京国家金融科技认证中心副总经理李振指出,金融行业涉及复杂的金融工具、市场动态和专业术语,模型理解这些内容的难度较大。一方面,训练数据的不准确可能导致模型出现缺陷;另一方面,存在偏差的对齐数据可能使模型倾向于迎合用户观点,而非依据客观事实进行判断。

华院计算蔡华博士对记者表示,自回归文本生成方式由于缺乏外部知识验证机制,容易出现幻觉问题。在处理长文本推理和复杂逻辑推理时,这种局限性尤为明显。特别是在跨段落、跨文档推理时,模型容易引入逻辑混乱或错误推断,进一步加大了幻觉出现的概率。

为应对这一挑战,金融机构和科技企业正在积极探索解决方案。记者了解到,目前,金融领域的解决方案主要围绕RAG(搜索增强生成)、高质量指令参数数据集、结合格式化数据和计算能力进行优化。

“RAG技术可以通过改变提示的方式,有效提高回答的准确性。”华院计算董事长宣晓华对记者表示,大模型主要依赖归纳法进行学习和生成,在微调阶段,如果使用高质量的数据集,且该数据集能够全面覆盖所属领域的各个方面,那么大模型的可靠性也会得到显著提升。

大型金融机构更倾向于采用RAG+搜索的方式,结合专业数据库进行金融数据库的标注和分析。某大型外资银行科技部门人士对记者表示,数据是AI大模型的基础,质量直接影响模型的准确性和可靠性,采用RAG技术,让AI在回答问题时能够实时调用专业领域的知识和数据,从而提高输出的准确性和可靠性。

例如,在专业的保险领域,往往需要投入大量人力与时间,对海量的保险条款、PDF文档及Excel数据进行加工与标签化处理,确保数据的准确性和可用性。上海燕道数科负责人娄道永对记者表示,保险大模型往往要通过积累海量数据并运用精算技术,将全国范围内的保险产品、社保规则及相关法律法规等信息进行结构化处理,涵盖全行业寿险产品、社保规则以及养老、医疗等多维度数据,这不仅需要强大的技术支持,更离不开专业精算团队的深度参与。

定制化训练与场景优化也是金融机构在去“幻觉”化中常用的办法。金融机构通过定制化训练,针对特定业务场景优化AI模型。例如,宁波银行接入DeepSeek大模型后,通过业务人员的微调训练和专业语料库支持,尝试降低“幻觉”问题。富国基金则通过将大语言模型应用于量化投资决策,利用情绪因子等技术提升业务效率。

上海人工智能研究院算法专家陆文韬总结,为了能有效避免AI大模型生成错误结果、产生“幻觉”,从技术实现角度应该注意三个方面问题,一是确保训练数据的高质量和多样性至关重要,二是调整模型架构与训练策略,三是完善实时监控与反馈机制。

除了RAG架构之外,还可以采用多种方法来优化模型性能。蔡华对记者表示,例如,强化学习优化(RLHF),通过人类反馈提升输出的真实性和专业性,减少错误。同时,是基于约束的生成,利用外部API校验或规则模板约束,避免生成不符合事实的内容。此外,结合Agent技术,增强模型的工具调用和任务规划能力,减少幻觉,提升在金融等领域的可靠性。

对于场景优化中保护行业核心技术和数据的问题,陆文韬提出,为保障金融科技领域的数据安全与合规,行业可借鉴数据脱敏与加密、可信数据生态构建、合规工具链完善等方法。例如,采用联邦学习实现“数据可用不可见”,确保原始数据不外泄;利用区块链技术进行语料共享存证,实现数据确权与溯源等。

相关内容

热门资讯

一个女孩说把我放在心里最深处是... 一个女孩说把我放在心里最深处是什么意思?很久以前曾经追过她,但现在我们现在并没有恋爱,某日突然说了一...
求男主角很正义的都市异能小说!... 求男主角很正义的都市异能小说!!!像迪迦续集戴拿奥特曼主角飞鸟那样!又阳光又正义!别外发现和谈谈心恋...
新房装修,电路(暗线)怎么走最... 新房装修,电路(暗线)怎么走最好?最好走的横平竖直,尽量避免走斜线,最好不要走,方便以后维修还有安装...
张大千画虎 张大千画虎老虎为什么要咬张大千我国有位举世闻名的大画家,名叫张大千他画的虎生龙活虎,栩栩如生。 张大...
与玄学称霸现代有异曲同工之妙的... 与玄学称霸现代有异曲同工之妙的书有那些 [古穿今]玄学称霸现代 市井生活记事 楚氏昭华 ...
修真的书哪些比较好看 修真的书哪些比较好看最早的应该是飘渺之旅了,把修真的体系写的相当完整,堪称经典了,之后好长一段时间内...
法国官员呼吁本国科研机构和高校... 转自:千龙网新华社巴黎3月10日电(记者罗毓)据法国《解放报》9日报道,法国负责高等教育和科研的部长...
佛学中的"无间&qu... 佛学中的"无间"指的是什么“无间”二字意指佛教中的“无间地狱”,出自《法华经》,《俱舍论》,《玄应音...
儿童歌曲无关爱情,欢快点,不要... 儿童歌曲无关爱情,欢快点,不要太幼稚万物生 试下
推荐一些适合二十岁读的好书 推荐一些适合二十岁读的好书《哲学是一剂良药》【美】罗·马里诺夫/著,没有温暖,但看完之后可以系统的形...
有哪些男主玄幻小说只有一个女主... 有哪些男主玄幻小说只有一个女主角的?仙逆,求魔,诛仙,将夜,需要的看我头像,好书多了去!
两会中国经济问答丨如何持续用力... 转自:千龙网“止跌回稳”“好房子”“房地产发展新模式”……全国两会期间,房地产问题成为会场内外不少代...
这辈子我们不能在一起 这辈子我们不能在一起为什么你想和她再做朋友,多半是还放不下,既然已经知道不能再一起了,就不要给彼此增...
怎么样可以一句话把女生逗笑? 怎么样可以一句话把女生逗笑?是说灵魂啊不能太空旷不然走过以后连回声都不会留下何苦总是问可以了吗总是回...
你不是我,所以不用懂我的繁体字 你不是我,所以不用懂我的繁体字繁华的尓丆4щǒ,所鉯卜用忄董我尓囨湜щǒ,葰鉯囨苚忄董щǒ 你吥是...
稳经济惠民生需要楼市股市双轮驱...     张敬伟    今年的政府工作报告中,“稳住楼市股市”首次被写入年度总体要求,并明确提出“深化...
德国国防支出计划令国债遭抛售 ...   随着德国国债出现20多年来最严重的暴跌,长期债券遭到抛售,债券市场最受欢迎的交易之一在欧洲获得了...
证券代码:002840 ...   本公司及董事会全体成员保证信息披露的内容真实、准确、完整,没有虚假记载、误导性陈述或重大遗漏。 ...
从大疆到美的 多家知名企业“... 每经记者 王晶    每经编辑 宋思艰     当下“996”文化在互联网行业持续...
英国沿海发生油轮与货轮相撞事故... 当地时间10日,美国军方发言人称,当日英国沿海发生碰撞事故的美国油轮正在短期租赁给美国海军军事海运司...