瞄准可靠性难题,全国首个高阶程序大模型可信框架开源
创始人
2025-07-27 17:37:20
0

转自:北京日报客户端

7月27日,在2025年世界人工智能大会(WAIC)的“从通用智力到专业生产力:高阶程序引领的AI应用新范式”论坛上,蚂蚁集团旗下蚂蚁密算宣布对外开源高阶程序(High-Order Program)大模型可信应用技术框架,推动解决大模型在专业应用中的可靠性困境,加速大模型在专业领域的规模化应用。据悉,此次开源的是全国首个高阶程序大模型可信应用技术框架。

论坛上,浙江大学教授、区块链与数据安全全国重点实验室主任陈纯表示,大模型的专业化应用,首当其冲面临挑战的是可靠性问题。尽管当前最顶尖的技术水平已经能达到80%到90%的准确率,但其可靠性距离医疗、工业、金融等专业场景的要求仍有显著差距。陈纯说,有人将这一问题简单归结为“幻觉”,但他认为,“幻觉”是智力的必然代价。若消除所有“幻觉”,大模型将退化为机械的检索工具。因此,可靠性的突破不在于消灭“智力特征”,而在于构建工程化保障框架。

蚂蚁密算董事长韦韬认为,要突破大模型在专业化应用中的可靠性困境,技术上不应当只依赖于大模型“十全十美”不犯错,而是通过智能体系和工程体系的结合,实现专业应用可靠性的保障。正如每个人作为个体,是容易犯错、容易有幻觉的,但人类几千年以来不断在工程体系上的进步,能够在易错的个体之上构建庞大而可靠的工程体系,完成诸如登月、探访火星等巨型任务。他提出,通过全新的程序表达、场景知识嵌入和闭环核验反馈机制,可以将大模型不确定的智力输出转化为可信的专业生产力。

对此,蚂蚁密算正在探索高阶程序(High-Order Program)大模型可信应用技术框架。该框架借鉴了人类在工程管理体系中的成功经验,如通过标准作业程序和检查清单等机制,构建一个能够有效复用、验证、扩展和派生的机制,使大模型在应用过程中即使出现幻觉问题,也能保证大模型达到专业领域所需的精确性和可靠性。目前,高阶程序技术框架已经在金融风控全链路、网络入侵检测、医疗重复计费等多行业场景中初步应用,在可靠性和时效性上有显著提升。

韦韬表示,高阶程序可以与大模型强互补,将大模型这样的通用智力引擎,可靠地应用于众多专业场景。“大模型可靠性的解法,不在于大模型本身,而在于工程化和智能化的融合。我们也相信,解决了可靠性问题,大模型即将涌现新的Killer App(杀手级应用)。”

来源:北京日报客户端

相关内容

热门资讯

中证A500ETF摩根(560... 8月22日,截止午间收盘,中证A500ETF摩根(560530)涨1.19%,报1.106元,成交额...
A500ETF易方达(1593... 8月22日,截止午间收盘,A500ETF易方达(159361)涨1.28%,报1.104元,成交额1...
何小鹏斥资约2.5亿港元增持小... 每经记者|孙磊    每经编辑|裴健如 8月21日晚间,小鹏汽车发布公告称,公司联...
中证500ETF基金(1593... 8月22日,截止午间收盘,中证500ETF基金(159337)涨0.94%,报1.509元,成交额2...
中证A500ETF华安(159... 8月22日,截止午间收盘,中证A500ETF华安(159359)涨1.15%,报1.139元,成交额...
科创AIETF(588790)... 8月22日,截止午间收盘,科创AIETF(588790)涨4.83%,报0.760元,成交额6.98...
创业板50ETF嘉实(1593... 8月22日,截止午间收盘,创业板50ETF嘉实(159373)涨2.61%,报1.296元,成交额1...
港股异动丨航空股大幅走低 中国... 港股航空股大幅下跌,其中,中国国航跌近7%表现最弱,中国东方航空跌近5%,中国南方航空跌超3%,美兰...
电网设备ETF(159326)... 8月22日,截止午间收盘,电网设备ETF(159326)跌0.25%,报1.198元,成交额409....
红利ETF国企(530880)... 8月22日,截止午间收盘,红利ETF国企(530880)跌0.67%,报1.034元,成交额29.0...