CNFinBench公布大语言模型综合得分:中国平安金融大模型荣登第一名
来源:同花顺 发布时间:2026-03-16 19:44:47

近日,中国平安金融大模型PingAnGPT-Qwen3-32B 在行业权威大模型评测体系CNFinBench大语言模型公开榜单上综合排名第一。本次参评模型阵容强大、竞争激烈,涵盖DeepSeek-R1(671B)、Qwen3-235B-A22B、Kimi-K2(1000B)等开源大模型,以及 GPT-4o、Claude-Sonnet 4、Doubao-1.5-pro 等领先的闭源商业模型,代表当前行业最高水平。此次评测登顶也标志着平安在金融大模型领域的技术能力已达到行业先进水平。

CNFinBench是由上海人工智能国家实验室团队联合金融领域权威机构打造的中文金融大模型综合性评测基准,为当前国内最具权威性和行业认可度的金融大模型能力评估平台。本次测评中,PingAnGPT-Qwen3-32B在金融事实推理与计算、金融专业知识问答、金融合规与风险控制等多项关键指标表现卓越,展现出精准的金融数值计算能力、严谨的逻辑推理能力和全金融领域知识体系的深度掌握,尤其在金融投研分析、风险计量等场景具有重要应用价值和安全可控优势。

评测方表示,此次登顶CNFinBench,体现了平安在金融大模型领域的技术实力。值得关注的是,中国平安参评的模型仅采用 32B参数规模,不足 DeepSeek-R1(671B)的5%及Kimi-K2(1000B)的 3.2%规模,却实现了综合性能上的超越,在模型效率与性能平衡上实现了重要技术突破。依托于"轻量高效"特性,该模型已支持产险车险报案、人事员服智能问数、客服实时质检、智能话术、集团财资费用审核等97个业务场景,并为其后续在私有化部署、场景化应用提供了坚实基础。

据悉,CNFinBench评测体系覆盖金融专业知识问答、金融业务理解与分析、金融事实推理与计算、金融合规与风险控制、金融内生与应用安全五大核心维度,全面检验模型在金融垂直领域的专业深度、业务理解力、计算准确性、合规意识及安全可控性。

2025年前三季度,平安的数据库已沉淀30万亿字节数据,覆盖近2.50亿个人客户;基于海量数据训练大模型,积累超3.2万亿高质量文本语料,31万小时带标注的语音语料,超75亿图片语料。以海量数据为基础,以科技公司服务技术开发与应用,平安持续拓展场景应用的深度和广度,赋能金融业务优体验、控风险、降成本、促销售。2026年2月,国家知识产权出版社发布《金融科技行业2025年专利分析白皮书》与《医疗健康行业2025年专利分析白皮书》,中国平安再度揽获2025年金融科技、医疗健康行业专利数双榜首,并在多项核心技术与关键应用场景中占据领先地位。

中国平安表示,通过打造领先AI能力,推进模型优化迭代,深化场景化应用落地,公司持续将技术优势转化为服务价值,以高质量的数字化金融供给,不断满足人民群众对美好生活的向往,践行"省心、省时、又省钱"的服务承诺,为金融强国建设贡献平安力量。(张佳)

标签: CNFinBench 公布 语言 模型 综合 得分 中国平安 金融 大模型 荣登

猜你喜欢

中国平安发布行业首个商业航天综合金融解决方案,落地长三角产业集聚区

3月12日,由中国遥感应用协会、上海市宇航学会等联合主办的2026首届上海商业航天大会暨展览会在上海举办,吸引两百余家产业链核心企业参与。中国平安作为唯一受邀金融机构出席主论坛,并发布行业首个“保险保障+资金供血+资本助推”的综合金融解决方案,为商业航天发展提供全方位支持。当前,国内商业...更多

2026-03-16 19:49:01

CNFinBench公布大语言模型综合得分:中国平安金融大模型荣登第一名

近日,中国平安金融大模型PingAnGPT-Qwen3-32B 在行业权威大模型评测体系CNFinBench大语言模型公开榜单上综合排名第一。本次参评模型阵容强大、竞争激烈,涵盖DeepSeek-R1(671B)、Qwen3-235B-A22B、Kimi-K2(1000B)等开源大模型,...更多

2026-03-16 19:44:47

24小时极速救援!中国平安协助首批企业客户从中东“危险区”撤离

针对近期中东局势导致不少平安客户被迫滞留现象,中国平安统筹旗下产险、寿险、健康险及银行等公司第一时间发布预警和撤离建议,并同步搜集预警地区的人员情况和客户需求。据悉,平安全球急难救援服务中心连日来不断向客户提示潜在风险预警,推送专项风险分析报告。截至目前,平安累计发出风险预警信息59条,...更多

2026-03-16 19:43:13

用手机操作贵金属交易平台时,哪些细节最影响体验

很多用户第一次接触贵金属交易平台时,往往会默认自己会在电脑上慢慢看资料、对比页面、研究功能从使用习惯来看,手机操作贵金属交易平台时,用户最在意的通常不是功能多不...更多

2026-03-16 18:12:39

进军具身智能元年:科沃斯全场景服务机器人首秀 AWE2026

2026年3月12日,中国家电及消费电子博览会(AWE 2026)在上海新国际博览中心盛大开幕从全场景矩阵,看具身智能元年的落地成果具身智能的核心,在于让AI拥...更多

2026-03-16 17:56:37

恒天海龙拟切入航空发动机赛道,创造新价值增长点

近日,恒天海龙股份有限公司(以下简称“恒天海龙”,股票代码:000677.SZ)发布公告称,公司拟通过全资子公司北京多弗海龙飞控科技有限...更多

2026-03-16 17:13:16

京东AWE现场揭露洗地机行业乱象 联合品牌抵制虚假测评

现如今,对于大多数普通消费者而言,洗地机并不是一个高频了解、能够快速建立专业认知的品类但问题在于,这类看似“公开透明”的测评,很多时候并...更多

2026-03-16 17:12:10

Robotaxi的下半场,赢在智驾,更赢在运营

“智驾技术只是Robotaxi的基础入场券曹操出行CEO龚昕在接受《晚点LatePost》采访时作出的判断,一语道破当下Robotaxi行业的表层喧...更多

2026-03-16 17:05:32

?从热度破万到霸榜全球 《逐玉》成爱奇艺国际版又一爆款标杆

自3月6日上线以来,爱奇艺出品古装剧《逐玉》热度持续走高,开播6天爱奇艺国内主站的内容热度值突破10000,进入爱奇艺荣誉殿堂《逐玉》由张凌赫、田曦薇领衔主演(...更多

2026-03-16 16:28:35

潮起南粤鱼鲜万家!广东这名党员把海味送进千万家

“名特优新”个体工商户王挺,扎根水产行业守初心南澳紫菜、顺德鲈鱼、深海海鲜,从源头严控品质,帮乡亲拓销路!党员带头助农增收,把山海鲜味送...更多

2026-03-16 16:28:20