SuperCLUE-V基准榜单发布 腾讯混元斩获国内第一
来源:今日热点 发布时间:2024-08-06 09:28:09

多模态理解是大模型理解复杂现实世界的关键能力之一。

8月2日,中文多模态大模型SuperCLUE-V基准8月榜单发布,腾讯混元大模型凭借其在多模态理解方面的卓越表现,在众多参评模型中脱颖而出,斩获国内大模型排名第一,稳居卓越领导者象限。

多模态理解,俗称“图生文”,要求模型能准确识别图像元素,理解它们的关系,并生成自然语言描述。这既考验图像识别的精确度,也体现了对场景的全面理解、对细节的深度洞察,考验模型对复杂现实世界的理解力。

本次测评涵盖了国内外最具代表的12个多模态理解大模型,包含4个海外模型和8个国内代表多模态模型,评估内容包含基础能力和应用能力两大方向,以开放式问题对多模态大模型进行评估。腾讯混元大模型在多模态基础能力和应用能力方面,获得总分 71.95 的高分,显示出在技术和应用层的综合优势。

据SuperCLUE官方介绍,评估标准涵盖了理解准确、回应相关和推理深度等维度,打分规则结合了自动化定量评分与专家复核,以确保评估的科学和公正

评测结果显示,国内大模型在多模态理解的基础能力方面,已经逼海外顶尖模型,其中腾讯混元大模型总成绩仅略低于GPT-4o,表现好于CLaude3.5-Sonnet和Gemini-1.5-Pro,显示国产模型在基础能力上的快速迭代。而在应用能力维度上,腾讯混元大模型凭借对中文语境的深刻理解,以及在通用、常识、图像等多领域的综合能力,展现出实际应用的巨大潜力。

依托腾讯混元大模型的技术底座,AI 原生应用腾讯元宝在发布之初,就具备多模态理解能力,无论是文档截图、人像风景、收银小票,还是任意一张随手拍的照片,元宝都能基于图中内容给出自己的理解和分析。

腾讯公司副总裁蒋杰此前表示,对于腾讯混元大模型来说,多模态是一道“必答题”,目前混元大模型正在积极部署从多模态到全模态的技术,用户将很快可在腾讯元宝 App、腾讯内部业务及场景中体验,同时会通过腾讯云向外部应用开放。

目前,腾讯混元大模型已扩展至万亿级参数规模,在国内率先采用混合专家模型(MoE)结构,依托腾讯大语言模型的能力,多模态理解能力不断提升,达到国内领先水

标签:

猜你喜欢

SuperCLUE-V基准榜单发布 腾讯混元斩获国内第一

多模态理解是大模型理解复杂现实世界的关键能力之一。8月2日,中文多模态大模型SuperCLUE-V基准8月...更多

2024-08-06 09:28:09

SuperCLUE-V基准榜单发布 腾讯混元斩获国内第一

多模态理解是大模型理解复杂现实世界的关键能力之一。8月2日,中文多模态大模型SuperCLUE-V基准8月...更多

2024-08-06 09:28:09

香港百科通—— 新来港人士一站式生活资讯与社区

作为新加入香港大家庭的一员,您可能因为追求梦想、开展新事业、接 更多

2024-08-06 09:21:58

扬子江药业集团携手乡村,共探绿色发展新路径

在盛夏时节,内蒙古包头市固阳县的田野间,扬子江药业集团的黄芪(有机)标准化种植基地呈现出一派...更多

2024-08-06 09:26:12

强强联合!云端无人机与金龙客车携手打造车顶机场

作为新质生产力的代表,低空经济不仅为传统产业注入了新的活力,更催生了全新的商业模式和业态,为...更多

2024-08-05 20:44:34

顶点财经:8月有可能出现重要拐点

美欧经济数据低预期外围股市大幅回调,美元走弱人民币汇率被动升值,乐观派预期宽松空间加大和全球...更多

2024-08-05 19:45:28

手慢无!京东企业消暑物资大放价 爆款空调低至5折

立秋将至,暑热难消,尤其是我国南方地区正在经历又一轮猛烈的高温 更多

2024-08-05 19:10:31

金美信消费金融组织党的二十届三中全会精神专题学

7月15日至18日,党的二十届三中全会在京举行。本届三中全会以“进一 更多

2024-08-05 18:29:44

华为家庭绿电观穹系列新品亮相,极致美学与科技引

2024年8月5日,华为家庭绿电·墅式光储能观穹系列新品正式上市。这 更多

2024-08-05 17:58:37

北大国经智库特约专家钟云波:生物医药领域法制建

--钟云波(广西神农金蚂蝗生物药业集团董事长)钟云 更多

2024-08-05 17:48:02