?Soul开源SoulXFlashTalk,以AI全栈加速实现亚秒级数字人实时交互
来源:中国财经时报网 发布时间:2026-04-23 10:03:39

近期,Soul App AI团队(Soul AI Lab)正式对外开源实时数字人生成模型SoulXFlashTalk,这款模型凭借多项行业首创性能,成为全球首个实现0.87s亚秒级延时、32fps高帧率,并支持超长视频稳定生成的14B参数量数字人大模型。Soul一直将AI技术作为产品创新的核心驱动力,在持续构建AI能力的过程中,始终以技术突破为用户带来更沉浸、更多元的交互体验。此次开源不仅展现了模型在生成速度、画面效果、响应延迟与内容保真度上的全面优势,更重要的是为行业提供了可直接落地商用的解决方案,推动大参数量实时生成式数字人从技术概念走向规模化应用阶段。

SoulXFlashTalk能够实现极致流畅的实时交互,核心得益于团队打造的全栈加速引擎与深度系统优化。针对8H800节点进行专项设计,模型采用混合序列并行架构,整合Ulysses与Ring Attention机制,让单步推理速度提升约5倍;同时引入针对Hopper架构优化的FlashAttention3算子,通过异步执行进一步将延迟降低20%;3D VAE并行化则借助空间切片并行解码策略,实现处理效率5倍加速;再通过torch.compile完成全流程图融合与内存优化,从系统、算子、模型三个层面实现整体提速。最终,模型将首帧视频输出延时降至0.87s,首次让14B级大模型数字人具备真正意义上的即时反应能力,彻底消除传统大模型生成时的滞后感,可覆盖视频通话、直播弹幕互动、智能客服等全场景实时交互需求,让对话更自然、更流畅。

在生成质量与稳定性方面,SoulXFlashTalk依靠独家自纠正双向蒸馏技术,解决了行业长期存在的画面崩坏、身份漂移、画质下降等痛点。模型搭载多步回溯自纠正机制,能够模拟长序列生成过程中的误差传播并实时修正,主动恢复受损画面特征,如同为AI配备实时校准器。同时,模型完全保留双向注意力机制,使每一帧生成都可同时参考过去与未来上下文,从根源压制身份漂移问题,确保超长直播、长视频生成过程中,人物口型、面部细节与背景环境始终保持一致。此外,模型突破传统数字人仅能对口型的局限,支持音频驱动的全身肢体动态合成,依托14BDiT强大建模能力,精准还原清晰锐利的手部细节,消除畸形与运动模糊,在保持99.22%身份一致性的前提下,实现灵动动作与稳定画面的平衡。

在TalkBenchShort与TalkBenchLong数据集评测中,SoulXFlashTalk各项指标全面领先,短视频以3.51ASE、4.79IQA刷新保真度纪录,长视频SyncC分数达到1.61,且全程保持32fps高吞吐量,远超25fps行业实时标准。该模型可广泛应用于电商7×24小时直播、短视频制作、AI教育、互动NPC、智能客服等场景,解决传统数字人直播卡顿、失真、同步不准等问题。Soul此前开源的SoulXPodcast已收获超3100星标,未来Soul将继续深耕AI交互技术,持续推进开源生态建设,与全球开发者携手推动AI+社交领域持续创新。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

百城门店齐启动!京东装修授权店落地多城 六大保障护航安心家装

装修是每个家庭奔赴理想生活的关键一步,但装修合同陷阱、材料以次充好、施工不规范乃至装修商跑路等种种乱象,让美好期许大打折扣值得关注的是,此次京东装修授权店全国集...更多

2026-04-23 10:10:43

?Soul开源SoulXFlashTalk,以AI全栈加速实现亚秒级数字人实时交互

近期,Soul App AI团队(Soul AI Lab)正式对外开源实时数字人生成模型SoulXFlashTalk,这款模型凭借多项行业首创性能,成为全球首个...更多

2026-04-23 10:03:39

恩捷股份年报季报双增:扭亏+提速,龙头归来

4月22日晚,恩捷股份(002812.SZ)同步披露2025年年度报告与2026年第一季度报告进入2026年,公司盈利修复势头延续盈利拐点确认:2025年扭亏为...更多

2026-04-23 09:39:31

翌飞锐特携手上海机场物流|“机坪直提”业务正式上线“空运通”平台

4月15日起,由翌飞锐特承接并研发的上海机场物流“机坪直提”业务正式实现在上海航空物流公共信息平台“空运通”平台...更多

2026-04-23 09:23:07

税友股份2025年年报:归母净利润增长超21% 以AI原生基因重塑财税行业价值

4月22日晚间,税友股份正式发布2025年年度报告及2026年第一季度报告进入2026年,公司良好增长势头持续延续,一季度经营表现超预期数智财税业务作为公司核心...更多

2026-04-23 09:05:13

华为余承东发布华为DriveONE中文品牌“华为智擎”,持续引领新能源汽车电动化升级

2026年4月22日,在鸿蒙智行春季新品发布会上,华为常务董事、产品投资评审委员会主任、终端BG董事长余承东对外发布问界M6、全新一代问界M9系列、智界V9、尚界Z7、尚界Z7T等多款鸿蒙智行力作,并正式推出HUAWEI DriveONE全新中文品牌“华为智擎”。继鸿蒙座舱、乾崑智驾之后...更多

2026-04-22 22:17:31

全新升级AI医生智能体集群!京东健康以“医检诊药”闭环重构家庭健康管理

4月22日,2026京东大药房合作伙伴大会在京举行。站在京东大药房十周年的新起点,以自研“京医千询”大模型为技术底座,京东健康首次对外展示了面向医药服务领域的全栈AI进展:从AI医生智能体集群打通京东APP、京东健康APP及微信生态,到推出行业领先的“药智模型”及一系列AI用药服务,京东...更多

2026-04-22 22:12:40

蒙牛集团携手国家奶牛产业技术体系 以人才筑基赋能奶业高质量发展

近日,蒙牛集团与国家奶牛产业技术体系联合举办的第30期现代奶牛场高级人才研修班在北京开班。来自全国60余家牧场新生代场长、技术骨干以及蒙牛集团奶源技术管理团队齐聚中国农业大学,开启为期3天的能力提升集训,共探奶业高质量发展路径,共筑乳业上游坚实根基。(第30期现代奶牛场高级人才研修班开班...更多

2026-04-22 21:34:13

绿盟科技发布2025年年报:收入稳中有升,亏损大幅收窄,现金流持续为正

4月22日,绿盟科技披露2025年年度报告。报告显示,公司持续推进战略落地、组织优化、运营提效和能力建设,整体经营运行稳中有进、稳中提质。2025年实现营业收入25.41亿元,同比增长7.78%;归属于上市公司股东的净利润为-4,525.26万元,同比减亏87.60%;扣除股份支付影响后...更多

2026-04-22 21:32:14

瑞幸在青岛上新了一杯「智造」咖啡,花了30亿

5年之内,瑞幸咖啡启用了第三个“烘焙工厂”。4月22日,瑞幸咖啡创新生产中心在青岛正式投产,这不是一家常规的咖啡烘焙厂,而是投资30亿元,年产能超5.5万吨的“超级工厂”。瑞幸咖啡创新生产中心在第一时间探访后,「零售氪星球」发现,与许多传统工厂“黑白灰”的混凝土面孔不同,这座新厂给人留下...更多

2026-04-22 21:31:29