国产AI大模型之战：得技术者胜，得市场者强

首页 > 头条推荐 > 天网聚焦 >

来源：中国焦点日报网发布时间：2023-05-15 11:40:20

今年一季度，AI无疑是最大的热潮。

从去年11月30日，ChatGPT正式上线开始，不论国内国外的公司，都像找到了奔向“新世界”的船票，要么在研发AI，要么在业务+AI结合的路上。

彭博做了个图，展示标普500上市公司的财报里，提到AI的次数上升了77%。

微软的AI云一路大胜，英伟达的芯片供不应求，谷歌、亚马逊、Meta都将投资AI当成第一大事。

别问，问就是这次一定，这把all in。

中国A股市场更夸张，ChatGPT概念、AI板块，上百家公司变身大牛股。

AI成了最确定的确定性。

企业是否坚定拥抱AI，也成为市场一个重要参考指标。

过去50天，中国的科技公司、高校、研究机构已发布了30多款AI大模型产品。

谋局落子，各有千秋，平均每天至少有一个AI大新闻。不管是骡子是马，都先出来遛遛，把融资和市值都拉一把。

超60家厂商宣布研发大模型，像字节跳动、小米的大模型就还在路上。

5月6日，“AI国家队”科大讯飞，发布了 讯飞星火认知大模型 。

和30多个同行比起来，讯飞算是姗姗来迟，但搞的事情反而最大。

之前的AI大模型，发布现场都是放PPT，和提前录制好的Demo为主。大部分人还得乖乖在waitlist排队，等一个内测资格，才能实际上手操作。

讯飞星火胆子很大，现场直接上真机实测，目前全国仅此一例，务实且有建设性。

不仅如此，星火一步到位，直接大规模开放测试。所有人都能上手体验，实际操作加深认知。

虽说发布会现场的演示也出现了一些小瑕疵，但瑕不掩瑜，承认差距，直视不足，一边跑步一边迭代。古书有云： 观敌之变动，后之发，先之至，此用兵之要术。

这样自信又务实的企业，都是有真本事做底气的。否则ChatGPT珠玉在前，一不小心画饼不成，反而不妥。

再者，用少数案例来证实大模型的好坏都是不实事求是的，科大讯飞做语音AI起家， 24年来一直是国内AI行业“学霸”一般的存在，在认知智能上浸润极深。

2011年，首个“语音及语言信息处理国家工程实验室”经国家发改委批复成立，由中国科大与科大讯飞股份有限公司联合共建。2017年，讯飞又获批承建了“认知智能国家重点实验室”，被业内戏称为“AI国家队”。

“1999年，中文语音市场全部被国际巨头控制，中国人被掐住了咽喉；我们创办科大讯飞，提出要让中国语音技术做到全世界最好，要在多语种技术上做到全世界第一。”

如今，24年过去，初心不改，信念终成现实。科大讯飞董事长刘庆峰在发布会上表示， 在10月底的升级后，星火将整体赶超ChatGPT。

实力是拼出来的，不是喊出来的。

大模型能力成色有几分，往往大家上手一试，就有直观体验。

但现在几十个大模型，都号称要和ChatGPT掰手腕。有人说自己只差2个月，有的人说想追上至少等明年。

要知道，OpenAI可不会原地踏步。虽然马斯克搞了万人联名，建议暂停大模型研发6个月，但各大科技公司的投入不减反增。

AI大模型是智能时代最底座的技术。

这不仅是几家巨头争市场，更是争未来的生存权、发展权。中国做大模型务必要以科学的体系来统筹，企业需用正面积极的态度做竞争，市场上部分抹黑、造谣的声音格局太小。拧成一股绳，不愁生产搞不上去。

那么问题来了： 国产大模型和ChatGPT的差距，到底还有多远？如何科学地去评估？

科大讯飞和认知智能全国重点实验室牵头，设计了统一、系统性的评判体系，覆盖7种能力，481个细分指标。

这7个维度的能力，包括：语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。

刘庆峰更是表示， “在文本生成和数学能力（一定程度代表通用认知大模型的智慧水平）上，星火认知大模型已经国内显著领先，且相比ChatGPT也具有一定优势；在语言理解和知识问答方面也达到接近ChatGPT水平，处于国内领先水平。”

智谷之前就注册了讯飞星火，我们也从多个维度，体验了一把星火的能力。

我们首先考验了星火对当下时事的分析能力：

虽然星火没实时接入最新数据，但对淄博烧烤、特斯拉降价的分析角度很全面，可以为大家提供一个研究的大方向。

随后我们尝试用笑话和梗，看能否迷惑星火：

故事创作，我们让它续写《流浪地球3》的大纲。

星火针对不同平台特点加入emoji、话题标签，使文案更加风格化。

一般数学题根本难不住星火，不但给出正确答案，也给了完整的解题步骤。

也可以在几秒钟里，用Python写出计算鸡兔同笼问题的程序。

总体而言，星火在中文文本、数学能力上与ChatGPT 3.5媲美，不过距离GPT-4还有所差距，这个无需否认，出生就对标成熟的ChatGPT也为时过早。就目前国内大模型市场来看，星火实力名列前茅，响应速度也很快，诞生之初即是国内尖子生已经不容易。

并且，科大讯飞公布了时间表，在6月9日、8月15日、10月24日还会进行三次升级。在不断交替迭代中，一步步实现进化，进步空间还有很大。

1024，是2的10次方，也是计算机二进制的基本计量单位，具有特殊的意义。

1024之后赶超ChatGPT，值得我们期待一把。 大家也可以自行体验一下，官网链接：https://xinghuo.xfyun.cn/

现在OpenAI一骑在前，给所有追赶者，留下了大致的追赶路线。

算法、算力、数据，这是AI版三驾马车。

GPT-3规模是1750亿浮点参数，GPT-4规模没公布，但大家估算在5000亿-1万亿参数。

同样是未知数的，是微软到底为OpenAI提供了多少算力，这个数字也会是以 亿美金 为计量单位。

众多追赶者，都在追求“大就是好”，企图用更大参数规模，莽出一个智慧涌现。

而OpenAI的CEO，Sam Altman却站出来说： AI大模型已经发展到头了。

这不是凡尔赛，是OpenAI发现：更大规模，并不等于更强模型能力。

未来的模型发展方向，可能会是参数更小，或者多个子模型协同，从算法上去优化的空间更大。

科大讯飞既致敬OpenAI，又要赶超，走的就是这条更长远的路，也是一条自己的路。

·算法为王

“至少在讯飞，最关键的一定是算法”，科大讯飞研究院院长刘聪表示。

24年的积累，讯飞在Transformer深度神经网络算法拥有丰富经验，在语音识别、图文识别、机器翻译等任务都达到国际领先水平；

针对大模型模糊记忆技术短板，他们提出了知识与大模型融合统一的理解框架X-Reasoner；

截至2022年，讯飞累计斩获了常识阅读理解挑战赛OpenBookQA等13项世界冠军；

目前，讯飞开源了6个大类、超过40个通用领域的系列中文预训练语言模型，相关模型库月均调用量超1000万。

星火虽未公布具体参数规模，但讯飞透露了 模型规模、算力都比GPT小 ，这种情况下，能做到模型能力不比它差，就有赶超的机会。

·数据破壁

国产大模型都遇到的另一个难题是，中文互联网世界的高质量数据，和英文数据有差距。

科大讯飞的解法，一是从全世界抓数据，中文英文都做；

二是通过更快落地AI产品，从行业积累高质量数据；

三是主动推进共建共享，助推政府和各界打通数据流，这也是今年来数字中国规划、组建数据局的核心任务。

科大讯飞的优势，是在教育、医疗等行业垂直领域的数据积累，护城河很深。 在多年认知智能系统研发推广中，积累了超过50TB的行业预料，和每天超10亿人次用户交互的活跃应用，这不可小觑。

·算力自主

更多人的担忧，是在算力和芯片层面。

英伟达的A100/H100两款高性能芯片，是现在研发AI的刚需，但都被美国断供。中国厂商如果不是之前有囤货的，现在很难再摸到了。

即便是特供中国的“阉割版”A800/H800，目前也是供不应求、千金难买。之前流传出一份会议纪要，透露国内几个大型互联网企业，都在上万张地下单。

“只要谁在中国做的最好，代表中国在关键战略领域能提供支持，谁就一定会被美国打压。即便今天不在名单，他只要做好了，明天也会在。”刘庆峰也很感慨。

讯飞很早就上了美国的清单，所以科大讯飞的准备工作做在很前面。

一是自建了业界一流的AI数据中心，在工程技术方面实现了百亿参数大模型推理效率的近千倍加速；

二是与华为、中科曙光、寒武纪这些国产硬件企业深度合作。

1999年，18个中科大的学生挤在出租屋里，创造了语音AI的源头技术。24年过去，信念都在成为现实，好比 星星之火、可以燎原 。

讯飞从源头到整个生态都要自主创新，把AI能力建在自主可控的平台上 ，进一步也推动了中国人工智能产业生态发展。

光有技术还不够，还得有人愿意为你付钱。

很多人可能忘了，大模型已不是第一次AI热潮了。

AlphaGo火到没朋友那几年，正是上一轮人工智能热潮。有统计数据，中国约70%的AI公司都成立于2014-2018年。

但热潮退去，新增公司迅速下降，为什么？

因为大家发现，AI这玩意是真烧钱啊，对资本、人才、技术的门槛都很高，而且这玩意商业落地也是真心困难。

试问，那些公司还活着多少？哪些成功商业化了？哪些赚到钱了？

答案很尴尬。哪怕当初最优秀的四小龙，商业路径也走得不顺遂，亏损年年增加。

一群裸泳者都想上岸，看谁的水分挤完后，干货最足。

OpenAI的成功离不开微软上百亿美金、海量算力的浇灌。

然后，微软的Azure云、新必应这些业务，就靠领先的AI技术抢夺市场，开始挣钱。

而OpenAI还在亏损和烧钱，Sam Altman觉得，未来几年还需筹集1000亿美金。

那是1000亿美金啊，真的是烧出个未来了。

所以，AI大模型最终注定是少数大公司的游戏。

不光因为他们钱、数据多，还因为他们有能直接变现的应用场景、业务、生态。

等这一轮泡沫挤破，还能剩多少玩家，拼的也不仅是技术，还是产品落地、商业模式了。

科大讯飞考虑得很清楚，星火的“1+N架构”就是专门为此设计。

1代表通用认知智能大模型，是技术，是 星星之火 ；

N代表大模型在教育、医疗、办公、汽车、人机交互等领域的落地，是应用生态，也是 星火燎原之势 。

教育是一个很大的市场。 星火的发展离不开生态伙伴的支持，也离不开友商间的良性竞争。 除科大讯飞这个龙头外，网易有道的子曰大模型，学而思的MathGPT，都在争取从教育垂直场景，落地AI产品。

科大讯飞的优势是在智慧教育领域，无人可及的生态构建。

拥有国内最大的智慧硬件业务，比如面向C端消费者的AI学习机、个性化学生手册等产品。未来的学生，可能会与一位无所不知、24小时陪伴、定制化的AI老师共同进步。润物细无声，其对学生的影响和学校老师、父母家庭同样重要。

同时，讯飞又有和高考、学校、教育行业合作的B端业务，还牵手政府和各地市县，打造G端业务的区域因材施教解决方案，智慧教育平台。

在医疗领域，讯飞有国内唯一通过国家执业医师资格考试的AI，已累计为医生提供超5.8亿次AI辅诊，日均诊断70万人次。

在办公领域，讯飞办公本、录音笔搭载大模型后，可以将一段录音轻松转化为会议纪要、新闻稿件、宣传文案，这都将是打工人的效率神器。

在汽车领域，讯飞打造了“大模型+智能座舱”，实现车内拟人化、跨场景的人车自由交流，其智能语音技术已经进入数千个车型，为4610万车主服务。

未来讯飞也会联合行业伙伴，将大模型能力开放给开发者，一同推动产业变革。

今年是AI大模型元年，也是科技大年。

可以预见，随着人工智能深入各行业，带去爆炸式的效率提升，还会有更多创新涌现。

在医药研发、芯片设计、AIGC等领域，AI已带去数量级的效率提升。

今年也是科技政策频出的大年。

中国在发动新型举国体制，要用一套新的产学研政机制，激发原始创新、攻克“卡脖子”难题、实现科技自立自强。

而几次会议里， AI的站位越来越高 。

4月28日政治局会议，“要重视通用人工智能发展，营造创新生态，重视防范风险”，首次提到通用人工智能。

5月5日中央财经委第一次会议，首次提出了以人口高质量发展支撑中国式现代化，加快建设现代化产业体系。 先进产业体系里，“把握人工智能等新科技革命浪潮”成为关键。

AI在新一轮科技革命中，是起引领作用的战略性技术。

更快普及AI应用，落地商业场景，才会加速这场生产力革命，并为各行业和社会创造正向价值。

企业在这场创新中的主体地位，日益深重。

讯飞星火直接大规模开放，就是在降低AI大模型的应用门槛。目前，讯飞开放平台已经开放了560项AI能力，聚集超过500万生态合作伙伴，首批就有来自36个行业的3000余家企业开发者接入星火大模型。

而随着AI进入千行百业，来自一线场景的宝贵数据和真实反馈，也会帮助讯飞星火更快迭代。

当下的中国，正站在创新大爆发的起始点。

有拿来即用的AI大模型和定制工具，有足够多的技术应用场景和市场需求，有完善的数字新基建，有高校与产业界的人才培养互动……越来越多企业、开发者、学者都参与进科技革命中。

恰如 星火燎原，生生不息 。

标签：

分享到：QQ空间新浪微博腾讯微博人人网微信

上一篇：全国防灾减灾日，微众银行甄选“企惠保·企财险”为小微企业经营抵御财产损失风险

下一篇：最后一页

环球热消息：天齐锂业涨超6%

全球热点！港股异动 | 香港航天科技涨超11%，拟向麦格理发行8亿港元的可换股票据

48小时点击排行

图片新闻

猜你喜欢