您当前位置:网站首页 >> 新闻资讯
斯坦福最新AI研究报告出炉 中美模型质量差距缩小至0.3%
文章来源:凤凰网科技  作 者:陈俊熹  上传时间:2025-4-25  浏览量:51

nature发文,斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》显示,人工智能领域的竞争日益激烈:中国高性能AI模型的数量和质量不断提升,对美国的领先地位构成挑战,顶级模型之间的性能差距正在缩小。

美国此前在模型质量方面的领先优势已经消失。中国是人工智能出版物和专利产出最多的国家,如今其开发的模型在性能上已经与美国的竞争对手不相上下。2023年,在大规模多任务语言理解测试(MMLU)中,中国领先的模型落后于美国顶级模型近20个百分点。然而,到2024年底,美国的领先优势缩小到了0.3个百分点。

世界各顶级AI模型之间性能已无太大差距

该报告强调,随着人工智能的快速持续发展,没有一家公司能够脱颖而出。在聊天机器人竞技场排行榜上,2024年初排名第一的模型比排名第十的模型得分高出约12%,但到2025年初,这一差距缩小到了5%。报告称:“前沿领域的竞争越来越激烈,也越来越拥挤。”

该指数显示,通过使用更多决策变量、更强的计算能力和更大的训练数据集,生成式人工智能模型平均而言仍在变得更“大”。但开发人员也在证明,更小、更精简的模型也能有出色的表现。由于算法的改进,如今的模型性能与两年前规模大100倍的模型性能齐平。该指数称:“2024年是小型人工智能模型的突破之年。”

纽约伊萨卡康奈尔大学的计算机科学家巴特 塞尔曼表示,很高兴看到像中国的DeepSeek这样相对小型、低成本的研究成果证明了自己的竞争力。他说:“我预计我们会看到一些由五人甚至两人组成的独立团队,他们会提出一些新的算法想法,从而改变现状。这很好。我们不希望世界只由一些大公司掌控。”

报告显示,如今绝大多数强大的人工智能模型是由工业界而非学术界开发的:这与21世纪初神经网络和生成式人工智能尚未兴起情况正好相反。报告称,2006年之前,工业界开发的著名人工智能模型不到20%,2023年这一比例为60%,2024年则接近90%。

美国仍然是强大模型的最大生产国,2024年发布了40个模型,中国发布了15个,欧洲发布了3个。但许多其他地区也在加入这场竞赛,包括中东、拉丁美洲和东南亚。

塞尔曼说:“2015年左右,中国走上了成为人工智能领域顶尖参与者的道路,他们通过教育投资实现了这一目标。我们看到这开始有了回报。”

AI领域还出现了“开放权重”模型在数量和性能上的惊人增长,如DeepSeek和Meta的LLaMa。用户可以自由查看这些模型在训练过程中学习到的并用于预测的参数,不过其他细节,如训练代码,可能仍保密。最初,不公开这些因素的封闭系统明显更优越,但到2024年初,这些类别中顶级竞争者之间的性能差距缩小到了8%,到2025年初则缩小到了1.7%

加利福尼亚州门洛帕克的非营利性研究机构SRI的计算机科学家、该报告的联合主任雷 佩罗特说:“这对任何无力从头构建模型的人来说肯定是好事,包括许多小公司和学者。”OpenAI计划在未来几个月内发布一个开放权重模型。

2022 年ChatGPT公开推出后,开发人员将大部分精力投入到通过扩大模型规模来提升系统性能上。该指数报告称,这一趋势仍在继续:训练一个典型的领先人工智能模型所消耗的能源目前每年翻一番;每个模型使用的计算资源每五个月翻一番;训练数据集的规模每八个月翻一番。

然而,各公司也在发布性能非常出色的小型模型。例如,2022年在MMLU上得分超过60%的最小模型使用了5400亿个参数;到2024年,一个模型仅用38亿个参数就达到了相同的分数。小型模型比大型模型训练速度更快、回答问题更迅速,且能耗更低。佩罗特说:“这对各方面都有帮助。”

塞尔曼说,一些小型模型可以模仿大型模型的行为,或者利用比旧系统更好的算法和硬件。该指数报告称,人工智能系统使用的硬件的平均能源效率每年提高约40%。由于这些进步,在MMLU上得分超过60%的成本大幅下降,从2022年11月的每百万个token约20美元降至 2024年10月的每百万个token约7美分。

尽管在几项常见的基准测试中取得了显著进步,但该指数强调,生成式人工智能仍然存在一些问题,如隐性偏见和“幻觉”倾向,即吐出虚假信息。塞尔曼说:“它们在很多方面给我留下了深刻印象,但在其他方面也让我感到恐惧。它们在犯一些非常基本的错误方面让我感到惊讶。”


02

2022-04

能源局部署2022年工作:加快能源绿色低碳转型 海风、光伏有望担纲

能源局部署2022年工作:加快能源绿色低碳转型 海风、光伏有望担纲

04

2022-11

银行也过“双11” 支付优惠花式来袭

银行也过“双11” 支付优惠花式来袭

16

2022-12

KubeSphere企业版的“房屋三部曲”:拎包入住、别具一格、孕育价值

KubeSphere企业版的“房屋三部曲”:拎包入住、别具一格、孕育价值

25

2022-02

元宇宙:可能落在巨头们的布局之外

元宇宙:可能落在巨头们的布局之外

30

2022-12

从功能机王者到接棒小米,通讯巨头摩托罗拉,手机业务上还有戏?

从功能机王者到接棒小米,通讯巨头摩托罗拉,手机业务上还有戏?

13

2021-08

电动自行车非法改装泛滥 中消协发消费警示

电动自行车非法改装泛滥 中消协发消费警示

02

2022-12

被“反噬”的硅谷大厂: 裁员潮涌 经济严冬下为过度扩张埋单

被“反噬”的硅谷大厂: 裁员潮涌 经济严冬下为过度扩张埋单

28

2022-01

千亿小红书:铠甲与软肋

千亿小红书:铠甲与软肋
返回顶部
客服电话
用微信扫一扫关注我们
请各公司推销人员注意:我单位拒绝任何方式、任何形式的电话推销,请勿拔打我单位客服热线进行电话推销,谢谢合作!
公司名称:100元4个小时上门服务电话
100元4个小时上门服务电话-同城约茶服务十点击查看网站【www.sscmtv.com】200元3小时上门不限次二维码-微信qq上600块3小时不限次数-一百【点击进入立即约茶】。小妹
关键词:新闻资讯:斯坦福最新AI研究报告出炉 中美模型质量差距缩小至0.3%,100元4个小时上门服务电话【点击进入网站查看约茶服务】。网上怎么找上门服务,附近品茶服务,喝茶服务联系方式,附近初中生300块电话号码,不限次品茶,一条龙的服务上门二维码,100块钱上门服务电话号码,200元1小时做完付款十同城附近约茶服务:【进入平台查看预约服务】。同城包小妹电话是,小姐服务,本地同城附近200元,24小时上门二维码,1243567800元3小时上门服务电话,500块钱3小时上门服务电话,,联系同城约茶服务,【点击这里进入上门服务】。 附近大泡50元的电话
云南网站建设,云南网页设计,昆明网站建设,昆明网页设计  网站管理
【版权声明】本站部分内容由互联网用户自行发布,著作权或版权归原作者所有。如果侵犯到您的权益请发邮件致info@ynjwz.com,我们会第一时间进行删除并表示歉意。