铭慧(河北)农业科技发展有限公司

◉ 健康资讯

Health information

好味道源于好产地


斯坦福发布《2025年人工智能指数演讲》:全球

发布时间:

2025-04-09 05:47



  自 2017 岁首年月次发布以来,该演讲一曲努力于为政策制定者、研究人员、企业高管和供给精确、严谨、全球化的 AI 数据和洞察。正如演讲结合 Yolanda Gil 和 Raymond Perrault 正在序言中所言,2024 年是人工智能成长史上具有里程碑意义的一年。AI 曾经以史无前例的速度融入社会、经济和全球管理的方方面面。从先辈模子的机能飞跃到日常糊口的深度嵌入,从创记载的财产投资到日益收紧的监管,AI 正从边缘核心,成为驱动贸易价值、沉塑科研范式甚至影响人类将来的焦点力量。本年的这份演讲长达四百多页,是迄今为止最为全面的一版,新增了对 AI 硬件演进、推理成本估算、AI 出书和专利趋向的深切阐发,并扩大了关于企业采用负义务 AI 实践以及 AI 正在科学和医学范畴脚色的新颖数据。演讲强调,正在一个 AI 无处不正在、从顶尖尝试室到通俗家庭的餐桌都正在会商的时代,客不雅的视角来理解 AI 的现状、演变径和将来趋向,其主要性从未如斯凸显。· 基准机能持续提拔:2023 年研究人员引入了 MMMU、GPQA、SWE-bench 等一系列旨正在难倒顶尖 AI 的新基准。然而仅一年后,AI 模子正在这些基准上的表示就呈现了惊人的飞跃,得分别离提拔了 18。8、48。9 和 67。3 个百分点。特别正在 SWE-bench(软件工程基准)上,AI 处理编码问题的能力从 2023 年的仅 4。4% 飙升至 2024 年的 71。7%。同时,高质量视频生成等范畴也取得了严沉进展。· 中美差距显著缩小:演讲指出,美国仍然是顶尖 AI 模子的“出产大户”,2024 年发布了 40 个值得关心的模子,远超中国的 15 个和欧洲的 3 个。然而,数量上的领先并不料味着机能上的绝对劣势。正在 MMLU、HumanEval 等环节基准上,中美顶尖模子之间的机能差距已从 2023 年的两位数敏捷缩小至 2024 年的近乎持平,部门基准差距仅为个位数以至零点几。这表白中国 AI 模子的“质量”正正在快速逃逐。· 手艺前沿趋于:合作的加剧也表现正在手艺前沿的“拥堵度”上。演讲援用了 LMSYS Chatbot Arena(一个普遍利用的大模子竞技场)的数据,显示排名第一和第十的模子之间的 Elo 分数差距从一年前的 11。9% 缩小到了 5。4%。更值得留意的是,排名前两位的模子差距从 4。9% 骤降至仅 0。7%。这意味着顶尖模子的机能程度日益接近,高质量模子不再是少数巨头的专利,开辟者生态系统正变得越来越有合作力。正如 HAI 研究从管 Vanessa Parli 正在接管采访时所说:“这创制了一个冲动的场合排场。好的地朴直在于,这些模子不再仅仅是由硅谷的五小我开辟的。”· 小型模子异军突起,开源模子奋起曲逃:另一个显著趋向是“小模子”展示出的强大能力。2022 年,正在 MMLU 上得分跨越 60% 的最小模子是具有 5400 亿参数的 PaLM。而到 2024 年,微软仅有 38 亿参数的 Phi-3-mini 就达到了同样门槛,参数量缩减了 142 倍。这得益于算法效率的提拔。同时,开源/权沉模子取闭源模子之间的机能差距也几乎消逝。正在 Chatbot Arena 上,2024 岁首年月领先的闭源模子比顶尖权沉模子超出跨越 8。04%,到 2025 岁首年月,这一差距已缩小至 1。70%。这标记着先辈 AI 手艺的获取门槛正正在快速降低。· 成本效益显著提拔:演讲初次对推理成本进行了逃踪。成果显示,达到 GPT-3。5(正在 MMLU 上约 64。8% 精确率)机能程度的 AI 模子,其推理成本从 2022 年 11 月的每百万 token 20 美元,骤降至 2024 年 10 月的仅 0。07 美元(以 Gemini-1。5-Flash-8B 为例),降幅跨越 280 倍。硬件层面,成本每年下降约 30%,而能效每年提拔约 40%。这使得 AI 的使用愈加经济可行。· AI Agent(智能体)崭露头角:2024 年推出的 RE-Bench 为评估 AI 智能体的复杂使命供给了严酷的基准测试。正在短时间范畴内(两小时), AI 系统的得分是人类专家的四倍,但当赐与更多时间完成使命时,人类表示优于 AI,正在 32 小不时间框架内领先 AI 两倍。虽然如斯,AI 智能体正在特定使命上曾经能取人类专业学问相婚配,同时供给更快的成果。· 投资再立异高,美国劣势扩大:全球私有 AI 投资正在履历短暂回调后,于 2024 年强劲反弹至创记载的 2523 亿美元(企业总投资,包罗并购等)。此中,私有投资额达到 1,508 亿美元,同比增加 44。5%。美国仍然是全球 AI 投资的绝对核心,2024 年吸引了 1,091 亿美元的私有投资,是中国的 93 亿美元的近 12 倍,是英国的 45 亿美元的 24 倍。特别正在生成式 AI 范畴,美国投资额(2024 年为 290。4 亿美元)比中国和欧盟+英国的总和还要多出 254 亿美元,差距进一步拉大。生成式 AI 本身也成为吸金热点,全球共获得 339 亿美元投资,同比增加 18。7%。· 企业使用空前普及:企业对 AI 的使用不再逗留正在尝试阶段。麦肯锡的查询拜访显示,2024 年演讲正在其组织中至多一个营业功能中利用 AI 的受访者比例从 2023 年的 55% 跃升至 78%。同样,演讲利用生成式 AI 的比例也从 33% 翻倍增加至 71%。AI 正从企业的边缘东西改变为焦点驱动力。但价值兑现尚需时日:越来越多的研究了 AI 对出产力的积极影响,特别是正在缩小低技术和高技术工人之间的差距方面。然而,演讲也指出,虽然企业普遍采用 AI,但大都公司仍处于价值实现的晚期阶段。正在演讲 AI 带来财政影响的企业中,大部门暗示效益仍处于较低程度。例如,49% 正在办事运营中利用 AI 的企业演讲了成本节约,但大都节约幅度低于 10%。同样,71% 正在市场营销中利用 AI 的企业演讲了收入增加,但最常见的增加幅度也低于 5%。· 机械人范畴中国持续领先:正在工业机械人范畴,中国继续连结从导地位,2023 年安拆量达 27。63 万台,是日本的 6 倍,美国的 7。3 倍,占全球份额的 51。1%。虽然比拟 2022 年增速略有放缓,但其领先劣势仍然庞大。同时,协做机械人和面向人类的办事机械人安拆量持续增加,显示出机械人使用场景的扩展。· 能源款式的新变化:AI 复杂的算力需求正正在鞭策能源来历的严沉变化,吸引了对核能的关心。演讲出格提到了微软投资 16 亿美元沉启三里岛核反映堆为 AI 数据核心供电,以及谷歌、亚马逊等巨头纷纷签订核能和谈,这预示着 AI 成长可能对将来能源布局发生深远影响。跟着 AI 能力的加强和使用的普及,负义务 AI(RAI,Responsible AI)的议题变得空前主要。· AI 相关事务急剧添加:按照 AI 事务数据库的记实,2024 年演讲的 AI 相关负面事务达到 233 起,创下汗青新高,比 2023 年增加了 56。4%。这既反映了 AI 使用的扩大,也凸显了潜正在风险的添加,例如深度伪制、蔑视、现私泄露等。· RAI 评估尺度仍待同一:演讲指出,虽然 RAI 的主要性日益凸显,但行业内仍然缺乏针对大型言语模子的尺度化 RAI 基准。这使得跨模子的平安性和义务评估变得坚苦。不外,HELM Safety、AIR-Bench、FACTS 等新兴基准的呈现,为评估模子的实正在性、平安性和供给了有但愿的东西。· 企业认知取步履存正在差距:查询拜访显示,虽然很多企业认识到 RAI 的环节风险(如不精确性、合规性、收集平安),但正在采纳具体缓解办法方面仍然畅后。例如,仅有 64% 关心不精确性风险的带领者采纳了响应步履。· 全球政策制定者紧迫感加大:取企业界的隆重分歧,全球政策制定者正在 2024 年较着加大了对 AI 管理的关心和合做力度。OECD、欧盟(通过《AI 法案》)、结合国、非盟等次要国际组织纷纷发布框架和准绳,聚焦通明度、可相信性、公允性等焦点 RAI 议题。也加大了监管力度,例如美国联邦机构正在 2024 年出台了 59 项 AI 相关律例,是 2023 年的两倍多。美国各州正在规范深度伪制(特别是正在选举场景使用)方面也取得了显著进展。· 数据公共池(Data Commons)正正在萎缩:AI 模子的锻炼依赖于海量的公开收集数据。然而,研究发觉,因为网坐所有者对数据抓取(scraping)的日益增加(例如通过 robots。txt 或办事条目),公开可用的锻炼数据正正在敏捷削减。正在 C4 Common Crawl 数据集中,受的 token 比例从 2023 年的 5-7% 跃升至 2024 年的 20-33%。这可能对将来模子的锻炼数据多样性、模子对齐和可扩展性带来挑和,但也可能催生新的数据获取和进修方式(如合成数据)。· 模子通明度有所改善,但仍需勤奋:根本模子通明度指数显示,支流模子开辟者的平均通明度得分从 2023 年 10 月的 37% 提高到 2024 年 5 月的 58%。这表白行业正在披露模子消息方面有所前进,但距离完全通明仍有很长的要走。· 现性仍然存正在:演讲强调,即便是那些明白设想了反办法的先辈大模子(如 GPT-4、Claude 3。5),仍然表示呈现性。例如,模子可能更容易将负面词汇取特定种族联系起来,或退职业联想上表示出性别刻板印象。消弭 AI 仍然是一项艰难而持续的使命。· 科学项的承认:2024 年,AI 正在科学范畴的贡献获得了最高荣誉。两项诺贝尔别离表扬了深度进修的根本工做(物理学,John Hopfield 和 Geoffrey Hinton)及其正在卵白质折叠预测中的使用(化学,AlphaFold 团队的 Demis Hassabis 和 John Jumper)。图灵则授予了强化进修范畴的奠定人。这标记着 AI 已成为科学研究不成或缺的一部门。· 卵白质研究的飞跃:AlphaFold 3 和 ESM3 等新一代卵白质序列模子正在 2024 年发布,它们规模更大、机能更强,极大地提高了卵白质布局和功能预测的精确性。这些模子不只鞭策了根本生物学研究,也为药物设想和合成生物学斥地了新路子。公开卵白质数据库(如 UniProt、PDB、AlphaFold DB)的规模也正在持续快速增加。· 临床学问取使用:大模子正在医学学问问答基准(如 MedQA)上的表示持续提拔,OpenAI 的 o1 模子取得了 96。0% 的新 SOTA 分数。研究表白,正在某些复杂的临床诊断使命中,GPT-4 的表示以至优于大夫(无论大夫能否利用 AI 辅帮)。高风险患者识别等方面也显示出超越人类专家的潜力。FDA 核准的 AI 赋能医疗器械数量呈爆炸式增加,从 2015 年的仅 6 个激增至 2023 年的 223 个。· 合成数据的潜力:研究显示,AI 生成的合成数据正在医学范畴展示出庞大潜力,可用于识别健康的社会决定要素、加强现暗里的临床风险预测,以及加快新药化合物的发觉。· 医学伦理关心度提拔: 跟着 AI 正在医疗范畴的普遍使用,相关的伦理会商也日益增加。医学 AI 伦理相关的出书物数量自 2020 年以来翻了两番,显示出学术界对这一范畴的高度关心。· CS 取 AI 教育普及,但鸿沟犹存:全球范畴内,供给或打算供给 K-12 计较机科学(CS,Computer Science)教育的国度比例已从 2019 年的约三分之一翻倍至三分之二,非洲和拉丁美洲前进最为显著。然而,根本设备(如电力缺乏)了非洲学生的现实进修机遇。正在美国,虽然高中 CS 课程的笼盖率和入学率有所提高,但分歧州、族裔、收入程度和性此外学生之间仍然存正在显著差距。虽然 81% 的美国 CS 教师认为应将 AI 纳入根本 CS 教育,但只要不到一半的人感受本人有能力传授 AI。· 人才培育呈现新动向:美国 AI 相关硕士结业生的数量正在 2022 年至 2023 年间几乎翻了一番,这可能预示着将来几年学士和博士层面也将呈现雷同的增加。美国正在消息、通信和手艺范畴的结业生培育方面继续连结全球领先地位。· 全球情感:隆重乐不雅取深刻不合:Ipsos 的全球查询拜访显示,对 AI 产物和办事的立场趋于“隆重乐不雅”。认为 AI 利大于弊的全球受访者比例从 2022 年的 52% 上升到 2024 年的 55%。特别是正在此前较为悲不雅的国度(如、法国、、英国、美国),乐不雅情感有了显著增加(+4% 到+10% 不等)。然而,地域差别仍然庞大。中国(83%)、印尼(80%)、泰国(77%)等亚洲国度遍及更为乐不雅,而(40%)、美国(39%)、荷兰(36%)等国则相对更为审慎。· 信赖度下降,伦理担心加剧:虽然总体乐不雅情感有所上升,但对 AI 公司伦理行为的信赖度正鄙人降。全球范畴内,相信 AI 公司会小我数据的受访者比例从 2023 年的 50% 下降到 47%。认为 AI 系统无的比例也正在降低。对从动驾驶汽车的不信赖感仍然很高(美国 61% 的人暗示害怕)。· 对 AI 影响的认知:全球 60% 的受访者认为 AI 将正在将来五年改变他们的工做体例,但只要 36% 的人认为 AI 会代替他们的工做。人们遍及认为 AI 能节流时间(55%)、供给更好的文娱(51%),但正在经济影响(36% 认为能改善国度经济)和健康改善(38%)方面则决心不脚。

 

 

 

 

 

关键词:

推荐新闻


分享到

返回列表