• <acronym id="mz9d1"><output id="mz9d1"></output></acronym>

    <sub id="mz9d1"><ol id="mz9d1"><nobr id="mz9d1"></nobr></ol></sub>
        1. <sup id="mz9d1"></sup>
          每日經濟新聞
          要聞

          每經網首頁 > 要聞 > 正文

          李飛飛團隊456頁最新報告:中美AI模型性能近乎持平,系統推理成本降至280分之一

          每日經濟新聞 2025-04-09 18:46:27

          4月8日,斯坦福大學以人為本人工智能研究所發布《2025年人工智能指數報告》。報告指出,中美模型性能近乎持平,達到GPT-3.5水平的系統推理成本在過去兩年間下降到了原來的280分之一。同時,全球AI投資飆升,企業對AI的采用率顯著提升。

          每經記者 宋欣悅    每經編輯 蘭素英    

          4月8日,由李飛飛聯合領導的斯坦福大學以人為本人工智能研究所(Stanford HAI)發布了《2025年人工智能指數報告》(Artificial Intelligence Index Report 2025)。這份長達456頁的報告,深入剖析了2024年全球人工智能行業的發展態勢,揭示了12大關鍵趨勢。

          圖片來源:斯坦福大學以人為本人工智能研究所官網

          報告認為,AI正變得更高效、更普惠。隨著小模型性能飆升,達到GPT-3.5水平的系統推理成本在過去兩年間下降到了原來的280分之一。

          報告還指出,中國高性能AI模型的數量和質量不斷提升,中美AI模型性能近乎持平。與此同時,中國在AI領域論文數量和專利數量上保持領先地位。

          AI性能飆升,表現逐漸接近人類

          2023年,研究人員推出了MMMU、GPQA和SWE-bench等頗具挑戰性的新基準測試,用于測試AI系統的極限。

          測試發現,僅僅一年后,AI系統的性能便實現大幅躍升——在MMMU測試中得分提升18.8個百分點;在GPQA測試中提高48.9個百分點;SWE-bench測試里更是提升了67.3個百分點。

          從整體趨勢來看,AI在各大領域的表現逐漸接近人類,甚至在某些情形下,AI智能體能在限時編程任務中超越人類

          在部分評測指標上,AI技術性能表現與人類水平的對比 圖片來源:《2025年人工智能指數報告》

          然而,復雜的推理對于AI模型而言,仍然是一個挑戰

          在處理類似國際數學奧林匹克競賽題目這類任務時,AI模型表現出色。但面對諸如PlanBench等復雜推理基準測試時,卻仍顯得吃力。即使面對那些已知存在正解的邏輯任務,AI也經常無法可靠地解決邏輯任務,這極大限制了AI在對精度要求極高的高風險行業中的應用

          各大模型在PlanBench基準測試上的正確率 圖片來源:《2025年人工智能指數報告》

          全球AI投資飆升 

          2024年,生成式AI在全球范圍內吸引了339億美元的私人投資,與2023年相比,增長幅度達到18.7%。

          與此同時,企業對AI的采用率顯著提升,從2023年的55%上升至2024年的78%。越來越多的研究結果表明,AI不僅能夠有效提升生產力,在多數情況下,還能縮小勞動力的技能差距。

          值得關注的是,將生成式AI應用于至少一項業務職能的企業數量出現了激增。2023年,這一比例僅為33%,而到了2024年,該比例躍升至71%,增幅超過一倍。

          2017年至2024年,將AI應用于至少一項業務職能企業的比例不斷上升 圖片來源:《2025年人工智能指數報告》

          中美模型性能近乎持平

          數據顯示,美國在AI模型的數量上處于領先地位。2024年,總部位于美國的機構擁有40個知名AI模型,超過中國(15個)和法國(3個)。

          圖片來源:《2025年人工智能指數報告》

          不過,報告強調,中美模型之間的性能差距正在迅速縮小。以MMLU和HumanEval等主流基準測試結果來看,2023年,中美頂尖模型之間的性能差距還在兩位數,然而到了2024年,這一差距已大幅縮小,幾乎處于同一水平 

          與此同時,中國在AI領域論文數量和專利數量上依舊保持領先地位

          小模型性能飆升,推理成本降至280分之一 

          報告指出,AI正變得更加高效、經濟實惠和易于獲取。

          隨著小模型性能提升,達到GPT-3.5水平的系統推理成本在過去兩年間下降至280分之一。在硬件層面,成本每年下降30%,而能源效率每年提高40%。

          2022年,在MMLU基準測試中,得分超60%的最小模型是PaLM,參數量為5400億。到了2024年,微軟Phi-3-mini僅用38億參數,就取得了同樣的實力。這代表,兩年多的時間里模型參數減少了142倍。

          此外,開源模型正在迎頭趕上,與閉源模型的差距逐漸縮小。2023年,開源模型明顯落后于閉源模型。而到2024年,這一差距幾乎消失。2024年1月初,頂尖閉源模型在大模型競技場排行榜上以8.0%的成績超過了頂尖開源模型。而到2025年2月,這一差距已縮小至1.7%。

          2022年至2024年,在MMLU上得分高于60%的小模型 圖片來源:《2025年人工智能指數報告》

          中國對AI的態度最樂觀

          在對AI的態度方面,中國是全球主要國家和地區中最樂觀的

          報告顯示,2024年中國有83%的人認為AI產品和服務利大于弊,排在后面的是印度尼西亞(80%)和泰國(77%)。相比之下,美國(39%)、加拿大(40%)等的樂觀情緒遠低于中國。

          2022年至2024年,各國認為“使用AI產品和服務利大于弊”的比例 圖片來源:《2025年人工智能指數報告》

          不過,從整體趨勢而言,各國對于AI的樂觀情緒正逐漸升溫,特別是在一些曾對AI最持懷疑態度的國家。數據顯示,自2022年起,美國認為“使用AI產品和服務利大于弊”的比例提升了4%,加拿大增長了8%,法國增長了10%。

          三分之二受訪者稱AI將在未來3至5年對日常生活產生顯著影響

          從醫療保健到交通運輸,AI正迅速從實驗室走向日常生活。

          2023年,美國食品藥品監督管理局(FDA)批準了223款AI醫療設備,而2015年僅有6款。

          1995年至2023年FDA批準的AI醫療設備數量 圖片來源:《2025年人工智能指數報告》

          道路交通同樣因AI技術發生著日新月異的變化。自動駕駛汽車不再只是實驗,而是逐步駛入現實生活。

          美國最大的運營商之一Waymo每周提供超過15萬次自動駕駛服務,而百度旗下的“蘿卜快跑”(Apollo Go)無人駕駛出租車隊已在中國多個城市正式投入運營。

          此外,人們對AI融入日常生活的期待與認可度正在上升。據統計,全球范圍內,有多達三分之二的受訪者認為,在未來三到五年內,AI產品及服務將對日常生活產生顯著影響

          如需轉載請與《每日經濟新聞》報社聯系。
          未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

          讀者熱線:4008890008

          特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

          Ai 模型 人工智能 李飛飛

          歡迎關注每日經濟新聞APP

          每經經濟新聞官方APP

          0

          0

          国产日本精品在线观看_欧美日韩综合精品一区二区三区_97国产精品一区二区三区四区_国产中文字幕六九九九
        2. <acronym id="mz9d1"><output id="mz9d1"></output></acronym>

          <sub id="mz9d1"><ol id="mz9d1"><nobr id="mz9d1"></nobr></ol></sub>
              1. <sup id="mz9d1"></sup>
                日本中文字幕有码在线看 | 亚洲无玛中文字幕久久婷婷 | 中文字幕福利一区二区三区 | 思思久久96热视频主播 | 一级a毛一级a做视频在线观看 | 亚洲精品福利在线 |