每日經濟新聞 2025-12-22 20:05:22
每經記者|楊卉 每經編輯|魏文藝
12月20日,摩爾線程首屆MUSA 開發者大會(MDC 2025)在北京中關村國際創新中心開幕。
在MDC 2025的主論壇環節,中國工程院院士、清華大學計算機系教授鄭緯民提出,在芯片產業全球化分工遭遇技術封鎖的背景下,構建中國“主權AI”計算引擎成為緊迫任務,要實現“主權AI”,需從算力自主、算法自強、生態自立三方面入手。
從“主權AI”基建的角度出發,發展國產萬卡/十萬卡系統是不得不走的一步,但仍需解決互聯網絡與拓撲、可靠性與運維、能耗與供電散熱等方面的問題。至于國產芯片廠商都要面對的終極問題——生態建設,在鄭緯民看來,真正決定“主權AI”生態成敗的,是有沒有足夠多的開發者愿意長期在這套棧上寫代碼。未來,國產平臺要提高用戶的開發體驗,還需解決遷移成本高、工具鏈不成熟、文檔/社區與支持不足等問題。
如何實現算力自主?
過去很長一段時間,芯片產業一直處于全球化分工的狀態,架構設計、制造裝備、代工、封測等環節均涉及不同領域。然而,近年來,高端AI(人工智能)芯片面臨出口管制、技術封鎖等困境,算力從一般生產要素上升為戰略資源,“主權AI”也從學術討論逐步變為每個國家必須回答的現實問題。
鄭緯民認為,要實現“主權AI”,有三個支柱需要同步配備:算力自主、算法自強、生態自立,三者互為前提,相互約束,共同構成“主權AI”。
《每日經濟新聞》記者了解到,具體來看,算力自主是物理層的“安全底座”。
鄭緯民強調,所謂算力自主,是指自主可控的芯片與加速器、可持續的代工與供應鏈、可靠的機房以及電力與網絡基礎設施,最終目標是不被單一外部算力平臺“卡脖子”,關鍵行業與基礎設施能夠在本土算力上運行。
鄭緯民進一步表示,要實現這一目標,則需做到三點:第一,芯片設計能力方面需有自主權,包括GPU(圖形處理器)/加速器、架構設計指令集規劃、片上互連與存儲架構等;第二,制造與供應鏈風險要可控,即在現有全球產業格局下,通過多源代工、庫存策略與本土化能力布局來降低斷供風險;第三,系統與集群交付的能力要強,不僅能“造出卡”,還要能夠穩定交付服務器與大規模集群,并具備持續運維與優化的能力。
“這三條做到了,才是算力自主。”鄭緯民表示。
據《每日經濟新聞》記者了解,算法自強是指在國產算力上做“原生創新”。以GPU為例,需要其做到能針對大模型做適配,如支持Transformer、MoE等主流與前沿模型結構;能做大模型的訓練,可支持千億級、萬億級參數級別的預訓練與多任務訓練;能讓模型進一步優化,在國產算力環境下探索更適配本地應用與數據特點的模型架構。
最后一個支柱是生態自立。在鄭緯民看來,真正決定“主權AI”生態成敗的,是能否有足夠多的開發者愿意長期在這套棧上寫代碼,某種程度上,生態建設甚至比算力和算法更為重要。“不是說芯片上能跑一個軟件就可以了,要(讓用戶)愿意用這個芯片。”
這就要求廠商以開發者為主來提供解決方案,要求廠商在關鍵工具鏈、自研框架與驅動上具備持續迭代的能力,而不是完全依賴單一的境外生態。
鄭緯民強調,開發者才是生態的核心資源,平臺的成敗由開發者決定。因此,國產平臺急需解決遷移成本高、工具鏈不成熟、文檔/社區與支持不足等問題,盡可能兼容主流框架(如PyTorch、TensorFlow、PaddlePaddle等)與常見編程習慣(如CUDA風格),最終目標是實現從“能用”到“愿用”的根本性轉變。
做GPU要滿足三個要求
除了“主權AI”,鄭緯民還提到了AI+3D+HPC架構建設的必要性。
“我們的物理AI與世界模型需要怎樣的芯片?大概有三個方面內容:AI(大規模神經網絡的訓練與推理)、3D(高質量圖形渲染與場景表示)、HPC(嚴格物理約束下的數值模擬與求解)。”鄭緯民表示。
鄭緯民還進一步強調,做GPU 一定要滿足三個要求,即能實現完整的圖形流水線、可加強張量計算核心以支持主流框架、能提供高精度浮點單元用于科學計算。
值得注意的是,鄭緯民還提到了算力資源,從單卡到萬卡集群的轉變。
鄭緯民直言,從“主權AI”基建的角度出發,發展國產萬卡/十萬卡系統等于本土大模型與行業模型的“母機”與基座,是不得不走的一步。一方面,模型時代算力的基本單位已經是集群總算力,而不是單卡性能。另一方面,預訓練超大規模模型、服務國民級推理需求都需要持續可用的萬卡級訓練集群。
不過,《每日經濟新聞》記者了解到,國產算力要做到萬卡甚至十萬卡的集群并不簡單。
從工程角度出發,據鄭緯民介紹,互聯網絡與拓撲、可靠性與運維、能耗與供電散熱都是需要解決的問題。
“十萬卡怎么連起來?十萬卡連在一塊,平均一個小時要出一次錯,出錯了如何繼續訓練下去?十萬卡是一個‘大火爐’,電要供得上,散熱也要做得好。”在此背景下,鄭緯民認為,國產集群第一步是先做到能用,然后才是好用。
在演講最后,鄭緯民提到了開源。
在鄭緯民看來,“后CUDA(英偉達生態)時代”,模型使用者已經是“使用開源項目”,而不是“使用CUDA”。因此,生態自立的一個現實路徑就是讓國產平臺成為開源創新的一個選擇。
鄭緯民指出,目前,產業仍面臨著內卷與碎片化問題,如不同廠家提供不同的接口,需要開發者做不同的適配。
“我們要團結一心,解決應用不足與生態薄弱的問題。產業界要團結起來,應用也要團結起來。我一直強調生態問題不是一個廠家的問題,開發者要發揮很大作用,一起努力解決這個問題。”鄭緯民稱。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP