要聞

小米，開源！

每日經濟新聞 2025-04-30 23:05:26

每經編輯｜金冥羽

4月30日，小米宣布開源首個為推理而生的大模型Xiaomi MiMo。據稱，其在數學推理（AIME 24-25）和代碼競賽（LiveCodeBench v5）公開測評集上，MiMo僅用7B的參數規模，超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規模的開源推理模型QwQ-32B-Preview。

YRdSz9epGVjn3ichzP6CzICYF3OpYNbYSvvKR8LR0LWUBW8XM9tOuQSGISwdAsPvFP5KaqPXlUEtKESIlDDNr5w.jpg

圖片來源：Xiaomi MiMo微信公眾號

受此消息影響，今日小米股價漲5.27%，金山云和金山軟件更是分別大漲14.20%和7.07%。業內人士認為，小米作為國產頭部的手機品牌廠商，此次開源的小參數規模模型展現了較強的性能，為AI在手機端側的應用和運行提供了更堅實的模型基礎。

CFF20LXzkOyP3r3YMnfwzibjqUgyCoVNFZKGY6icutvaDBj1QTxG0Wia6UwlfC2ZerLXIxZwOz9Y5mI5NujnCk4aA.jpg

圖片來源：Wind

隨著MiMo模型的開源，小米剛剛成立不久的小米大模型Core團隊也終于浮出水面。小米創始人雷軍曾在2023年表示，自2016年組建AI團隊以來，到2023年4月第一時間成立專職大模型團隊，經過多次擴展，小米AI團隊相關人員規模已達3000多人，逐步建立了視覺、語音、聲學、知識圖譜、NLP、機器學習、多模態等AI技術能力。

小米大力“押寶”大模型早在去年底便已有消息傳出。DeepSeek-V3爆火之后，背后的AI“天才少女”羅福莉引發了大眾的關注，彼時就有媒體報道稱，雷軍以千萬年薪招攬DeepSeek開源大模型DeepSeek-V2的關鍵開發者之一羅福莉，領導小米AI大模型團隊。

值得一提的是，DeepSeek同日于AI開源社區Hugging Face上發布了一個名為DeepSeek-Prover-V2-671B的新模型。據悉，DeepSeek-Prover-V2-671B使用了更高效的safetensors文件格式，并支持多種計算精度，方便模型更快、更省資源地訓練和部署，參數達6710億，或為去年發布的Prover-V1.5數學模型升級版本。在模型架構上，該模型使用了DeepSeek-V3架構，采用MoE（混合專家）模式，具有61層Transformer層，7168維隱藏層。同時支持超長上下文，最大位置嵌入達16.38萬，使其能處理復雜的數學證明，并且采用了FP8量化，可通過量化技術減小模型大小，提高推理效率。

中信建投研報表示，大模型能力不斷迭代增長，但模型之間差異在縮小。這些技術需要在終端設備上應用落地，最終通過這些應用/終端實現商業價值的轉化，從而形成一個從投資到變現的完整閉環。目前，Meta、字節、小米等巨頭已經開始大力布局端側AI，搶奪AI Agent入口。除了手機、PC、眼鏡、耳機外，潛在的端側AI基數巨大，家電、機器人、智能車、教育辦公設備、玩具等都受益于端側AI的趨勢，AI嵌入將帶來廣泛的硬件升級。重點關注算力、存儲、連接、電力等硬件環節。

（聲明：文章內容和數據僅供參考，不構成投資建議。投資者據此操作，風險自擔。）

編輯|||金冥羽?杜波

校對|陳柯名

封面圖片來源：視覺中國

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png 每日經濟新聞綜合證券時報、財聯社、Wind等