小米開源首個推理大模型Xiaomi MiMo

今日12:53

小米大模型公眾號公布，小米開源首個為推理(Reasoning)而生的大模型「Xiaomi MiMo」，聯動預訓練到後訓練，全面提升推理能力。

在數學推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上，MiMo僅用7B的參數規模，超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規模的開源推理模型QwQ-32B-Preview。

隨着DeepSeek-R1引發業界強化學習(RL)共創潮，DeepSeek-R1-Distill-7B和Qwen2.5-32B已成為廣泛使用的強化學習起步模型。

在相同RL訓練數據情況下，MiMo-7B的數學及代碼領域的強化學習潛力顯著領先。

返回即時財訊

股票及指數資料由天滙財經有限公司

，泓滙財經資訊有限公司及財經智珠網有限公司提供。外滙及黃金報價由路透社提供。

EJFQ服務條款 | EJFQ私隱條款 | EJFQ免責聲明 | 聯絡EJFQ:[email protected]

本網站的內容概不構成任何投資意見，本網站內容亦並非就任何個別投資者的特定投資目標、財務狀況及個別需要而編製。投資者不應只按本網站內容進行投資。在作出任何投資決定前，投資者應考慮產品的特點、其本身的投資目標、可承受的風險程度及其他因素，並適當地尋求獨立的財務及專業意見。
信報財經新聞有限公司、香港交易所資訊服務有限公司、其控股公司及／或該等控股公司的任何附屬公司、或其資訊來源及／或其他第三方數據供應商均竭力提供準確而可靠的資料，但不能保證資料絕對無誤，且亦不會承擔因任何不準確或遺漏而引起的任何損失或損害的責任。