登入 直接訂購 教學視頻

小米開源首個推理大模型Xiaomi MiMo

小米大模型公眾號公布,小米開源首個為推理(Reasoning)而生的大模型「Xiaomi MiMo」,聯動預訓練到後訓練,全面提升推理能力。

在數學推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上,MiMo僅用7B的參數規模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規模的開源推理模型QwQ-32B-Preview。

隨着DeepSeek-R1引發業界強化學習(RL)共創潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成為廣泛使用的強化學習起步模型。

在相同RL訓練數據情況下,MiMo-7B的數學及代碼領域的強化學習潛力顯著領先。

股票及指數資料由天滙財經有限公司,泓滙財經資訊有限公司及財經智珠網有限公司提供。外滙及黃金報價由路透社提供。