美團發布並開源LongCat-Flash-Chat
美團(03690)今日正式發布LongCat-Flash-Chat,並同步開源。
美團旗下LongCat大模型在微信發文指出,LongCat-Flash採用創新性混合專家模型(Mixture-of-Experts, MoE)架構,總參數560B,啟動參數18.6B至31.3B,平均為27B,實現了計算效率與性能的雙重優化。
美團指,根據多項基準測試綜合評估,作為一款非思考型基礎模型,LongCat-Flash-Chat在僅啟動少量參數的前提下,性能比肩當下領先的主流模型,尤其在智能體任務中具備突出優勢。由於面向推理效率的設計和創新,LongCat-Flash-Chat具有明顯更快的推理速度,更適合於耗時較長的複雜智能體應用。
通過演算法和工程層面的聯合設計,LongCat-Flash在理論上的成本和速度都大幅領先行業同等規模、甚至規模更小的模型;通過系統優化,LongCat-Flash在H800上達成每秒100 tokens的生成速度,在保持極致生成速度的同時,輸出成本低至每百萬token為5元。
在基礎基準測試中,LongCat-Flash保持高競爭力,MMLU(多工語言理解基準)得分為89.71,CEval(中文通用能力評估基準)得分為90.44,可與目前國內領先的模型比肩,且其參數規模少於DeepSeek-V3.1、Kimi-K2等產品,體現出較高的效率。
