國產大模型丨騰訊混元推0.3B端側模型
【騰訊/國產大模型/騰訊混元】騰訊(00700)旗下騰訊混元宣布,基於首個產業級2位元(bit)端側量化方案,正式推出一款面向消費級硬件場景的「極小」模型HY-1.8B-2Bit,等效參數量僅有0.3B,記憶體佔用僅600MB,較常用的一些手機應用程式還小。
據介紹,通過對此前混元的小尺寸語言模型—HY-1.8B-Instruct進行2位元量化感知訓練(QAT)產出,這一模型對比原始精度模型等效參數量降低6倍,並且在沿用原模型全思考能力同時,在真實端側設備上對比原始精度模型生成速度提升2至3倍,可大幅提升使用體驗。
今次騰訊混元推出HY-1.8B-2Bit模型,可以在邊緣設備上無壓力部署。這也是首個在實現2位元產業級量化的端側模型實踐。
目前,市場憧憬陸續有國產大模型發布更新版本,早前有傳智譜(02513)和稀宇科技(00100)於春節前發布大模型更新,阿里(09988)旗下的Qwen3.5亦傳出將於春節期間出爐。中銀國際證券指出,今年大模型迎來春節檔,豆包2.0、Seedance 2.0、Qwen3.5等內地龍頭廠商大模型,有望在春節前後將密集更新,AI應用或迎來觸底反彈。




,泓滙財經資訊有限公司及財經智珠網有限公司提供。外滙及黃金報價由路透社提供。