DeepSeek開源FlashMLA AI推理速度再進化
內地人工智能(AI)初創DeepSeek宣布,啟動「開源周」,首個開源的代碼庫為Flash MLA,AI推理速度再進化。
這是針對Hopper GPU優化的高效MLA解碼內核,針對可變長度序列作優化,目前已投入生產。

內地人工智能(AI)初創DeepSeek宣布,啟動「開源周」,首個開源的代碼庫為Flash MLA,AI推理速度再進化。
這是針對Hopper GPU優化的高效MLA解碼內核,針對可變長度序列作優化,目前已投入生產。