AI大戰丨DeepSeek推出NSA加速推理
人工智能(AI)大戰激烈,美國富商馬斯克旗下初創xAI發布新一代聊天機械人Grok 3後,中國人工智能(AI)初創DeepSeek宣布推出NSA(Native Sparse Attention)。
DeepSeek在社交平台X表示,NSA是一種與硬件一致且本機可訓練的稀疏注意力機制,用於超快速的長上下文(long-context)訓練和推理。
該公司指出,通過針對現代硬件的優化設計,NSA加快了推理速度,同時降低預訓練成本,而不會影響性能。在一般基準測試、長情境任務和基於指令的推理上,其表現與完全注意力模型相當,甚至更好。
馬斯克和其xAI團隊人員在美國時間周一晚上,網上直播發布聊天機械人Grok 3,並在進行現場示範,又指Grok 3在多個基準測試中優於DeepSeek V3等大模型。
