DeepSeek R1新版:顯著提升思維深度與推理能力
內地生成式人工智能(AI)初創公司DeepSeek在AI開發者平台Hugging Face上發布R1推理模型的更新版本R1-0528。
該公司在更新的官方說明稱,DeepSeek-R1-0528仍然使用去年12月所發布的DeepSeek V3 Base模型作為基座,但在後訓練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力。
更新後的R1模型在數學、程序設計與通用邏輯等多個基準測評中取得了當前國內所有模型中首屈一指的優異成績,並且在整體表現上已接近其他國際頂尖模型,如o3與Gemini-2.5-Pro。
幻覺改善方面,新版DeepSeek R1針對「幻覺」問題進行了優化。與舊版相比,更新後的模型在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了45%至50%左右,能夠有效地提供更為準確、可靠的結果。
創意寫作方面,在舊版R1的基礎上,更新後的R1模型針對議論文、小說、散文等文體進行了進一步優化,能夠輸出篇幅更長、結構內容更完整的長篇作品,同時呈現出更加貼近人類偏好的寫作風格。
