DeepSeek新模型藉視覺方式高效壓縮媒介

2025年10月20日

中國AI大語言模型DeepSeek再度開源新模型。該新模型名為DeepSeek-OCR，還是一款OCR(光學字符識別)模型，參數量為3B。

DeepSeek表示，DeepSeek-OCR模型是通過光學二維映射(將文本內容壓縮到視覺像素中)來高效壓縮長文本上下文。

DeepSeek探索的方法概括起來就是，利用視覺模態作為文本資訊的高效壓縮媒介。

此外，DeepSeek-OCR還具備一定程度的通用圖像理解能力。這也意味DeepSeek-OCR存在廣泛應用潛力，在金融領域，它可以將財報瞬間轉為結構化數據；在醫療行業，能快速數字化歷史病歷檔案；對出版機構而言，古籍數字化效率將提升數十倍。更值得關注的是，該模型展現出的視覺記憶特性，為突破大語言模型的上下文長度限制提供了全新思路。

返回即時財訊

股票及指數資料由天滙財經有限公司

，泓滙財經資訊有限公司及財經智珠網有限公司提供。外滙及黃金報價由路透社提供。

EJFQ服務條款 | EJFQ私隱條款 | EJFQ免責聲明 | 聯絡EJFQ:[email protected]

本網站的內容概不構成任何投資意見，本網站內容亦並非就任何個別投資者的特定投資目標、財務狀況及個別需要而編製。投資者不應只按本網站內容進行投資。在作出任何投資決定前，投資者應考慮產品的特點、其本身的投資目標、可承受的風險程度及其他因素，並適當地尋求獨立的財務及專業意見。
信報財經新聞有限公司、香港交易所資訊服務有限公司、其控股公司及／或該等控股公司的任何附屬公司、或其資訊來源及／或其他第三方數據供應商均竭力提供準確而可靠的資料，但不能保證資料絕對無誤，且亦不會承擔因任何不準確或遺漏而引起的任何損失或損害的責任。

DeepSeek新模型 藉視覺方式高效壓縮媒介

DeepSeek新模型藉視覺方式高效壓縮媒介