DeepSeek新模型MODEL1曝光



據內媒報道,DeepSeek-R1發布一周年之際,新模型「MODEL1」曝光。DeepSeek在GitHub更新FlashMLA代碼,橫跨114個文件中有28處提到「MODEL1」,與V32作為不同的模型出現。

報道指,V32是DeepSeek-V3.2,「MODEL很可能是新架構。代碼中的具體差異體現在KV緩存佈局、稀疏性處理和FP8解碼方面,在內存優化上有多處不同。

早前有消息稱,DeepSeek將在2月中春節前後發布下一代旗艦模型。(ta/w)~

阿思達克財經新聞
網址: www.aastocks.com
系統開發、資訊提供:精誠資訊股份有限公司
資料來源:台灣證券交易所、櫃買中心、台灣期貨交易所
本資料僅供參考所有資料以台灣證券交易所、櫃買中心公告為準
網路家庭版權所有、轉載必究 Copyright © PChome Online