DeepSeek發布最新NSA 加速文本訓練與推理阿思達克財經新聞 (2025-02-19 07:48:13)

DeepSeek發布最新技術論文《原生稀疏注意力:硬件對齊且可原生訓練的稀疏注意力機制》(Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention)。論文署名中,DeepSeek創始人梁文鋒也作為共創在列。

該論文提出一種名為NSA(Natively Sparse Attention),即「原生稀疏注意力」的新型注意力機制。NSA是一種用於超快速長文本訓練與推理的、硬件對齊且可原生訓練的稀疏注意力機制。據分析,在64K長文本場景下,NSA實現解碼速度提升11.6倍、前向傳播9倍加速及反向傳播6倍加速。(ta/w)~

阿思達克財經新聞
網址: www.aastocks.com
成交量排行 / 成交價排行 / 漲幅排行 / (看全部)
股票 成交價 漲跌 漲幅 成交張
世芯-KY 2830.00 -- -- 1,354
大立光 2460.00 -40.00 -1.60% 349
祥 碩 2030.00 -15.00 -0.73% 221
緯 穎 1950.00 -65.00 -3.23% 1,690
川 湖 1865.00 -100.00 -5.09% 1,433
加密貨幣
比特幣BTC 84735.07 688.81 0.82%
以太幣ETH 2009.68 44.74 2.28%
瑞波幣XRP 2.41 0.03 1.29%
比特幣現金BCH 324.20 1.58 0.49%
萊特幣LTC 92.34 1.41 1.55%
卡達幣ADA 0.711920 0.01 0.96%
波場幣TRX 0.233991 0.00 0.24%
恆星幣XLM 0.279987 0.00 1.17%
投資訊息
相關網站
股市服務區
行動版 電腦版
系統合作: 精誠資訊股份有限公司
資訊提供: 精誠資訊股份有限公司
資料來源: 台灣證券交易所, 櫃買中心, 台灣期貨交易所
依證券主管機關規定,使用本網站股票、期貨等金融報價資訊之會員,務請詳細閱讀「資訊用戶權益暨使用同意聲明書」並建議會員使用本網站資訊, 在金融和投資等方面,能具有足夠知識及經驗以判斷投資的價值與風險,同時會員也同意本網站所提供之金融資訊, 係供參考,不能做為投資交易之依據;若引以進行交易時,仍應透過一般合法交易管道,並自行判斷市場價格與風險。
請遵守台灣證券交易所『交易資訊使用管理辦法』等交易資訊管理相關規定本資料僅供參考,所有資料以台灣證券交易所、櫃買中心公告為準。 因網路傳輸問題造成之資料更新延誤,精誠資訊不負交易損失責任。