每日經(jīng)濟(jì)新聞 2025-02-24 16:43:53
2月24日,DeepSeek正式開啟開源周并率先發(fā)布優(yōu)化版MLA技術(shù)——FlashMLA。用戶只需滿足特定環(huán)境要求,即可一鍵配置使用。DeepSeek表示,該技術(shù)已測試完備,可投入生產(chǎn)環(huán)境。此前,DeepSeek的技術(shù)發(fā)布曾引起美股和A股震動。寒武紀(jì)(688256.SH)股價上個交易日20cm漲停創(chuàng)新高,今天截至收盤又大漲5.14%。
每經(jīng)記者 岳楚鵬 每經(jīng)編輯 高涵
今天(2月24日),DeepSeek開源周正式開啟。
第一個開源的項(xiàng)目就是重量級技術(shù)DeepSeek-V3核心技術(shù)MLA的改進(jìn)版本FlashMLA。該項(xiàng)目上線僅兩個小時就已經(jīng)收獲了超過2600+star!
圖片來源:Github
據(jù)介紹,F(xiàn)lashMLA的靈感來自FlashAttention 2&3和cutlass項(xiàng)目,是針對英偉達(dá)Hopper架構(gòu)的GPU優(yōu)化的高效MLA解碼內(nèi)核,主要在變長序列 (variable-length sequences) 的場景進(jìn)行了深度優(yōu)化,能夠顯著提升大模型推理效率。
FlashMLA速度非??欤贖800 GPU上具有3000 GB/s的內(nèi)存速度上限以及580 TFLOPS的計算上限。此外,部署這一技術(shù)也很簡單,只需要滿足FlashMLA的運(yùn)行環(huán)境要求(Hopper GPU、CUDA 12.3及以上版本以及PyTorch 2.0及以上版本),就可以一鍵通過`python setup.py install`完成配置。
總之,F(xiàn)lashMlA對英偉達(dá)GPU進(jìn)行了優(yōu)化。
圖片來源:X
眾所周知,MLA是DeepSeek大模型的重要技術(shù)創(chuàng)新點(diǎn),之前Huggingface技術(shù)總監(jiān)也曾多次贊揚(yáng)此項(xiàng)技術(shù)。此次DeepSeek直接開源了該核心技術(shù)的改進(jìn)版本,可以說是誠意滿滿。
DeepSeek表示,當(dāng)前在線服務(wù)的模塊已經(jīng)經(jīng)過測試、部署完備,可以投入生產(chǎn)環(huán)境。這個領(lǐng)域沒有高高在上的象牙塔,只有純粹的車庫創(chuàng)業(yè)精神與社區(qū)共筑的創(chuàng)新力量。
正如很多網(wǎng)友的評價:DeepSeek才是真正的OpenAI。
圖片來源:X
之前幾次DeepSeek新模型和技術(shù)的公布都對美股和A股產(chǎn)生了很大的震動。
寒武紀(jì)(688256.SH)股價上個交易日20cm漲停,股價創(chuàng)新高;今天盤中最高795.8元,截至收盤大漲5.14%,續(xù)創(chuàng)新高。
寒武紀(jì)股價大漲和DeepSeek開源有什么關(guān)系?
每經(jīng)小編問了DeepSeek。它分析稱:
FlashMLA是DeepSeek對混合專家模型(MoE)架構(gòu)的改進(jìn)版本,這類技術(shù)需要高性能AI芯片提供算力支持。寒武紀(jì)的云端推理芯片(如MLU370)和訓(xùn)練芯片(如MLU590)直接受益于大模型技術(shù)迭代帶來的算力需求增長。寒武紀(jì)作為國產(chǎn)龍頭,可能因FlashMLA等本土技術(shù)突破獲得更高關(guān)注度。
總之,FlashMLA的開源可能通過技術(shù)協(xié)同效應(yīng)和市場情緒催化間接推動寒武紀(jì)股價,但直接因果關(guān)系較難量化。
從上面的截圖,大家可以看到,每經(jīng)小編并沒有使用DeepSeek的App,因?yàn)榭偸?ldquo;服務(wù)器繁忙”,而是從每日經(jīng)濟(jì)新聞App進(jìn)入DeepSeek-R1。
2月12日每日經(jīng)濟(jì)新聞App和每經(jīng)網(wǎng)全面接入DeepSeek、Kimi、豆包、智譜清言、文心一言和通義千問6款大模型。用戶通過每日經(jīng)濟(jì)新聞App和每經(jīng)網(wǎng)就能與大模型自由對話還能一鍵“問公司”“問投資”“問基金”。
不得不說,用起來真的很絲滑,目前使用量已經(jīng)超13萬次了!
咋用呢?超簡單!
先下載每日經(jīng)濟(jì)新聞App
http://m.zhpeinuo.com/corp/2016app/index.html
再往下看
↓
一、 在每日經(jīng)濟(jì)新聞App首頁,點(diǎn)擊“DeepSeek”圖標(biāo)或首頁輪播圖“自由問+問公司問投資問基金免費(fèi)使用DeepSeek、Kimi、豆包等六款大模型”。
二、 進(jìn)入“每經(jīng)大模型平臺”頁面,即可使用DeepSeek、Kimi、豆包、智譜清言、文心一言和通義千問6款大模型中任意一款。
最近,每經(jīng)“136計劃”還增加了新功能:
大模型解讀投資熱榜。
只需點(diǎn)擊投資熱榜中的任意新聞。
立即就能得到大模型的全面分析。
還能一鍵生成圖片分享給朋友。
告別“服務(wù)器繁忙”
快用每日經(jīng)濟(jì)新聞App吧!
免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請核實(shí)。據(jù)此操作,風(fēng)險自擔(dān)。
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP