每日經(jīng)濟(jì)新聞 2025-02-25 16:20:15
2月25日,DeepSeek選擇了先在GitHub上線,然后再在官推發(fā)布上新通知:今日宣布將DeepEP向公眾開放。DeepEP是MoE模型訓(xùn)練和推理的ExpertParallelism通信基礎(chǔ),可實(shí)現(xiàn)高效優(yōu)化的全到全通信,以支持包括FP8在內(nèi)的低精度計(jì)算,適用于現(xiàn)代高性能計(jì)算。
每經(jīng)編輯 杜宇
上周五(2月21日),DeepSeek宣布連續(xù)五天開源五大軟件庫(kù)。2月25日DeepSeek選擇了先在GitHub上線,然后再在官推發(fā)布上新通知。該公司25日宣布將DeepEP向公眾開放。在宣布后的約20分鐘內(nèi),DeepEP已在GitHub、微軟(MSFT.US)等平臺(tái)上獲得超過1000個(gè)Star收藏。
據(jù)悉,DeepEP是MoE模型訓(xùn)練和推理的ExpertParallelism通信基礎(chǔ),可實(shí)現(xiàn)高效優(yōu)化的全到全通信,以支持包括FP8在內(nèi)的低精度計(jì)算,適用于現(xiàn)代高性能計(jì)算。DeepEP還針對(duì)從NVLink到RDMA的非對(duì)稱帶寬轉(zhuǎn)發(fā)場(chǎng)景進(jìn)行了深度優(yōu)化,不僅提供高吞吐量,還支持流式多處理器數(shù)量控制,從而在訓(xùn)練和推理任務(wù)中實(shí)現(xiàn)高吞吐量性能。
據(jù)券商中國(guó),在DeepSeek API開放平臺(tái)注意到,DeepSeek已重新開放API充值。DeepSeek-Chat模型優(yōu)惠期結(jié)束,調(diào)用價(jià)格已變更為每百萬(wàn)輸入tokens 2元,每百萬(wàn)輸出tokens 8元。此前因資源緊張,DeepSeek曾一度停止充值。
2月25日,DeepSeek概念股探底回升,截至收盤,云天勵(lì)飛20CM漲停。杭鋼股份、威派格漲停。銅牛信息漲超11%,貝瑞基因漲超5%。
值得注意的是,除了DeepSeek之外,阿里Qwen團(tuán)隊(duì)25日早間在社交媒體宣布發(fā)布新推理模型——深度思考(QwQ)。這是在QWQ-MAX-PREVIEW支持下,一個(gè)基于Qwen2.5-Max的推理模型。QwQ可同時(shí)支持深度思考和聯(lián)網(wǎng)搜索,并會(huì)展示完整的思維鏈。Qwen團(tuán)隊(duì)稱,QWQ-MAX官方版本即將發(fā)布,同步會(huì)發(fā)布Android和iOS應(yīng)用程序,還會(huì)發(fā)布更小的可在本地設(shè)備部署的模型,如QWQ-32B等。
這些模型的推出,對(duì)于算力的需求也將是巨大的。2月25日,智算龍頭公司寒武紀(jì)盤中一度大漲近5%。GPU概念股也再度沖高,北京君正盤中一度漲逾9%,龍芯中科盤中一度漲逾4%。
另?yè)?jù)券商中國(guó)援引路透社消息,中國(guó)企業(yè)推出低成本人工智能模型DeepSeek后,顯著推高了模型使用的英偉達(dá)人工智能芯片在中國(guó)市場(chǎng)的需求。路透社引述知情人士的消息說,多家互聯(lián)網(wǎng)巨頭對(duì)同款H20芯片的訂單激增。
每日經(jīng)濟(jì)新聞綜合券商中國(guó)、市場(chǎng)公開資料
免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請(qǐng)核實(shí)。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
封面圖片來源:視覺中國(guó)
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP