說起“存儲”和“AI”,很多人會說存儲對AI很重要,因為AI的發(fā)展是由海量數據支撐起來的,這就使得人們對數據處理提出了極高的要求,需要更大的內存去存儲更多的數據,不得不承認,高性能的存儲能讓AI技術發(fā)揮出最大威力。但其實AI對存儲也很重要,AI 時刻推動著存儲的發(fā)展,究其原因繞不開存內計算(PIM :Processing in-memory)。
存內計算是一項打破傳統馮諾依曼架構的新型運算架構,通過將存儲和計算有機結合,直接利用存儲單元進行計算,極大地消除了數據搬移帶來的開銷,解決了傳統芯片在運行人工智能算法上的“存儲墻”與“功耗墻”問題,可以數十倍甚至百倍地提高人工智能運算效率,降低成本。
雖然存內計算的基本概念早在上個世紀七十年代就已經被提出,但直到近些年才逐漸成為人們關注的焦點,原因在于,算力和運算數據量的激增導致存儲墻問題愈發(fā)凸顯,想要進一步提高算力,只有解決存儲墻問題,而在各種解決方案中存內計算是最直接的一種方式,可以實現高能效、低功耗、低成本。
早在2019年,美光首席執(zhí)行官 Sanjay Mehrotra 就指出,曾經的計算架構并不適合未來的發(fā)展趨勢,從長遠來看認為計算最好在內存中完成。當時美光另一位技術高管也堅信計算和內存的融合對于提高性能效率和降低延遲是必要的,并愿意為此付出努力。不少業(yè)內人士認為,未來存儲器可能不僅僅是存儲設備,還可能是加速器,或者還會具備其他的功能,例如更好的ECC等。
那么,面對數據量激增的未來,如何應對內存帶寬挑戰(zhàn),實現更優(yōu)質的 PIM來減輕各種 AI 驅動所面對的諸如HPC、培訓和推理等工作負載?AI就是一個很好的選擇,隨著技術的演進,越來越多的存儲廠商開始加入AI戰(zhàn)…
卡位AI,投資先行
如何最快獲得一項新技術,投資/收購就是極為常見的一種方式,存儲廠商開啟AI投資熱潮大約是在2018年前后,這一年也是人工智能的狂歡年,Google Duplex代替人類自動接打電話、歐盟正式發(fā)布的人工智能道德準則草案、OpenAI的5v5 DOTA AI“Open AI Five”再次完勝人類、全球第一個“AI合成主播”正式上崗…種種一切似乎讓人們意識到,只在小說中存在的AI時代真的要來了。
2018年6月,存儲龍頭三星公布了一項專注于 AI 科技和初創(chuàng)公司的新基金“Samsung NEXT Q Fund ”,將為那些解決AI問題以及使用AI解決計算機科學問題的初創(chuàng)公司提供種子輪和 A 輪融資支持,公告中特別提到,包括的領域涉及模擬學習、場景理解,問題學習方案和人機交互。
到了2018年8月,三星集團宣布,未來三年將在AI、汽車零部件等領域投資逾220億美元,其中大部分投資由三星電子承擔;2021年8月,三星再次公布未來三年會投資240萬億韓元(約合2055億美元)到生物制藥、人工智能、半導體、機器人等領域。從2018年的220億美元,到2021年的2055億美元,十倍的增長,雖然AI并不是三星電子加大投資的惟一領域,但顯然已經是被鎖定的新成長領域。
在2018年三星宣布成立新基金后不久,美光也宣布通過美光創(chuàng)投投入一億美元在人工智能及機器學習新創(chuàng)公司,當時消息顯示,投資新創(chuàng)不僅有助于加速人工智能的發(fā)展,還能間接帶動對于DRAM與NAND內存與3D Xpoint等次世代內存的需求。
或許是投資已經沒辦法滿足需求,又或許是美光進一步認識到了存內計算的重要性,到了2019年,美光科技直接收購了人工智能硬件和軟件初創(chuàng)公司Fwdnxt,這在當時的行業(yè)內掀起了不小的波瀾。美光認為,Fwdnxt的技術與美光的存儲芯片結合使用時,能夠使美光具備探索數據分析所需的深度學習AI解決方案的能力,尤其是物聯網和邊緣計算。
美光方面還表示,收購Fwdnxt不僅不會與英特爾、英偉達等有更多的競爭,相反反而會有更多的合作。在美光看來,沒有人可以在數據中心領域與他們競爭,存儲廠商想要分得一杯羹,為英特爾等提供更多幫助,那么在邊緣計算方面進行研究,將會是美光獲得最大效率和規(guī)模經濟的地方。
數據中心是互聯網、云計算和人工智能等領域的通用支撐技術,中國信通院《數據中心白皮書2022》報告顯示,2021年全球數據中心市場規(guī)模超過679億美元,預計2022年市場收入將達到746億美元。而存儲和AI都是數據中心不可缺少的重要部分,一方面任何數據中心的數據最終都要放置到存儲設備上。另一方面,AI能夠幫助數據中心提高能源效率,進而節(jié)省成本,還能幫助優(yōu)化運維,使用預測分析來幫助數據中心分配工作負載。那么,當數據中心的“左膀右臂”結合在一起,勢必會帶來奇效,這或許也是美光收購Fwdnxt的一部分考量。
而在2019年,SK海力士也加入了這場AI投資戰(zhàn),甚至攻勢十分兇猛。2019年年初,SK海力士投資了地平線;2020年9月,宣布投資Gauss Labs公司,旨在通過工業(yè)人工智能(AI)解決方案引領半導體制造業(yè)創(chuàng)新;2022年1月,SK 海力士又同SK Telecom 以及 SK Square一起宣布,成立聯合發(fā)展協會,首先將砸 800 億韓元,在美國設立 AI 半導體公司 SAPEON,SK 海力士持有25%的股份,這對于SK 海力士來說,在 NAND 閃存以及AI領域的事業(yè)也會更進一步擴張。
“鈔能力”下的技術成果
從投資方面來看,存儲大廠對AI可謂是下足了“血本”,重金之下,廠商們的成果也是斐然,接連展示新技術。
三星電子在2021年2月率先研發(fā)出結合內存芯片和AI處理器的高帶寬內存 HBM-PIM(也被稱為 Aquabolt-XL),以強化數據中心、高性能計算(HPC)系統和支持 AI 的移動應用程序中的大規(guī)模處理。據了解,HBM-PIM 通過將經過DRAM優(yōu)化的 AI 引擎置于每個存儲子單元內,將處理能力直接引入到數據存儲位置,從而實現并行處理并盡可能減少數據移動。數據顯示,當應用于三星現有的 HBM2 Aquabolt 解決方案時,新架構能夠提供超過兩倍的系統性能,能源消耗也大幅降低。
三星電子DRAM產品和技術高級副總裁Nam Sung Kim表示,隨著技術標準化發(fā)展,該技術應用將會進一步擴大,擴展至用于下一代超級計算機和AI應用的HBM3,甚至用于設備上AI的移動存儲器,以及用于數據中心的存儲器模塊。最新消息顯示,三星已經完成了運行其最新內存解決方案內存中高帶寬內存處理 (HBM-PIM) 所需的軟件標準化,計劃在本月推出該解決方案。
SK海力士則在今年2月宣布,將與人工智能芯片公司 SAPEON合作,推出一款將 GDDR6-AiM 與 AI 芯片相結合的新產品。SAPEON即上述提到的SK海力士與SK Telecom 以及 SK Square在美國成立的AI芯片公司。GDDR6-AiM則是SK海力士在今年2月宣布的采用下一代存儲芯片PIM技術開發(fā)出的樣品,為 GDDR6內存芯片增加了計算功能,以 16Gbps 的速度處理數據。SK海力士聲稱,GDDR6-AiM 與 CPU 和 GPU 的組合,不是典型的 DRAM 芯片,可以將計算速度提高 16 倍,適用于機器學習、高性能計算和大數據計算與存儲。
美光則是在收購FWDNX之后,推出一組用于深度學習應用的、功能強大的新型高性能硬件和軟件工具,該綜合性人工智能開發(fā)平臺集成了計算、內存、工具和軟件,可為探索針對人工智能工作負載優(yōu)化的創(chuàng)新內存提供重要基石。FWDNXT是一種架構,專為打造快速上市時間的邊緣AI解決方案而設計,通過非常易于使用的軟件架構搭配廣泛的模型支持與運用靈活度。據悉,美光深度學習加速器(DLA)技術支持廣泛的機器學習框架和神經網絡,能夠通過易于使用的接口快速處理海量數據,在FWDNXT人工智能推理引擎的支持下,能讓內存和計算能夠更緊密地融合,從而實現更高的性能和更低的功耗。
此外,不同于上述三家存儲大廠,鎧俠則是發(fā)力SSD和AI技術的結合,專注于研發(fā)以內存為中心的AI技術。近日,鎧俠開發(fā)了一種基于Memory-Centric AI的圖像分類系統,Memory-Centric AI是一項利用大容量存儲器的人工智能技術,該系統使用神經網絡對圖像進行分類,未來鎧俠會將Memory-Centric AI從圖像分類擴展到其他領域,并促進采用大容量存儲的人工智能技術的研究和開發(fā)。
鎧俠方面指出,傳統AI技術是使用大量數據來訓練模型,而以內存為中心的AI則是基于其積累的知識,通過搜索和參考這些知識來執(zhí)行任務,因此它積累的新知識和記憶越多,人工智能就越成熟,更重要的是,這項技術可以讓人工智能可以無限期地成長,同時也能減少所需的大量計算并減少功耗。
而這項技術的關鍵之處就是積累的數據存儲在哪里,這就是閃存的用武之地,能夠在幾乎不消耗電力的情況下存儲信息,但這也對閃存的速度提出了挑戰(zhàn),速度太慢會影響人工智能做出決定。隨著訪問速度的提高,硬件和人工智能技術也在不斷發(fā)展,鎧俠認為如今是提出以內存為中心的AI的恰當時候。
寫在最后
AI從概念被提出來開始就似乎是一個“萬金油”般的存在,5G需要AI、元宇宙需要AI、自動駕駛需要AI,甚至于連EDA都需要AI。如今,AI又已經“滲入”存儲芯片領域,各大存儲廠商為此展現出“十八般武藝”,但未來誰能成為拔得頭籌者,我們拭目以待。