國內(nèi)首款存算一體大算力芯片,瞄準(zhǔn)智能駕駛!

時間:2023-05-22

來源:半導(dǎo)體行業(yè)觀察

導(dǎo)語:用存算一體創(chuàng)新架構(gòu),重構(gòu)智能駕駛芯片。后摩智能是國產(chǎn)AI大算力智駕芯片領(lǐng)域跑出的一匹黑馬。

  用存算一體創(chuàng)新架構(gòu),重構(gòu)智能駕駛芯片。后摩智能是國產(chǎn)AI大算力智駕芯片領(lǐng)域跑出的一匹黑馬。

  ChatGPT等人工智能應(yīng)用的爆火再次引發(fā)了行業(yè)對大算力的需求。未來的計算系統(tǒng)相比現(xiàn)在的芯片,至少需要有1000倍甚至更高的效率提升才能滿足無處不在的萬物智能。AI芯片是AI算力的“心臟”,而高性能的AI芯片需要先進(jìn)的制程技術(shù)來實現(xiàn)更小的晶體管、更高的集成度和更低的功耗。隨著摩爾定律在逼近極限,如果繼續(xù)依靠先進(jìn)工藝的底層技術(shù)創(chuàng)新,沿這個方向走下去,能否達(dá)到未來所需的算力提升?不好說。但無論如何,行業(yè)正在為之努力。

  與此同時,行業(yè)內(nèi)也有人在另辟蹊徑,利用底層架構(gòu)創(chuàng)新來實現(xiàn)算力的提升。近幾年來,存算一體在作為一項有望突破算力瓶頸的先進(jìn)技術(shù),正在被國內(nèi)外越來越多企業(yè)選擇。存算一體這種創(chuàng)新的架構(gòu),通過將部分或全部的計算移到存儲中,把計算單元和存儲單元集成在同一個芯片,在存儲單元內(nèi)完成運算,減少數(shù)據(jù)來回搬運造成的數(shù)據(jù)傳輸延遲、損耗等問題,以此來突破芯片性能瓶頸及提升能效比。

  而在存算一體大算力這一領(lǐng)域,國內(nèi)芯片企業(yè)走在了前列。

  從0到1,國內(nèi)首款存算一體大算力芯片正式量產(chǎn)

  2023年5月10日,后摩智能正式發(fā)布首款存算一體智駕芯片——鴻途H30。僅用12nm工藝制程,該芯片的物理算力實現(xiàn)了高達(dá)256TOPS,在Int8全精度的計算提供下,計算延時只有1.5ns,能效比為30-150 TOPS/W,比業(yè)界同等精度計算條件下的水平提高了3倍以上。250TOPS可以說是目前國內(nèi)效率最高的大算力智能駕駛芯片!35W的典型功耗也令人震驚。這就是存算一體架構(gòu)技術(shù)的魅力。

  除了大算力和低功耗之外,它還具有全精度、車規(guī)級、可量產(chǎn)、通用性的特性。而透過這些突破性技術(shù)表現(xiàn),我們也嗅到了后摩智能濃濃的技術(shù)創(chuàng)新實力。

  首先是存算一體電路結(jié)構(gòu)的設(shè)計,后摩智能采用的是基于SRAM存儲介質(zhì)的存算一體架構(gòu),將定制化的乘加電路和傳統(tǒng)的SRAM Bit Cell電路完全融合在一起。下圖中右圖是存算一體電路的架構(gòu)圖,淺色部分是傳統(tǒng)的SRAM電路,深色部分是一些定制化的電路結(jié)構(gòu),包括乘法器、加法數(shù)、累加器等,做到數(shù)據(jù)讀取出來之后馬上可以在原地參與計算。

  其次,H30芯片采用的是后摩智能自研的AI處理器架構(gòu)—IPU(Intelligence Processing Unit)。目前該IPU架構(gòu)規(guī)劃有三代:第一代是天樞架構(gòu),面向智能駕駛;第二代是天璇架構(gòu),它可以應(yīng)用于更多的場景;第三代是天璣架構(gòu),將面向通用人工智能。H30芯片采用的是第一代天樞架構(gòu)IPU。

  解決了存和算的問題,在數(shù)據(jù)的傳輸方面:1)后摩智能專門設(shè)計了專用的數(shù)據(jù)傳輸總線,它能把各個Tile和各個IPU核連接起來,在它們之間建立高速的、直接的數(shù)據(jù)傳輸通道。2)在AI計算里,數(shù)據(jù)復(fù)用是一個非常重要的特性,因此,后摩智能為此設(shè)計了獨特的多波機(jī)制,避免了數(shù)據(jù)重復(fù)的讀取和傳輸。

  通過存算電路底層技術(shù)的創(chuàng)新加上AI處理器架構(gòu)的創(chuàng)新,再加上出色的工程實現(xiàn)能力,最終鴻途H30實現(xiàn)了多項芯片性能指標(biāo)的突破。與某國際巨頭芯片對比,在工藝落后一代的情況下,進(jìn)行完全相同的測試,H30芯片的功耗減少了50%以上,性能卻有2倍以上的提升。

  為了幫助客戶更好的落地,后摩智能同步推出了基于鴻途 H30芯片打造的智能駕駛硬件平臺——力馭(Sailing,寓意早日揚帆起航)。僅依靠一顆H30芯片,力馭平臺的CPU算力高達(dá)200 Kdmips,AI算力高 256Tops,足夠支撐智能駕駛所有的傳感器。而且力馭平臺的功耗僅為85W,可采用更加靈活的散熱方式,實現(xiàn)更低成本的便捷部署。

  基于鴻途H30芯片后摩智能自主研發(fā)了一款軟件開發(fā)工具鏈—后摩大道,支持 PyTorch、TensorFlow、ONNX等主流開源框架,編程兼容CUDA前端語法,同時支持SIMD和SIMT 兩種編程模型,兼顧運行效率和開發(fā)效率,進(jìn)一步實現(xiàn)了鴻途?H30 的高效、易用。

  目前后摩智能的鴻途H30芯片將于6月份開始給Alpha客戶送測。同時,后摩智能的第二代產(chǎn)品鴻途H50 已經(jīng)在全力研發(fā)中,將于2024年推出,支持客戶 2025年的量產(chǎn)車型。

  存算一體技術(shù)優(yōu)勢已然顯現(xiàn)

  當(dāng)下,在各國都在爭搶加速進(jìn)入人工智能時代的時間節(jié)點下,算力是AI技術(shù)角逐的源動力。然而持續(xù)緊張的地緣關(guān)系,國內(nèi)在先進(jìn)工藝采用方面的掣肘,使得國產(chǎn)算力的提速面對著多方面的難題,不僅是算力的需求,功耗也是行業(yè)所面臨的挑戰(zhàn)。此次后摩智能率先在存算一體大算力芯片上的突破,可以說用實際產(chǎn)品證明了存算一體技術(shù)的優(yōu)勢和潛力。

  計算效率高,工藝依賴度低:我們可以看到,后摩智能鴻途H30芯片,所采用的12nm的工藝并不是最先進(jìn)的,但卻能達(dá)到超過200TOPS的算力??v觀全球AI芯片的算力發(fā)展情況,基于傳統(tǒng)路徑的芯片在算力提升方面需要很大程度上依賴先進(jìn)工藝,行業(yè)內(nèi)達(dá)到200TOPS算力的AI芯片一般的工藝都要7nm甚至更先進(jìn)才行,如英偉達(dá)的Orin芯片和國內(nèi)的一些200TOPS左右算力的芯片等大多都是在7nm。更甚之,英偉達(dá)的Thor可以實現(xiàn)1000T以上的算力,但是工藝要采用4nm。

  與某國際巨頭的8nm智駕領(lǐng)域的某款旗艦芯片,以Resnet50網(wǎng)絡(luò)為例,后摩智能H30的性能在等于1的配置條件下,可以達(dá)到8700幀每秒;如果把它設(shè)成8,可以突破1萬幀,達(dá)到10300幀每秒的性能。整體來說后摩H30芯片的性能可以達(dá)到友商的2倍以上。

  低成本:因為對工藝的依賴性不高,所以可以實現(xiàn)低成本,更加普惠。后摩智能聯(lián)合創(chuàng)始人兼產(chǎn)品副總裁信曉旭在發(fā)布會上透露到:“H30芯片在成本上會非常非常有競爭力?!?/p>

  更低的能耗:由于數(shù)據(jù)傳輸?shù)母咝?,存算一體芯片在計算過程中需要消耗更少的能量,從而可以實現(xiàn)更低的功耗,也更符合可持續(xù)和低碳環(huán)保的理念。

  計算延時低:由于存儲和計算任務(wù)在同一芯片內(nèi)部完成,存算一體架構(gòu)芯片能夠更快地完成數(shù)據(jù)的讀寫和處理,從而提高數(shù)據(jù)處理的效率。例如,相比業(yè)界用5nm工藝的存算一體芯片,后摩智能的鴻途H30芯片在Int8全精度的計算提供下,計算延時只有1.5ns,降低了70%。

  支持大規(guī)模并行計算:存算一體架構(gòu)芯片能夠支持大規(guī)模并行計算,從而更好地滿足人工智能、邊緣計算、高性能計算等應(yīng)用的需求。

  我們也可以看到,后摩智能的鴻途H30存算一體大算力芯片落地的第一站是智能駕駛。單從市場應(yīng)用場景來看,存算一體架構(gòu)的芯片也顯現(xiàn)出多個優(yōu)勢:

  1:存算一體架構(gòu)芯片的高效數(shù)據(jù)傳輸和計算能力可以幫助實現(xiàn)高效的圖像處理;

  2:智能駕駛的安全性是行業(yè)密切關(guān)注的一大問題,而存算一體架構(gòu)的芯片可以將敏感數(shù)據(jù)存儲在同一芯片中,從而減少了數(shù)據(jù)傳輸?shù)娘L(fēng)險,提高了數(shù)據(jù)的安全性;

  3:智能駕駛需要支持多種算法和模型,包括神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等。存算一體芯片可以根據(jù)不同的算法和模型進(jìn)行靈活配置,從而實現(xiàn)更高效的計算和存儲。在這方面,鴻途H30芯片可以支持經(jīng)典的基礎(chǔ)網(wǎng)絡(luò)Resnet50,包括BEV網(wǎng)絡(luò)模型以及廣泛應(yīng)用于高階輔助駕駛領(lǐng)域的 Pointpillar網(wǎng)絡(luò)模型。

  后摩智能創(chuàng)始人吳強也表示,從技術(shù)和產(chǎn)品需求匹配的角度來看,存算一體帶來的技術(shù)和產(chǎn)品的優(yōu)勢,和智能駕駛的關(guān)鍵需求是天然吻合的。其原因主要有兩方面:一方面是算力功耗的需求;另一方面從終局的角度來看,智能駕駛的終局是要代替人,實現(xiàn)無人駕駛。所以智能駕駛芯片一定要無限接近人腦的效率。而存算一體技術(shù)正是一個比傳統(tǒng)架構(gòu)更接近人腦的計算形式,它也能夠達(dá)到比傳統(tǒng)架構(gòu)高許多的計算效率。

  從1到100,存算一體技術(shù)將走向更多應(yīng)用

  對于市場空間如此大的智能駕駛,如果后摩智能的鴻途H30芯片能夠真正走量并釋放出其優(yōu)勢。那么,這將不僅為國產(chǎn)智能駕駛領(lǐng)域的客戶們提供一個差異化的新選擇,也將為存算一體架構(gòu)的芯片的大規(guī)模發(fā)展奠定良好的基礎(chǔ)。許多機(jī)構(gòu)都預(yù)測2023年將是存算一體大規(guī)模商業(yè)落地的元年,伴隨著此次鴻途H30芯片的量產(chǎn)發(fā)布,存算一體技術(shù)的商業(yè)化元年也即將正式開啟。

  作為一項通用技術(shù),存算一體技術(shù)可以根據(jù)不同領(lǐng)域和應(yīng)用場景進(jìn)行優(yōu)化和應(yīng)用。智能駕駛只是存算一體技術(shù)應(yīng)用的冰山一角,存算一體還有很大的應(yīng)用可能性和商業(yè)價值的潛力深埋于底下。比如人形機(jī)器人,服務(wù)機(jī)器人,以及對算力和能效有更高要求的場景如ChatGPT、云端推理等等都將是存算一體技術(shù)能夠發(fā)揮所長的應(yīng)用。

  當(dāng)然,存算一體技術(shù)的更大商用化還需要產(chǎn)業(yè)界上下游的共同努力,讓存算一體技術(shù)的規(guī)?;瘧?yīng)用從1走向100。后摩智能聯(lián)合創(chuàng)始人兼研發(fā)副總裁陳亮在會上透露:“在不久的將來,我們會把我們的AI處理器硬件設(shè)計開源,大家可以去下載到我們的IPU設(shè)計資料,做PPA的評估和軟件算法的開發(fā),或者甚至將來用到自己的產(chǎn)品當(dāng)中去。我們希望有更多的人和組織能夠參與進(jìn)來,相信以大家的智慧可以更好的讓這個方向落地,大家可以共建生態(tài),最終讓整個產(chǎn)業(yè)鏈?zhǔn)芤??!?/p>

  寫在最后

  2020年11月成立,2022年5月驗證芯片成功點亮,2023年5月量產(chǎn)芯片面世,對于存算一體新架構(gòu)+大算力這樣一項顛覆性技術(shù)而言,這個速度彰顯了后摩智能的產(chǎn)品落地能力。通過不斷突破技術(shù)瓶頸和持續(xù)的研發(fā)投入,后摩智能成功地將存算一體的概念應(yīng)用于大算力AI芯片,并實現(xiàn)了高性能計算與低能耗的平衡。后摩智能的存算一體AI芯片取名鴻途,寓意是有鴻鵠之志,但是又腳踏實地,走向漫漫征途。

  憑借這一芯片的落地,后摩智能迅速成長為國產(chǎn)AI芯片行業(yè)的重要創(chuàng)新力量。而且在當(dāng)下大算力AI芯片發(fā)展遭遇瓶頸之際,作為國內(nèi)率先落地存算一體大算力AI芯片的公司,后摩智能用實打?qū)嵉漠a(chǎn)品,為我國發(fā)展高算力、低功耗和低成本的AI芯片注入新的發(fā)展動能。


中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(m.u63ivq3.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點贊 0
取消 0