手機芯片會戰(zhàn)AI大模型,Arm有何勝負手?

時間:2024-06-20

來源:維科網(wǎng)

導語:Arm無疑是目前移動市場中最主流、廣泛的芯片架構,想要在移動端市場普及AI,Arm架構的解決方案可以說是最好的選擇。

  消費電子設備將徹底擁抱AI。

       6月13-14日,Arm在北京舉辦了2024技術媒體分享日,介紹了近期推出的面向消費電子設備的全新計算子系統(tǒng)——Arm終端計算子系統(tǒng)(CSS),該平臺囊括最新的Armv9.2 CPU集群、Arm Immortails、Arm Mail GPU,以及最新的CoreLink互聯(lián)系統(tǒng)IP和系統(tǒng)內(nèi)存管理單元 (SMMU),并首次在終端領域提供基于三納米工藝生產(chǎn)就緒的CPU和GPU物理實現(xiàn)。

       作為移動處理器市場最主流的架構,Arm的每一次更新都會引領整個移動市場的革新,此次推出終端CSS,又會帶來哪些改變? 

       Arm終端CSS:AI消費電子的最新解 

       我們先來看看Arm終端CSS涵蓋了些什么,首先是Armv9.2 CPU集群,Arm為我們帶來了新的Cortex-X925、Cortex-A725和更新的Cortex-A520 CPU核心,其中Cortex-X925是新一代的超高性能核心,主頻可達3.6GHz以上,單線程性能較上一代提高了36%,并且?guī)砹?6%的AI性能提升。

       所謂的Armv9.2是Arm在2021年推出的最新一代Armv9架構的最新版本,Armv9架構本身就是專為性能和AI而設計。在過去幾年的架構演進中,Arm為其增添了矢量加速、機器學習 (ML) 等領域的計算能力,同時增強了系統(tǒng)的安全性和穩(wěn)健性,而采用Armv9.2 CPU集群的Arm終端CSS的表現(xiàn)更是令人期待! 

       眾所周知,AI已經(jīng)成為目前的核心需求之一,在關鍵的AI推理性能上,Cortex-X925的提升達到59%,在采用雙顆Cortex-X925核心設計的情況下,終端CSS的CPU集群在推理性能上最高可以得到170%的性能提升。 

       而作為效率核心的Cortex-A725表現(xiàn)突出,與上一代對比在性能效率上也提升了35%,能效提升25%,借助更好的預取器和更大的L2緩存,L3流量減少了20%,使其能夠為中高端設備提供高效能比的AI運算支持。 

       得益于顯著的AI性能提升,Arm終端CSS能夠為新一代消費電子設備提供足夠的AI算力支持,使得合作伙伴可以在更多的消費電子產(chǎn)品上實現(xiàn)AI功能的部署與應用。 

       相較于以往的解決方案,Arm終端 CSS 專為高端終端設備細分市場設計,在性能、效率和可擴展性方面帶來了突破性變化。 

       以最新的Armv9.2 CPU集群為例,可以提供從旗艦Cortex-X925到高效的Cortex-A725,以及更新的Cortex-A520,合作伙伴可根據(jù)自己的需求進行選擇和配置。Arm的計算平臺賦予合作伙伴很強大的靈活性,比如去年11月份MediaTek發(fā)布的天璣9300就采用了全大核的 Armv9 CPU 集群,包括四個Cortex-X4(Cortex-X925前代)和四個Cortex-A720(Cortex-A725前代),而沒有使用“小核”Cortex-A520。 

        此次推出的GPU系列產(chǎn)品也具備很強的可拓展性,可為各類不同級別的設備帶來出色的游戲體驗。其中,Immortails-G925支持從10核到24核心的性能配置,使得Immortails-G925的適配范圍可以橫跨手機和PC多個領域,滿足不同層級的GPU性能需求。 性能上,Immortails-G925對比上一代提升達37%,在提供相同的游戲性能時,功耗較上一代降低了30%。這也意味著,在游戲體驗不變的情況下,采用Immortails-G925的芯片在整體能耗上會明顯低于上一代,在手機等小型移動設備上使用時可以顯著提升游戲續(xù)航時間。 

       Immortails-G925帶給我們的驚喜除了性能和能效上的提升之外,還引入了新的“片段預處理”機制。利用這項新的技術,應用無需進行任何對象或原語排序。片段預處理還可以更高效地減少過度繪制,進而提高性能和能效,同時減少應用的 CPU 負載。在Arm內(nèi)部工作負載中,觀察到渲染線程周期縮短了高達 43%。

       此外,Immortails-G925針對光線追蹤功能也做了顯著的升級,對復雜對象的光線追蹤性能提高了52%,并且降低了57%的內(nèi)存流量,進而能夠大幅降低功耗,并使其可以應用到各種場景中。 

       而Arm Mail系列則新推出了兩款GPU,分別是Mail-G725和Mail-G625,分別針對中高端手機和入門級移動設備,Mail-G725支持在6-9個核心之間擴展,而Mail-G625則支持在1-5個核心之間擴展,為移動設備的處理器設計提供了更多的選擇。 

       實際上,如今越來越多設備都需要在運行中使用到高性能的GPU核心,但是GPU核心的高能耗也困擾著部分小型、入門級設備,Arm通過提供更靈活的GPU選擇,使得入門級設備也能享受到新一代GPU核心的高能效性能。

       賦能AI,共創(chuàng)Arm智能生態(tài) 

       Arm無疑是目前移動市場中最主流、廣泛的芯片架構,想要在移動端市場普及AI,Arm架構的解決方案可以說是最好的選擇。在此次分享會中Arm的多位演講者也屢屢提到AI,除了在硬件層面為AI提供算力支持外,Arm更是在一直著力于打造更開放、全面、易用的開發(fā)環(huán)境。 

       為了支持開發(fā)者充分利用最新硬件的性能,Arm推出了全新的Kleidi軟件,包含KleidiAI和KleidiCV庫,專為優(yōu)化端側AI和計算機視覺工作負載設計,通過這些工具,開發(fā)者可以更輕松地進行高效能軟件開發(fā),加速產(chǎn)品的上市進程。

       其中KleidiAI是一套面向AI框架開發(fā)者的計算內(nèi)核,使他們能夠在各種設備上輕松獲得 Arm CPU 上的最佳性能,并支持Neon、SVE2和SME2 等關鍵Arm架構功能。KleidiAI與PyTorch、Tensorflow、MediaPipe等熱門 AI 框架集成,旨在加速 Meta Llama 3、Phi-3等關鍵模型的性能,并且還可前后兼容,以確保 Arm 在引入更多技術時依然能適用未來市場的需求。 

       而對于需要用到計算機視覺解決方案的開發(fā)者來說,KleidiCV的引入能帶來巨大的性能提升。計算機視覺現(xiàn)在與 AI 緊密相連,但這些攝像頭管線可不僅僅運行神經(jīng)網(wǎng)絡,還有很多傳統(tǒng)的計算機視覺算法,其性能對于攝像頭或社交媒體應用的順暢運行至關重要。

       這正是Arm構建KleidiCV的原因。今年,Arm還與OpenCV.ai 合作,力求讓安卓開發(fā)者可以更輕松地將OpenCV納入到他們的項目中,并從KleidiCV帶來的改進中受益。 

       KleidiAI和KleidiCV的結合,使得Arm生態(tài)的開發(fā)者在智能終端上輕松部署AI應用與功能,為AI生態(tài)的搭建提供有力支持。 

       今年,Arm在性能分析工具領域也有一些新的變化。首先大家熟悉的Arm Mobile Studio正式更名為Arm Performance Studio,其針對移動平臺的功能沒有任何變化,但現(xiàn)在通過增加對Arm Linux 的支持,基礎設施市場中的開發(fā)者可以使用 Streamline CPU分析能力。 

       與此同時,適用于安卓系統(tǒng)的 CSS 參考軟件棧搭配固定虛擬平臺 (Fixed Virtual Platform, FVP),可助力合作伙伴加速流片前的軟件開發(fā)。 

       此外,Arm與多個行業(yè)領導者合作,推出了一系列開發(fā)者支持計劃和社區(qū)資源。這些計劃包括在線培訓課程、開發(fā)者論壇和技術支持服務,旨在幫助開發(fā)者更好地理解和使用Arm的技術。授人以魚不如授人以漁,Arm顯然也深刻地明白這個道理,而且一個健康可持續(xù)的軟件生態(tài)也需要更多的建設者。 

       在Arm提供的這些資源幫助下,開發(fā)者不僅可以提高自己的技能,還可以與全球的開發(fā)者交流經(jīng)驗和分享創(chuàng)意。同時,Arm還通過與硬件制造商和軟件開發(fā)公司合作,不斷優(yōu)化其工具和平臺。

       比如,Arm與知名的IDEs(集成開發(fā)環(huán)境)如Visual Studio Code和Eclipse進行了深度集成,使得開發(fā)者能夠在熟悉的環(huán)境中進行高效地開發(fā)工作。通過這種深度合作,Arm確保其開發(fā)工具能夠無縫融入開發(fā)者的日常工作流程,提高生產(chǎn)力和開發(fā)質(zhì)量。

       從電腦到手機,從智能冰箱到智能手表,Arm的解決方案無處不在,豐富的生態(tài)產(chǎn)品使得Arm可以為開發(fā)者提供充足的開發(fā)空間,并且支持開發(fā)者探索不同的領域。 

       ALL FOR AI 

       毫無疑問,AI的需求使得智能終端生態(tài)在過去的一年里迎來了新的爆發(fā)式增長,人們正在不停地嘗試、開拓新的應用范例、探索新的硬件形態(tài),尋找著能夠為消費者帶來更好體驗的產(chǎn)品,不管是軟件還是硬件的。 

       而Arm終端CSS及Kleidi軟件,將會是開發(fā)者探索新世界的最佳方式之一,得益于全新的半導體工藝與芯片架構,我們?nèi)缃褚呀?jīng)能夠在小巧的手機上,獲得不亞于PC的算力與性能支持。Arm終端CSS所帶來的Armv9.2的能效優(yōu)勢,憑借物理實現(xiàn)和持續(xù)的軟件優(yōu)化,它將徹底革新開發(fā)者和消費者的體驗。 

       隨著未來的AI生態(tài)繼續(xù)發(fā)展,我們無疑將會看到更多基于Arm解決方案打造的新一代智能終端產(chǎn)品,而AI生態(tài)的需求也將繼續(xù)驅(qū)動Arm開發(fā)更高性能、更具效率的新產(chǎn)品。 

      未來,Arm將繼續(xù)以其先進的技術、豐富的軟硬件和強大的生態(tài)系統(tǒng)支持,不斷賦能開發(fā)者,推動計算技術向前發(fā)展。無論是在高性能計算、人工智能還是計算機視覺領域,Arm都展示了其作為行業(yè)領導者的實力,通過持續(xù)創(chuàng)新和深耕開發(fā)者生態(tài)系統(tǒng),Arm正引領著未來計算的方向,為行業(yè)注入新的活力。


AI
中傳動網(wǎng)版權與免責聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(wǎng)(m.u63ivq3.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權屬于原版權人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內(nèi)容、版權等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅(qū)與傳動公眾號獲取更多資訊

關注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0