消費電子設備將徹底擁抱AI。
6月13-14日,Arm在北京舉辦了2024技術媒體分享日,介紹了近期推出的面向消費電子設備的全新計算子系統(tǒng)——Arm終端計算子系統(tǒng)(CSS),該平臺囊括最新的Armv9.2 CPU集群、Arm Immortails、Arm Mail GPU,以及最新的CoreLink互聯(lián)系統(tǒng)IP和系統(tǒng)內(nèi)存管理單元 (SMMU),并首次在終端領域提供基于三納米工藝生產(chǎn)就緒的CPU和GPU物理實現(xiàn)。
作為移動處理器市場最主流的架構,Arm的每一次更新都會引領整個移動市場的革新,此次推出終端CSS,又會帶來哪些改變?
Arm終端CSS:AI消費電子的最新解
我們先來看看Arm終端CSS涵蓋了些什么,首先是Armv9.2 CPU集群,Arm為我們帶來了新的Cortex-X925、Cortex-A725和更新的Cortex-A520 CPU核心,其中Cortex-X925是新一代的超高性能核心,主頻可達3.6GHz以上,單線程性能較上一代提高了36%,并且?guī)砹?6%的AI性能提升。
所謂的Armv9.2是Arm在2021年推出的最新一代Armv9架構的最新版本,Armv9架構本身就是專為性能和AI而設計。在過去幾年的架構演進中,Arm為其增添了矢量加速、機器學習 (ML) 等領域的計算能力,同時增強了系統(tǒng)的安全性和穩(wěn)健性,而采用Armv9.2 CPU集群的Arm終端CSS的表現(xiàn)更是令人期待!
眾所周知,AI已經(jīng)成為目前的核心需求之一,在關鍵的AI推理性能上,Cortex-X925的提升達到59%,在采用雙顆Cortex-X925核心設計的情況下,終端CSS的CPU集群在推理性能上最高可以得到170%的性能提升。
而作為效率核心的Cortex-A725表現(xiàn)突出,與上一代對比在性能效率上也提升了35%,能效提升25%,借助更好的預取器和更大的L2緩存,L3流量減少了20%,使其能夠為中高端設備提供高效能比的AI運算支持。
得益于顯著的AI性能提升,Arm終端CSS能夠為新一代消費電子設備提供足夠的AI算力支持,使得合作伙伴可以在更多的消費電子產(chǎn)品上實現(xiàn)AI功能的部署與應用。
相較于以往的解決方案,Arm終端 CSS 專為高端終端設備細分市場設計,在性能、效率和可擴展性方面帶來了突破性變化。
以最新的Armv9.2 CPU集群為例,可以提供從旗艦Cortex-X925到高效的Cortex-A725,以及更新的Cortex-A520,合作伙伴可根據(jù)自己的需求進行選擇和配置。Arm的計算平臺賦予合作伙伴很強大的靈活性,比如去年11月份MediaTek發(fā)布的天璣9300就采用了全大核的 Armv9 CPU 集群,包括四個Cortex-X4(Cortex-X925前代)和四個Cortex-A720(Cortex-A725前代),而沒有使用“小核”Cortex-A520。
此次推出的GPU系列產(chǎn)品也具備很強的可拓展性,可為各類不同級別的設備帶來出色的游戲體驗。其中,Immortails-G925支持從10核到24核心的性能配置,使得Immortails-G925的適配范圍可以橫跨手機和PC多個領域,滿足不同層級的GPU性能需求。 性能上,Immortails-G925對比上一代提升達37%,在提供相同的游戲性能時,功耗較上一代降低了30%。這也意味著,在游戲體驗不變的情況下,采用Immortails-G925的芯片在整體能耗上會明顯低于上一代,在手機等小型移動設備上使用時可以顯著提升游戲續(xù)航時間。
Immortails-G925帶給我們的驚喜除了性能和能效上的提升之外,還引入了新的“片段預處理”機制。利用這項新的技術,應用無需進行任何對象或原語排序。片段預處理還可以更高效地減少過度繪制,進而提高性能和能效,同時減少應用的 CPU 負載。在Arm內(nèi)部工作負載中,觀察到渲染線程周期縮短了高達 43%。
此外,Immortails-G925針對光線追蹤功能也做了顯著的升級,對復雜對象的光線追蹤性能提高了52%,并且降低了57%的內(nèi)存流量,進而能夠大幅降低功耗,并使其可以應用到各種場景中。
而Arm Mail系列則新推出了兩款GPU,分別是Mail-G725和Mail-G625,分別針對中高端手機和入門級移動設備,Mail-G725支持在6-9個核心之間擴展,而Mail-G625則支持在1-5個核心之間擴展,為移動設備的處理器設計提供了更多的選擇。
實際上,如今越來越多設備都需要在運行中使用到高性能的GPU核心,但是GPU核心的高能耗也困擾著部分小型、入門級設備,Arm通過提供更靈活的GPU選擇,使得入門級設備也能享受到新一代GPU核心的高能效性能。
賦能AI,共創(chuàng)Arm智能生態(tài)
Arm無疑是目前移動市場中最主流、廣泛的芯片架構,想要在移動端市場普及AI,Arm架構的解決方案可以說是最好的選擇。在此次分享會中Arm的多位演講者也屢屢提到AI,除了在硬件層面為AI提供算力支持外,Arm更是在一直著力于打造更開放、全面、易用的開發(fā)環(huán)境。
為了支持開發(fā)者充分利用最新硬件的性能,Arm推出了全新的Kleidi軟件,包含KleidiAI和KleidiCV庫,專為優(yōu)化端側AI和計算機視覺工作負載設計,通過這些工具,開發(fā)者可以更輕松地進行高效能軟件開發(fā),加速產(chǎn)品的上市進程。
其中KleidiAI是一套面向AI框架開發(fā)者的計算內(nèi)核,使他們能夠在各種設備上輕松獲得 Arm CPU 上的最佳性能,并支持Neon、SVE2和SME2 等關鍵Arm架構功能。KleidiAI與PyTorch、Tensorflow、MediaPipe等熱門 AI 框架集成,旨在加速 Meta Llama 3、Phi-3等關鍵模型的性能,并且還可前后兼容,以確保 Arm 在引入更多技術時依然能適用未來市場的需求。
而對于需要用到計算機視覺解決方案的開發(fā)者來說,KleidiCV的引入能帶來巨大的性能提升。計算機視覺現(xiàn)在與 AI 緊密相連,但這些攝像頭管線可不僅僅運行神經(jīng)網(wǎng)絡,還有很多傳統(tǒng)的計算機視覺算法,其性能對于攝像頭或社交媒體應用的順暢運行至關重要。
這正是Arm構建KleidiCV的原因。今年,Arm還與OpenCV.ai 合作,力求讓安卓開發(fā)者可以更輕松地將OpenCV納入到他們的項目中,并從KleidiCV帶來的改進中受益。
KleidiAI和KleidiCV的結合,使得Arm生態(tài)的開發(fā)者在智能終端上輕松部署AI應用與功能,為AI生態(tài)的搭建提供有力支持。
今年,Arm在性能分析工具領域也有一些新的變化。首先大家熟悉的Arm Mobile Studio正式更名為Arm Performance Studio,其針對移動平臺的功能沒有任何變化,但現(xiàn)在通過增加對Arm Linux 的支持,基礎設施市場中的開發(fā)者可以使用 Streamline CPU分析能力。
與此同時,適用于安卓系統(tǒng)的 CSS 參考軟件棧搭配固定虛擬平臺 (Fixed Virtual Platform, FVP),可助力合作伙伴加速流片前的軟件開發(fā)。
此外,Arm與多個行業(yè)領導者合作,推出了一系列開發(fā)者支持計劃和社區(qū)資源。這些計劃包括在線培訓課程、開發(fā)者論壇和技術支持服務,旨在幫助開發(fā)者更好地理解和使用Arm的技術。授人以魚不如授人以漁,Arm顯然也深刻地明白這個道理,而且一個健康可持續(xù)的軟件生態(tài)也需要更多的建設者。
在Arm提供的這些資源幫助下,開發(fā)者不僅可以提高自己的技能,還可以與全球的開發(fā)者交流經(jīng)驗和分享創(chuàng)意。同時,Arm還通過與硬件制造商和軟件開發(fā)公司合作,不斷優(yōu)化其工具和平臺。
比如,Arm與知名的IDEs(集成開發(fā)環(huán)境)如Visual Studio Code和Eclipse進行了深度集成,使得開發(fā)者能夠在熟悉的環(huán)境中進行高效地開發(fā)工作。通過這種深度合作,Arm確保其開發(fā)工具能夠無縫融入開發(fā)者的日常工作流程,提高生產(chǎn)力和開發(fā)質(zhì)量。
從電腦到手機,從智能冰箱到智能手表,Arm的解決方案無處不在,豐富的生態(tài)產(chǎn)品使得Arm可以為開發(fā)者提供充足的開發(fā)空間,并且支持開發(fā)者探索不同的領域。
ALL FOR AI
毫無疑問,AI的需求使得智能終端生態(tài)在過去的一年里迎來了新的爆發(fā)式增長,人們正在不停地嘗試、開拓新的應用范例、探索新的硬件形態(tài),尋找著能夠為消費者帶來更好體驗的產(chǎn)品,不管是軟件還是硬件的。
而Arm終端CSS及Kleidi軟件,將會是開發(fā)者探索新世界的最佳方式之一,得益于全新的半導體工藝與芯片架構,我們?nèi)缃褚呀?jīng)能夠在小巧的手機上,獲得不亞于PC的算力與性能支持。Arm終端CSS所帶來的Armv9.2的能效優(yōu)勢,憑借物理實現(xiàn)和持續(xù)的軟件優(yōu)化,它將徹底革新開發(fā)者和消費者的體驗。
隨著未來的AI生態(tài)繼續(xù)發(fā)展,我們無疑將會看到更多基于Arm解決方案打造的新一代智能終端產(chǎn)品,而AI生態(tài)的需求也將繼續(xù)驅(qū)動Arm開發(fā)更高性能、更具效率的新產(chǎn)品。
未來,Arm將繼續(xù)以其先進的技術、豐富的軟硬件和強大的生態(tài)系統(tǒng)支持,不斷賦能開發(fā)者,推動計算技術向前發(fā)展。無論是在高性能計算、人工智能還是計算機視覺領域,Arm都展示了其作為行業(yè)領導者的實力,通過持續(xù)創(chuàng)新和深耕開發(fā)者生態(tài)系統(tǒng),Arm正引領著未來計算的方向,為行業(yè)注入新的活力。