昆侖芯2的性能、通用性、易用性較1代產(chǎn)品均有顯著增強(qiáng)。該芯片采用全球領(lǐng)先的7nm制程,搭載自研的第二代XPU架構(gòu),相比1代性能提升2-3倍。整數(shù)精度(INT8)算力達(dá)到256 TeraOPS,半精度(FP16)為128 TeraFLOPS,而最大功耗僅為120W。
硬件設(shè)計(jì)上,該芯片是國(guó)內(nèi)首款采用顯存的通用AI芯片,對(duì)于推動(dòng)國(guó)內(nèi)AI芯片技術(shù)研發(fā)和商業(yè)落地都具有重要價(jià)值。此外,昆侖芯2還高度集成了ARM CPU算力,并支持高速互聯(lián)、安全和虛擬化。軟件架構(gòu)上,昆侖芯2大幅迭代了編譯引擎和開(kāi)發(fā)套件,支持C和C++編程,可編程性國(guó)內(nèi)領(lǐng)先、對(duì)標(biāo)全球業(yè)界最先進(jìn)水平。
場(chǎng)景上,昆侖芯2領(lǐng)先的設(shè)計(jì)使產(chǎn)品可以適用云、端、邊等多場(chǎng)景,可應(yīng)用于互聯(lián)網(wǎng)核心算法、智慧城市、智慧工業(yè)等領(lǐng)域,并還將賦能高性能計(jì)算機(jī)集群、生物計(jì)算、智能交通、無(wú)人駕駛等更廣泛空間。
值得關(guān)注的是,昆侖芯AI芯片除了擁有自研XPU架構(gòu)及多項(xiàng)自主設(shè)計(jì),也已與飛騰等多款國(guó)產(chǎn)通用處理器、麒麟等多款國(guó)產(chǎn)操作系統(tǒng)以及百度自研的飛槳深度學(xué)習(xí)框架完成了端到端的適配,擁有軟硬一體的全棧國(guó)產(chǎn)AI能力。
當(dāng)前,AI已經(jīng)成為了新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量,而AI芯片作為推動(dòng)AI發(fā)展的核心生產(chǎn)力,其價(jià)值毋庸置疑。十四五規(guī)劃中就明確提出“要聚焦高端芯片領(lǐng)域”。但芯片研發(fā)的復(fù)雜程度注定了這是一場(chǎng)時(shí)間與耐力的比拼,百度昆侖芯起步早、進(jìn)展快,已經(jīng)成為了AI芯片行業(yè)的領(lǐng)軍玩家。
百度在2011年就已經(jīng)開(kāi)始布局AI芯片領(lǐng)域。2018年,百度自研的中國(guó)第一款云端全功能AI芯片——“百度昆侖1”問(wèn)世。截至目前,這款芯片已在百度搜索引擎、小度等業(yè)務(wù)中部署超過(guò)2萬(wàn)片,服務(wù)50多家外部客戶,是國(guó)內(nèi)唯一一款支撐了互聯(lián)網(wǎng)大規(guī)模核心推薦算法的AI芯片,在最嚴(yán)苛的考驗(yàn)中驗(yàn)證了技術(shù)實(shí)力。昆侖芯2則更進(jìn)一步,將國(guó)內(nèi)AI芯片研發(fā)的技術(shù)和商業(yè)化推向了更高的水平。
昆侖芯AI芯片技術(shù)和業(yè)務(wù)進(jìn)展迅速,既得益于百度AI技術(shù)的全棧、深厚布局,更受益于百度全面、繁榮的AI應(yīng)用場(chǎng)景。昆侖芯AI芯片作為百度大腦的“算力引擎”,實(shí)現(xiàn)了對(duì)語(yǔ)音、視覺(jué)、自然語(yǔ)言處理、智能推薦等全類別算法的支持,并與百度自研的飛槳深度學(xué)習(xí)框架天然適配。更重要的是,百度作為AI平臺(tái)型公司,擁有數(shù)億用戶規(guī)模的“國(guó)民級(jí)”產(chǎn)品百度搜索等,以及服務(wù)千行百業(yè)的百度智能云,這為百度昆侖芯的發(fā)展提供了業(yè)界少有的頂尖場(chǎng)景歷練機(jī)會(huì)和優(yōu)勢(shì)。
與此同時(shí),百度昆侖AI芯片的快速發(fā)展也使百度大腦的軟硬一體化能力愈加完備,為百度在AI領(lǐng)域加速技術(shù)創(chuàng)新、加快應(yīng)用落地提供了更加強(qiáng)大的算力支撐。
“芯片是需要花很長(zhǎng)時(shí)間,不怕孤獨(dú)、不怕寂寞,埋下身去,認(rèn)認(rèn)真真的做,才能做出來(lái)的技術(shù)和成果?!崩顝┖瓯硎尽?/p>