日前,飛騰已經完成FT-2000plus服務器CPU的研制工作,飛騰公司的合作伙伴正在積極研發(fā)相應的整機產品。FT-2000plus這款芯片是以FT2000為基礎的改進版本,雖然在單核性能上和Intel還存在一定差距,但在多核性能上,已經達到Intel服務器CPUE5主流產品的水平。
據(jù)傳,國防科大正在研發(fā)的1000P超算天河3號(性能指標是神威太湖之光的8倍),其原型機的CPU或將采用FT-2000或其后繼產品作為主控CPU??紤]到在天河2A上,國防科大已經用自主研發(fā)的加速器矩陣2000取代Intel的XeonPhi計算卡。從今往后,天河系列超算也將和神威系列超算一樣,徹底告別國外CPU或加速器,實現(xiàn)芯片的全國產化。
FT-2000系列芯片是厚積薄發(fā)的結果
近年來,國內某些企業(yè)熱衷于“走捷徑”,先后與Intel、IBM、ARM、高通等國外芯片巨頭技術合作或合資,有的公司把國外的CPUIP授權買回來做集成,就宣傳是自主知識產權,甚至還有公司將國外的芯片包裝一下變成國產芯片。
雖然這種走捷徑的做法可以在短時間內拿出性能不錯的芯片,但由于國外公司始終懷有“教會徒弟、餓死師傅”心理,不會將最先進的技術授權給中國,而且國內單位在拿到國外技術授權后,容易陷入知其然,不知其所以然的困境,不具備技術發(fā)展的可持續(xù)性,在國外公司開發(fā)出下一代產品之后,只能再次引進國外技術。
相比之下,飛騰選擇了較為困難的自主研發(fā)道路,雖然發(fā)展會慢一些,但更具后勁。早在十多年前,飛騰就基于IA-64指令集設計CPU,之后又以Sparc開源代碼為基礎設計了FT-1000和FT-1500兩款CPU,F(xiàn)T-1000被用于天河1號超算,F(xiàn)T-1500被用于天河2號超算。在2012年前后,飛騰選擇了ARM陣營,獲得了ARM指令集授權,可以基于ARM64指令集設計自己的CPU。并在數(shù)年時間里先后開發(fā)出了FTC660、FTC661兩款CPU核,以及FT-1500A/4、FT-1500A/16、FT-2000、FT-2000plus等CPU。
FT-1500A/4被用于PC和筆記本,采用28nm制造工藝。集成了4個FTC660CPU核,主頻1.5GHz—2.0GHz,集成了2MB二級cache和8MB三級cache,集成了2個DDR3-1600存儲控制器,可提供25.6GB/s訪存帶寬,最大功耗為15W。
FT-1500A/16被用于服務器,采用28nm制造工藝。集成了16個FTC660CPU核,主頻1.5GHz,集成了8MB二級cache和8MB三級cache,集成了4個DDR3-1600存儲控制器,可提供51.2GB/s訪存帶寬,最大功耗為35W。
FT-2000采用28nm制造工藝,可被用于超算計算節(jié)點和高性能服務器。集成了64個FTC661處理器核。工作主頻1.5GHz—2.0GHz。集成了32MB二級cache,擴展支持128MB三級cache。支持16個DDR3-1600存儲控制器,可提供204.8GB/s訪存帶寬。
最新的FT-2000Plus采用了臺積電16nm制造工藝,主頻為2.0GHz—2.4GHz,集成了64個FTC661處理器核。為了提高集成度,拋棄了L3cache,將DDR4內存控制器集成到了片內。目前,飛騰系列CPU已經形成了一個家族,可滿足黨政軍多個領域的實際需求。
足以和Intel主流服務器抗衡CPU在國內ARM服務器CPU中處于領跑位置
根據(jù)實際測試FT-2000在2GHz主頻下,采用GCC4.8編譯器,SPEC2006的測試成績分別為SPECint_rate2006:570、SPECfp_rate2006:482,與IntelXeonE5-2695v3相當。
而最新的FT-2000Plus因為刪除了L3導致在SPEC測試中某些子項分數(shù)下降,把集成DDR4等改進帶來的提升抹平了,使FT-2000Plus在同主頻下與FT-2000的性能相差不大。那飛騰公司為何要這么做呢?原因應該是為了商業(yè)化,提高FT-2000plus的集成度可以方便主機廠,降低開發(fā)FT-2000plus整機產品的成本。不過,在使用了更好的臺積電16nm制造工藝之后主頻可以最高穩(wěn)定到2.4G,使FT-2000plus相對于FT-2000還是有不小的性能提升,能夠滿足高端服務器和超算主控CPU的性能要求。
近年來,不少廠家都開始著手開發(fā)ARM服務器CPU。在國內,華為和華芯通也在著手開發(fā)ARM服務器CPU。不過,就目前而言,飛騰的ARM服務器CPU在性能上處于絕對領先地位。
華芯通是中國大陸與高通成立的合資公司,從高通手中獲得了源碼并基于該源碼設計自己的CPU。不過,由于華芯通北京研發(fā)中心啟用時日尚短,正式商用產品問世尚需時日。
相比之下,華為研發(fā)ARM服務器CPU的時間要早得多,而且在北京和美國都有研發(fā)中心,已經有產品Hi1612問世。雖然在宣傳上,華為聲稱Hi1612是“自主研發(fā)”,“除存儲單元外均具有完整知識產品”,但其實上,這款服務器CPU采用臺積電16nm制造工藝,其內核是ARMCortexA57。
而且Hi1612的性能也比較一般,也許是因為華為缺乏服務器CPU設計經驗,這款服務器CPU的性能相對有限,以飛騰的FT2000作參照,華為的這款服務器CPU在制造工藝領先2代的情況下,以FT2000一半的功耗實現(xiàn)了不足FT2000一半的性能。
不過,據(jù)小道消息,華為的下一款ARM服務器正在研發(fā)中,而且位于龍芯公司斜對門的華為北京研發(fā)中心已經拿ARMCortexA72修改了至少2個版本(華為有錢,買了ARM的“大禮包”),加上位于美國的研發(fā)中心可以提供技術支持,在有ARMCortexA72為基礎的情況下,華為的下一款ARM服務器CPU的性能值得期待。
結語
誠然,F(xiàn)T-2000/FT-2000plus還是存在一些短板的,比如單線程性能偏弱。無論是FT2000,還是FT-2000plus,雖然在多線程性能上達到了Intel中高端服務器CPU的性能,但在單線程性能上,還是有不小的差距——即便主頻控制在2.5GHz,Intel的服務器CPU的SPECint_base2006的成績也在25以上,而FT2000的SPECint_base2006只有12.4(@2.0GHz),F(xiàn)T-2000plus預計也只有14+分(@2.4GHz)。
軟件生態(tài)也是一個問題,由于飛騰選擇了跟隨ARM生態(tài)的道路,使飛騰的商業(yè)化推廣很大程度上取決于ARM生態(tài)的完善情況。而在服務器生態(tài)上,ARM和X86相比差距較大,這也非常不利于FT-2000/FT-2000plus的商業(yè)化。
不過,萬事開頭難,迄今為止,湖南長城銀河公司、湘計海盾公司、航天706所已經推出了基于新一代飛騰微處理器的自主可控產品。
長城銀河公司就開發(fā)出了EF111系列計算服務器、智恒AF21B一體機、致翔NF15N筆記本電腦和世恒KF510系列桌面型臺式計算機等整機產品。其中,EF111系列計算服務器基于全新一代國產FT2000Plus處理器的高性能服務器,可應用于ERP、高性能數(shù)據(jù)庫、虛擬化和商業(yè)智能、大數(shù)據(jù)分析等領域。航天科工二院706所也推出天玥64核高端機架式服務器。
根據(jù)公開資料顯示,天河3號的原型機已經選定FT-2000系列芯片作為其計算節(jié)點上使用的CPU。這不僅對天河超算擺脫進口芯片掣肘是一個好消息,對于FT-2000來說,也是一個非常好的廣告。