所以從CPU與最終儲存器之間,必須建立數(shù)層的中介存儲器來轉換,CPU與幾個層次的髙速緩存(cache)SRAM整合在一起,然后外接速度較慢、但每位元價格稍便宜的DRAM,最后到速度差幾個數(shù)量級、但每位元價格最低廉的的SSD,這就是現(xiàn)存所謂的存儲器體制(memoryhierarchy)。
這樣層層的轉送變成現(xiàn)在運算最大的速度和能耗瓶頸,單從能耗來講,計算機從儲存器擷取所需要的數(shù)據層層上傳、運算完又層層回送儲存,這些傳遞所損耗的能量占整個過程的80%以上。至于速度更不用講了,運算CPU的速度與儲存器的速度有好幾個數(shù)量級的差距,雖然可以用中介存儲器的處理來減少怠速,但一個完整的運算/儲存周期大部分的時間是用在傳遞和儲存資料。
之所以有這樣的困境是因為幾乎所有的儲存器或存儲器都面臨這樣的兩難:要讀寫快的,就不容易穩(wěn)定儲存;要穩(wěn)定儲存的,讀寫速度就慢。這不僅是在過去半導體遭遇的困境,以后在新興存儲器、甚至量子位元我們還會再遭遇類似的問題。譬如超導體量子位元計算快,但量子位元退相干(decoherence)也快,容易產生錯誤。氮缺陷奈米鉆石(nitrogenvacancynanodiamond)量子位元很穩(wěn)定,甚至在室溫下也可以維持好一陣子,但讀寫卻是千難萬難。
目前半導體對于存儲器體制的處理方式是用不同材料、不同運作機制,提供不同特性的存儲器/儲存器,層層部署。最理想的狀況是在存儲器/儲存器中直接運算—兩者合而為一,就沒有傳送、讀寫等功耗和速度等的損失問題,這就是現(xiàn)在已經開始進入議題的in-memorycomputing,今年的IEDM會議就有以PCM做in-memorycomputing展示的論文。但是能做這樣工作的存儲器/儲存器要具備三個特性,一是轉換(switch)要快。再者,密度要高,因為現(xiàn)在CPU的gatecount很多。最后,要能永久儲存。但是目前同時具有這三個性質的存儲器/儲存器還不存在,所以這是長遠目標。
近期比較可能達到的是過去已開始談論的儲存級存儲器(StorageClassMemory;SCM),或者意涵稍有差異、現(xiàn)在另外叫PermanentMemory(PM)。要之,兩者都是整合了存儲器和儲存器的功能的單一器件,至少縮短了資料傳遞的流程?,F(xiàn)在跨出第一步的是PCM陣營,基本上PCM由于多層堆棧,密度可以加高,讀寫速度雖遠較NAND為髙,但仍不如DRAM,所以還是需要以微控制器來調節(jié),結構好像與現(xiàn)在的NANDSSD沒太大差別。但是由于終端儲存器與CPU運算的差距大幅縮小,量變有可能導致質變。譬如可匹配的平行處理核就可以大幅增加。
另一個可以與之競爭的對手是MRAM。目前沒有大廠生產制造,價格居髙不下。但是技術的進展已到寫入時間10ns,訪問時閑20ns,略優(yōu)于DRAM。而其耐久性近乎無窮大,只是單元細胞的尺寸(cellsize)還降不下來。但是MRAM是可以如NAND般往3D發(fā)展的,而PCM的堆棧到8層已達最大經濟效益,功耗比較大,耐久性也頗有不如。兩者的競爭,將是存儲器/儲存器演化的重要觀察指標。