文|芯東西
編譯|張昀
芯東西3月28日消息,據(jù)EE Times ASIA 3月24日報(bào)道,ReRAM(可變電阻式存儲(chǔ)器)的特性使其在人工智能、存內(nèi)計(jì)算和旨在模仿人腦的應(yīng)用程序中具有顯著優(yōu)勢,成為下一代內(nèi)存的主要競爭者。
ReRAM是電阻式隨機(jī)存取存儲(chǔ)器,它可以將DRAM(動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)的讀寫速度與SSD(固態(tài)硬盤)的非易失性結(jié)合于一身,功耗更低、讀寫速度更快。ReRAM多用于神經(jīng)擬態(tài)計(jì)算(類腦計(jì)算),算力高、功耗低;但它還未完全成熟,也面臨著相變存儲(chǔ)器(PCM)和鐵電隨機(jī)存取存儲(chǔ)器(FRAM)等其他存儲(chǔ)器的競爭。
一、“潛力股”ReRAM:可提供高密度非易失性存儲(chǔ)和高效存內(nèi)計(jì)算
ReRAM多用于類腦計(jì)算,甚至成為了類腦計(jì)算的代名詞。密歇根大學(xué)教授Wei D.Lu稱,因?yàn)镽eRAM可以自己執(zhí)行學(xué)習(xí)和推理功能,所以ReRAM陣列應(yīng)用在存內(nèi)計(jì)算架構(gòu)時(shí)很有潛力。ReRAM還支持雙向數(shù)據(jù)流,而更大的神經(jīng)網(wǎng)絡(luò)使用具有平鋪MPU架構(gòu)的模塊化系統(tǒng)來提高吞吐量。
去年,電子領(lǐng)域頂會(huì)IEDM(國際電子器件大會(huì))匯集了有關(guān)推進(jìn)各種內(nèi)存類型的最新研究論文,很多人都致力于研究如何改進(jìn)存內(nèi)計(jì)算、人工智能、機(jī)器學(xué)習(xí)以及類腦計(jì)算。
美國密歇根大學(xué)至少十年前就已經(jīng)開始開發(fā)ReRAM原型了。該大學(xué)電氣工程和計(jì)算機(jī)科學(xué)系教授Wei D.Lu說道,ReRAM具有提供高密度非易失性存儲(chǔ)以及高效存內(nèi)計(jì)算的潛力,而且支持ReRAM的加速器能夠突破馮·諾伊曼計(jì)算架構(gòu)的瓶頸。教授Wei D.Lu在IEDM發(fā)言時(shí)概述了一些器件,講了通過并行計(jì)算來處理大的AI模型,還談到了邊緣計(jì)算應(yīng)用程序的功率、延遲和成本問題。ReRAM還能支持雙向數(shù)據(jù)流,有更好促進(jìn)存內(nèi)計(jì)算的潛力。
目前,具備并行計(jì)算能力的CPU在內(nèi)存方面仍會(huì)遇見問題。雖然GPU可以允許更快的內(nèi)存訪問,但教授Wei D.Lu稱,需要一種從根本上提高吞吐量和計(jì)算效率的新計(jì)算架構(gòu)。內(nèi)存保護(hù)單元(MPU)可以顯著提高并行性,還能將內(nèi)存與邏輯放在一起,從而實(shí)現(xiàn)設(shè)備級計(jì)算并更好地促進(jìn)存內(nèi)計(jì)算。
二、ReRAM仍面挑戰(zhàn),PCM也可改善存內(nèi)技術(shù)
教授Wei D.Lu稱ReRAM器件還未成熟,它還面臨三個(gè)關(guān)鍵挑戰(zhàn):一是基于高精度模數(shù)轉(zhuǎn)換器的讀出電路;二是器件的非理想性,包括受單元間變化的器件的影響;三是ReRAM設(shè)備中非線性的以及不對稱電導(dǎo)更新后會(huì)嚴(yán)重降低訓(xùn)練的準(zhǔn)確度。
三個(gè)挑戰(zhàn)有各自的解決方案。第一個(gè)挑戰(zhàn)的解決方案包括使用多范圍量化和二元神經(jīng)網(wǎng)絡(luò)。教授Wei D.Lu稱,解決第二個(gè)挑戰(zhàn)可以使用2T2R架構(gòu)實(shí)現(xiàn)二進(jìn)制權(quán)重或者采用有架構(gòu)意識的培訓(xùn),這也有助于應(yīng)對第三個(gè)挑戰(zhàn)?;旌暇扔?xùn)練可以通過較低精度格式訓(xùn)練大型神經(jīng)網(wǎng)絡(luò),來提升性能和計(jì)算,這也可以解決第二個(gè)和第三個(gè)挑戰(zhàn)。
除此之外,PCM也能改進(jìn)存內(nèi)計(jì)算。IBM歐洲研究室(研究中心)一直在探索使用PCM來解決模擬存內(nèi)計(jì)算的溫度敏感性問題。IBM Research存內(nèi)計(jì)算小組成員Irem Boybat說道,隨著人工智能神經(jīng)網(wǎng)絡(luò)的蓬勃發(fā)展,計(jì)算機(jī)的計(jì)算效率問題還有待解決。深度學(xué)習(xí)是計(jì)算密集型的,如果人工智能要可持續(xù)發(fā)展,就必須采用顛覆性的新計(jì)算機(jī)范式。
Boybat還說道,語言模型的規(guī)模呈指數(shù)級增長。根據(jù)他的說法,大量數(shù)據(jù)會(huì)從內(nèi)存?zhèn)鬏數(shù)教幚韱卧?,這種情況不僅會(huì)加大傳輸成本,而且會(huì)留下大量碳足跡。
模擬存內(nèi)計(jì)算通過在內(nèi)存執(zhí)行某些計(jì)算任務(wù)來模糊內(nèi)存和處理之間的界限,并通過內(nèi)存設(shè)備的物理屬性來實(shí)現(xiàn)。Boybat說道,PCM能夠以非常密集的方式存儲(chǔ)信息并且其消耗的靜態(tài)功率可以忽略不計(jì)。過去一年內(nèi),IBM Research公開了兩款基于PCM的存內(nèi)計(jì)算芯片,展示了基于PCM的存內(nèi)計(jì)算潛力。
IBM Research存內(nèi)計(jì)算小組還研究了“蘑菇型”結(jié)構(gòu)(mushroom-type)PCM的溫度敏感性。另外,根據(jù)放置在芯片下方的電阻加熱器及其溫度,預(yù)計(jì)芯片在30攝氏度到80攝氏度范圍內(nèi)不會(huì)出現(xiàn)滯留問題。
IBM Research的實(shí)驗(yàn)研究了溫度變化和漂移對用于存內(nèi)計(jì)算的多級PCM的影響。在IBM Research AI Hardware Center(IBM研究院AI硬件中心)的支持下,IBM Research的研究團(tuán)隊(duì)發(fā)現(xiàn),盡管PCM表現(xiàn)出與電導(dǎo)相關(guān)的溫度敏感性,但在電導(dǎo)狀態(tài)應(yīng)用的時(shí)間-溫度曲線中,其歸一化分布保持相對恒定。該研究團(tuán)隊(duì)還開發(fā)了一個(gè)可靠的統(tǒng)計(jì)模型來探究溫度對漂移和電導(dǎo)的影響,并根據(jù)PCM電導(dǎo)測量對其進(jìn)行驗(yàn)證。
該研究團(tuán)隊(duì)使用超一百萬個(gè)PCM設(shè)備證明:在33攝氏度到80攝氏度的環(huán)境溫度變化下,用簡單的補(bǔ)償方案有可能實(shí)現(xiàn)并保持各種網(wǎng)絡(luò)的高推斷精度。
三、基于ReRAM的類腦計(jì)算:速度每三個(gè)月翻一番
人工智能計(jì)算的使用增加使得受大腦啟發(fā)的硬件對于人工智能的發(fā)展至關(guān)重要。以Liu Ming為代表的中科院微電子研究所和復(fù)旦大學(xué)的研究人員們介紹稱,人工智能計(jì)算使用速度推動(dòng)了基于ReRAM的類腦計(jì)算(BIC)工作。實(shí)現(xiàn)類腦計(jì)算的方式包括存內(nèi)計(jì)算和神經(jīng)擬態(tài)計(jì)算。
Liu Ming說道,基于ReRAM的類腦計(jì)算速度每三個(gè)月就可以翻一番。新的存內(nèi)技術(shù)可以在短期內(nèi)增強(qiáng)現(xiàn)有的層次結(jié)構(gòu),但是類腦計(jì)算能在中長期突破馮·諾伊曼計(jì)算架構(gòu)瓶頸。
類腦計(jì)算模型包括人工神經(jīng)網(wǎng)絡(luò)(ANN)和脈沖神經(jīng)網(wǎng)絡(luò)(SNN)等不同的神經(jīng)網(wǎng)絡(luò)模型。其中,ANN能夠處理空間域中的連續(xù)信號;SNN模仿了大腦的工作方式,更具生物可能性。Liu Ming稱,ReRAM具有豐富的開關(guān)動(dòng)態(tài),可以支持大規(guī)模集成、低功耗外圍設(shè)備和用于構(gòu)建類腦計(jì)算芯片和系統(tǒng)的特定應(yīng)用架構(gòu),為類腦計(jì)算提供了一個(gè)理想的平臺。
ReRAM SNN將事件驅(qū)動(dòng)表示并集成了多核結(jié)合的芯片,其計(jì)算密度高、能效高,能為高性能計(jì)算提供潛力,在低功耗下執(zhí)行的芯片將成為現(xiàn)實(shí)。Liu Ming說道,在許多其他機(jī)構(gòu)從模擬存內(nèi)計(jì)算開始進(jìn)行了十多年的研究之后,集成SNN多核將很快實(shí)現(xiàn)。然而,如果要開發(fā)適用于實(shí)際應(yīng)用的類腦計(jì)算芯片,研究人員在架構(gòu)層面仍有許多探索工作要做。
因此ReRAM在人工智能和類腦計(jì)算應(yīng)用方面有著很大的潛力,不過它還面臨著FRAM的競爭。IEDM同樣關(guān)注磁阻隨機(jī)存取存儲(chǔ)器,2021年的IEDM中,有一整天關(guān)于磁阻隨機(jī)存取存儲(chǔ)器的會(huì)議和兩個(gè)IEEE Magnetics Society(IEEE磁學(xué)會(huì))的活動(dòng)。
法國原子能委員會(huì)電子與信息技術(shù)實(shí)驗(yàn)室CEA-Leti,演示了世界上第一個(gè)基于FRAM的130nm 16-kbit陣列,并期望其商業(yè)化。超低功耗、高速、高耐用性且與CMOS兼容的BEOL FRAM存儲(chǔ)器使用基于HfO2(二氧化鉿)的新型鐵電材料,該材料不含鉛,比PZT(鋯鈦酸鉛壓電陶瓷)更環(huán)保。
FRAM的例子包括嵌入式應(yīng)用程序,例如物聯(lián)網(wǎng)設(shè)備和可穿戴設(shè)備。這項(xiàng)工作得到了歐盟3eFERRO聯(lián)盟項(xiàng)目的支持,該項(xiàng)目旨在生產(chǎn)新的鐵電材料,使FRAM成為物聯(lián)網(wǎng)應(yīng)用中具有競爭力的非易失性存儲(chǔ)器候選者。
此外,盡管許多IEDM研究論文傾向于在人工智能、類腦計(jì)算和存內(nèi)計(jì)算等前沿應(yīng)用中使用新興存儲(chǔ)器,但推進(jìn)現(xiàn)有存儲(chǔ)器(如動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)仍然是許多研究人員的重點(diǎn)。
在IEDM上,英特爾發(fā)表了多篇論文,包括規(guī)模改進(jìn)和為芯片帶來新功能。英特爾圍繞混合鍵合互連的設(shè)計(jì)、工藝和組裝挑戰(zhàn),提出了將封裝互連密度提高10倍以上的目標(biāo)。2021年7月,英特爾宣布推出Foveros Direct,它支持10μm以下的凸塊間距,從而使3D堆疊的互連密度數(shù)量級提高。
IEDM的部分論文還探討了英特爾如何通過堆疊多個(gè)CMOS晶體管的方法來應(yīng)對預(yù)期的后FinFET時(shí)代,該方法旨在通過每平方毫米集成更多晶體管來實(shí)現(xiàn)30%到50%的邏輯擴(kuò)展改進(jìn),以繼續(xù)推進(jìn)摩爾定律。推進(jìn)摩爾定律的另一項(xiàng)努力包括研究利用僅有幾個(gè)原子厚的新型材料,來制造克服傳統(tǒng)硅通道限制的晶體管——使芯片單位面積增加數(shù)百萬個(gè)晶體管,從而推動(dòng)即將到來的“埃米時(shí)代”。
英特爾還概述了一項(xiàng)新研究:通過在300mm晶圓上集成基于GAN的電源開關(guān)與基于硅的CMOS,研究硅的新功能,這將實(shí)現(xiàn)CPU的低損耗、高速供電,同時(shí)減少主板組件和空間。這樣新的先進(jìn)封裝和制造工藝或許會(huì)幫助現(xiàn)有存儲(chǔ)器在人工智能等新興應(yīng)用上,釋放新的發(fā)展?jié)摿Α?/p>
結(jié)語:ReRAM仍面臨競爭
ReRAM作為當(dāng)前類腦計(jì)算的主要載體,它在高密度非易失性存儲(chǔ)以及存內(nèi)計(jì)算方面都有很大優(yōu)勢?;赗eRAM的類腦計(jì)算還能在中長期突破馮·諾伊曼計(jì)算架構(gòu)瓶頸,它支持多種不同的AI算法,具有算力高、功耗低的特點(diǎn)。
但同時(shí),ReRAM并不完全成熟,它仍有器件非理想性、基于高精度模數(shù)轉(zhuǎn)換器的讀出電路等構(gòu)成的問題;它還面臨著PCM、FRAM的競爭。
來源:EE Times ASIA