文|芯東西
編譯|高歌
芯東西1月17日報道,近日,三星電子在頂級學術期刊Nature上發(fā)表了全球首個基于MRAM(磁性隨機存儲器)的存內(nèi)計算研究。
存內(nèi)計算由于毋需數(shù)據(jù)在存儲器和處理器間移動,大大降低了AI計算的功耗,被視作邊緣AI計算的一項前沿研究。雖然MRAM存儲器件具備耐用性、可大規(guī)模量產(chǎn)等優(yōu)勢,但其小電阻的特性阻礙了這類存儲器被用于存內(nèi)計算。
本次,三星電子的研究團隊通過構建新的MRAM陣列結構,用基于28nm CMOS工藝的MRAM陣列芯片運行了手寫數(shù)字識別和人臉檢測等AI算法,準確率分別為98%和93%。
01.研究擴展存內(nèi)計算類型,填補MRAM空白
在傳統(tǒng)的計算機架構中,數(shù)據(jù)需要從內(nèi)存移動到處理單元,然后將中間結果存儲回內(nèi)存。但這種無謂的信息傳輸不僅增加了計算延遲,也提升了相關功耗。
根據(jù)臺積電此前對存內(nèi)計算的研究,數(shù)據(jù)移動所消耗的能量甚至大于計算的能量消耗。因此,在內(nèi)存中同時執(zhí)行數(shù)據(jù)存儲和計算的存內(nèi)計算成為了行業(yè)與學術機構研究的焦點。
此前的研究中,非易失性的RRAM(電阻式隨機存取存儲器)和PRAM(相變隨機存取存儲器)是存內(nèi)計算最常用的兩類存儲器。相比之下,盡管MRAM器件在操作速度、耐用性和量產(chǎn)等方面具有優(yōu)勢,但其較低的電阻使MRAM存儲器在傳統(tǒng)的存內(nèi)計算架構中無法達到低功耗要求。
在本篇論文中,三星電子的研究人員構建了一種基于MRAM的新存內(nèi)計算架構,填補了這種空白。論文特別寫道,該研究并非和基于其他存儲器的存內(nèi)計算架構競爭。到目前為止,沒有一種存儲器類型在電子產(chǎn)品中占據(jù)絕對主導,因為不同類型的存儲器各有自身的優(yōu)點和缺點。因此,基于不同存儲器的存內(nèi)計算也可能發(fā)展成不同的架構。
從這個角度看,三星電子通過填補基于MRAM存儲器的存內(nèi)計算架構空白,有助于存內(nèi)計算發(fā)展。
02.基于28nm CMOS工藝,準確檢測1851張人臉
三星電子構建了一個64×64的MRAM陣列,其外圍電路通過28nm CMOS工藝進行了集成。
具體結構上來說,MRAM陣列在寫/讀(W/R)電子元件和底部的TDC讀出電子元件之間,輸入數(shù)據(jù)控制器(IN)位于陣列左側。
為了彌補MRAM小電阻的問題,三星電子引入了一種新的位單元(陣列行列交叉處的元素,bit-cell),每個位單元組合成兩條路徑,每條路徑則由一個MTJ(磁性隧道結)和一個FET(場效應管)開關串聯(lián)組成。
▲芯片布局與MRAM陣列排布(圖片來源:Nature)
研究人員將每列中這些新的位單元串聯(lián)起來,每個位單元的輸出電阻相加便得到了列電阻R。通過新的結構設計,列電阻R取代了傳統(tǒng)(存內(nèi)計算)結構中基于基爾霍夫定律的列電流總和,成為了列輸出,解決了MRAM器件電阻較小的問題。
簡單來說,就是三星電子開發(fā)了一種MRAM陣列芯片,用新的“電阻總和”內(nèi)存計算架構取代了標準的“電流和”內(nèi)存計算架構,從而解決了單個MRAM器件的小電阻問題。
為了將這種新的MRAM陣列用于AI計算,研究人員采用了二值神經(jīng)網(wǎng)絡(BNN)算法。這種算法的精度可以以網(wǎng)絡大小為代價,將每個實值權值表示為二值化函數(shù),或以計算速度為代價將每個實值輸入數(shù)據(jù)表示為多個二值化函數(shù)序列,以提高BNN算法的精度。
該研究中,三星電子采用了后一種方式,將每個輸入數(shù)據(jù)擴展為8位編碼,以抑制噪聲。之后,研究人員用兩層BNN網(wǎng)絡以對MNIST數(shù)據(jù)集進行分類。
MNIST數(shù)據(jù)集來自美國國家標準與技術研究所(NIST),訓練集和測試集均由不同的手寫數(shù)字組成,數(shù)據(jù)集和測試集50%的手寫數(shù)字來自高中生,另外50%來自美國人口普查局的工作人員。
▲不同的手寫數(shù)字7(圖片來源:CSDN)
研究人員用MRAM陣列執(zhí)行了對1萬個手寫數(shù)字圖像的分類,并重復了三次,得到了93.23±0.05%的準確率。測試后,研究人員又通過VGG-8神經(jīng)網(wǎng)絡對1萬個手寫數(shù)字圖像進行了分類,其準確率高達98.86±0.06%。
除了手寫數(shù)字分類,三星電子還用4個MRAM陣列芯片運行了人臉檢測算法。在這一步,MRAM陣列芯片并沒有對場景中的所有對象進行人臉認證,而是先檢測場景中是否存在人臉,確認存在后再激活更高功率的人臉認證算法。
通過這種方法,MRAM陣列芯片從2000個無遮罩人臉場景中檢測到1851張人臉,準確率為92.5%;從500個遮罩人臉場景中檢測到483張人臉,準確率為96.6%,總體準確率為93.4%。此外,MRAM陣列芯片可以和相機結合實時檢測人臉。
▲4個MRAM陣列芯片與相機相連實時人臉檢測(圖片來源:Nature)
03.集成多種器件面臨挑戰(zhàn),未來或可用于生物神經(jīng)元網(wǎng)絡
對于這項研究,研究人員寫道,MRAM陣列運行存內(nèi)計算的一個重要挑戰(zhàn)是構建AI SoC(片上系統(tǒng)),將許多陣列和數(shù)據(jù)轉換器、數(shù)字電子設備進行集成。
研究人員還強調,寬泛來說,內(nèi)存陣列不僅可以用來運算神經(jīng)網(wǎng)絡算法,也可以作為潛在的生物神經(jīng)元網(wǎng)絡載體。
2021年9月,三星電子和哈佛聯(lián)合在Nature子刊Nature Electronics上發(fā)表了名為《Neuromorphic electronics based on copying and pasting the brain(基于復制和粘貼大腦的神經(jīng)形態(tài)電子學)》的論文,提出了一種將大腦神經(jīng)元連接圖(neuronal wiring map)“復制、粘貼”到高密度3維存儲網(wǎng)絡上的可能。
▲三星此前“復制、粘貼”大腦的研究(圖片來源:Nature)
MRAM陣列研究的第一作者Seungchul Jung稱,存內(nèi)計算與人類大腦的計算類似,因為人類的計算也發(fā)生在記憶或突觸網(wǎng)絡中。雖然MRAM陣列當前的計算目的并非模仿大腦,但這種固態(tài)存儲網(wǎng)絡將來可能會被用作模擬大腦突觸的平臺。
04.結語:新研究或將豐富三星存內(nèi)計算產(chǎn)品
近年來,存內(nèi)計算已逐漸成為產(chǎn)業(yè)界和學術界的公識,相關論文反復出現(xiàn)在ISSCC和IEDM等電子領域的頂級會議中,臺積電等半導體頭部廠商也都在布局和探索。
三星電子作為全球存儲龍頭,更是一直在關注存內(nèi)計算技術。去年2月,三星電子便公布了其首款集成了AI計算能力的高帶寬內(nèi)存(HBM),可以節(jié)省70%以上的能耗并提供2倍以上的系統(tǒng)性能。本次基于MRAM的存內(nèi)計算研究豐富了三星在存內(nèi)計算領域的布局,未來或許能夠看到更多類型的存內(nèi)計算產(chǎn)品出現(xiàn)在市場上。