正在閱讀:

三星存內(nèi)計算登Nature,全球首搭MRAM,鋪路下一代AI芯片

掃一掃下載界面新聞APP

三星存內(nèi)計算登Nature,全球首搭MRAM,鋪路下一代AI芯片

人臉檢測和手寫數(shù)字分類準確率分別為93%和98%。

文|芯東西

編譯|高歌

芯東西1月17日報道,近日,三星電子在頂級學術(shù)期刊Nature上發(fā)表了全球首個基于MRAM(磁性隨機存儲器)的存內(nèi)計算研究。

存內(nèi)計算由于毋需數(shù)據(jù)在存儲器和處理器間移動,大大降低了AI計算的功耗,被視作邊緣AI計算的一項前沿研究。雖然MRAM存儲器件具備耐用性、可大規(guī)模量產(chǎn)等優(yōu)勢,但其小電阻的特性阻礙了這類存儲器被用于存內(nèi)計算。

本次,三星電子的研究團隊通過構(gòu)建新的MRAM陣列結(jié)構(gòu),用基于28nm CMOS工藝的MRAM陣列芯片運行了手寫數(shù)字識別和人臉檢測等AI算法,準確率分別為98%和93%。

01.研究擴展存內(nèi)計算類型,填補MRAM空白

在傳統(tǒng)的計算機架構(gòu)中,數(shù)據(jù)需要從內(nèi)存移動到處理單元,然后將中間結(jié)果存儲回內(nèi)存。但這種無謂的信息傳輸不僅增加了計算延遲,也提升了相關(guān)功耗。

根據(jù)臺積電此前對存內(nèi)計算的研究,數(shù)據(jù)移動所消耗的能量甚至大于計算的能量消耗。因此,在內(nèi)存中同時執(zhí)行數(shù)據(jù)存儲和計算的存內(nèi)計算成為了行業(yè)與學術(shù)機構(gòu)研究的焦點。

此前的研究中,非易失性的RRAM(電阻式隨機存取存儲器)和PRAM(相變隨機存取存儲器)是存內(nèi)計算最常用的兩類存儲器。相比之下,盡管MRAM器件在操作速度、耐用性和量產(chǎn)等方面具有優(yōu)勢,但其較低的電阻使MRAM存儲器在傳統(tǒng)的存內(nèi)計算架構(gòu)中無法達到低功耗要求。

在本篇論文中,三星電子的研究人員構(gòu)建了一種基于MRAM的新存內(nèi)計算架構(gòu),填補了這種空白。論文特別寫道,該研究并非和基于其他存儲器的存內(nèi)計算架構(gòu)競爭。到目前為止,沒有一種存儲器類型在電子產(chǎn)品中占據(jù)絕對主導,因為不同類型的存儲器各有自身的優(yōu)點和缺點。因此,基于不同存儲器的存內(nèi)計算也可能發(fā)展成不同的架構(gòu)。

從這個角度看,三星電子通過填補基于MRAM存儲器的存內(nèi)計算架構(gòu)空白,有助于存內(nèi)計算發(fā)展。

02.基于28nm CMOS工藝,準確檢測1851張人臉

三星電子構(gòu)建了一個64×64的MRAM陣列,其外圍電路通過28nm CMOS工藝進行了集成。

具體結(jié)構(gòu)上來說,MRAM陣列在寫/讀(W/R)電子元件和底部的TDC讀出電子元件之間,輸入數(shù)據(jù)控制器(IN)位于陣列左側(cè)。

為了彌補MRAM小電阻的問題,三星電子引入了一種新的位單元(陣列行列交叉處的元素,bit-cell),每個位單元組合成兩條路徑,每條路徑則由一個MTJ(磁性隧道結(jié))和一個FET(場效應管)開關(guān)串聯(lián)組成。

▲芯片布局與MRAM陣列排布(圖片來源:Nature)

研究人員將每列中這些新的位單元串聯(lián)起來,每個位單元的輸出電阻相加便得到了列電阻R。通過新的結(jié)構(gòu)設計,列電阻R取代了傳統(tǒng)(存內(nèi)計算)結(jié)構(gòu)中基于基爾霍夫定律的列電流總和,成為了列輸出,解決了MRAM器件電阻較小的問題。

簡單來說,就是三星電子開發(fā)了一種MRAM陣列芯片,用新的“電阻總和”內(nèi)存計算架構(gòu)取代了標準的“電流和”內(nèi)存計算架構(gòu),從而解決了單個MRAM器件的小電阻問題。

為了將這種新的MRAM陣列用于AI計算,研究人員采用了二值神經(jīng)網(wǎng)絡(BNN)算法。這種算法的精度可以以網(wǎng)絡大小為代價,將每個實值權(quán)值表示為二值化函數(shù),或以計算速度為代價將每個實值輸入數(shù)據(jù)表示為多個二值化函數(shù)序列,以提高BNN算法的精度。

該研究中,三星電子采用了后一種方式,將每個輸入數(shù)據(jù)擴展為8位編碼,以抑制噪聲。之后,研究人員用兩層BNN網(wǎng)絡以對MNIST數(shù)據(jù)集進行分類。

MNIST數(shù)據(jù)集來自美國國家標準與技術(shù)研究所(NIST),訓練集和測試集均由不同的手寫數(shù)字組成,數(shù)據(jù)集和測試集50%的手寫數(shù)字來自高中生,另外50%來自美國人口普查局的工作人員。

▲不同的手寫數(shù)字7(圖片來源:CSDN)

研究人員用MRAM陣列執(zhí)行了對1萬個手寫數(shù)字圖像的分類,并重復了三次,得到了93.23±0.05%的準確率。測試后,研究人員又通過VGG-8神經(jīng)網(wǎng)絡對1萬個手寫數(shù)字圖像進行了分類,其準確率高達98.86±0.06%。

除了手寫數(shù)字分類,三星電子還用4個MRAM陣列芯片運行了人臉檢測算法。在這一步,MRAM陣列芯片并沒有對場景中的所有對象進行人臉認證,而是先檢測場景中是否存在人臉,確認存在后再激活更高功率的人臉認證算法。

通過這種方法,MRAM陣列芯片從2000個無遮罩人臉場景中檢測到1851張人臉,準確率為92.5%;從500個遮罩人臉場景中檢測到483張人臉,準確率為96.6%,總體準確率為93.4%。此外,MRAM陣列芯片可以和相機結(jié)合實時檢測人臉。

▲4個MRAM陣列芯片與相機相連實時人臉檢測(圖片來源:Nature)

03.集成多種器件面臨挑戰(zhàn),未來或可用于生物神經(jīng)元網(wǎng)絡

對于這項研究,研究人員寫道,MRAM陣列運行存內(nèi)計算的一個重要挑戰(zhàn)是構(gòu)建AI SoC(片上系統(tǒng)),將許多陣列和數(shù)據(jù)轉(zhuǎn)換器、數(shù)字電子設備進行集成。

研究人員還強調(diào),寬泛來說,內(nèi)存陣列不僅可以用來運算神經(jīng)網(wǎng)絡算法,也可以作為潛在的生物神經(jīng)元網(wǎng)絡載體。

2021年9月,三星電子和哈佛聯(lián)合在Nature子刊Nature Electronics上發(fā)表了名為《Neuromorphic electronics based on copying and pasting the brain(基于復制和粘貼大腦的神經(jīng)形態(tài)電子學)》的論文,提出了一種將大腦神經(jīng)元連接圖(neuronal wiring map)“復制、粘貼”到高密度3維存儲網(wǎng)絡上的可能。

▲三星此前“復制、粘貼”大腦的研究(圖片來源:Nature)

MRAM陣列研究的第一作者Seungchul Jung稱,存內(nèi)計算與人類大腦的計算類似,因為人類的計算也發(fā)生在記憶或突觸網(wǎng)絡中。雖然MRAM陣列當前的計算目的并非模仿大腦,但這種固態(tài)存儲網(wǎng)絡將來可能會被用作模擬大腦突觸的平臺。

04.結(jié)語:新研究或?qū)⒇S富三星存內(nèi)計算產(chǎn)品

近年來,存內(nèi)計算已逐漸成為產(chǎn)業(yè)界和學術(shù)界的公識,相關(guān)論文反復出現(xiàn)在ISSCC和IEDM等電子領(lǐng)域的頂級會議中,臺積電等半導體頭部廠商也都在布局和探索。

三星電子作為全球存儲龍頭,更是一直在關(guān)注存內(nèi)計算技術(shù)。去年2月,三星電子便公布了其首款集成了AI計算能力的高帶寬內(nèi)存(HBM),可以節(jié)省70%以上的能耗并提供2倍以上的系統(tǒng)性能。本次基于MRAM的存內(nèi)計算研究豐富了三星在存內(nèi)計算領(lǐng)域的布局,未來或許能夠看到更多類型的存內(nèi)計算產(chǎn)品出現(xiàn)在市場上。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

三星

5.2k
  • 三星電子獲美國47.45億美元芯片補貼
  • 亞太主要股指午間漲跌互現(xiàn),日經(jīng)225指數(shù)漲1.39%

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

三星存內(nèi)計算登Nature,全球首搭MRAM,鋪路下一代AI芯片

人臉檢測和手寫數(shù)字分類準確率分別為93%和98%。

文|芯東西

編譯|高歌

芯東西1月17日報道,近日,三星電子在頂級學術(shù)期刊Nature上發(fā)表了全球首個基于MRAM(磁性隨機存儲器)的存內(nèi)計算研究。

存內(nèi)計算由于毋需數(shù)據(jù)在存儲器和處理器間移動,大大降低了AI計算的功耗,被視作邊緣AI計算的一項前沿研究。雖然MRAM存儲器件具備耐用性、可大規(guī)模量產(chǎn)等優(yōu)勢,但其小電阻的特性阻礙了這類存儲器被用于存內(nèi)計算。

本次,三星電子的研究團隊通過構(gòu)建新的MRAM陣列結(jié)構(gòu),用基于28nm CMOS工藝的MRAM陣列芯片運行了手寫數(shù)字識別和人臉檢測等AI算法,準確率分別為98%和93%。

01.研究擴展存內(nèi)計算類型,填補MRAM空白

在傳統(tǒng)的計算機架構(gòu)中,數(shù)據(jù)需要從內(nèi)存移動到處理單元,然后將中間結(jié)果存儲回內(nèi)存。但這種無謂的信息傳輸不僅增加了計算延遲,也提升了相關(guān)功耗。

根據(jù)臺積電此前對存內(nèi)計算的研究,數(shù)據(jù)移動所消耗的能量甚至大于計算的能量消耗。因此,在內(nèi)存中同時執(zhí)行數(shù)據(jù)存儲和計算的存內(nèi)計算成為了行業(yè)與學術(shù)機構(gòu)研究的焦點。

此前的研究中,非易失性的RRAM(電阻式隨機存取存儲器)和PRAM(相變隨機存取存儲器)是存內(nèi)計算最常用的兩類存儲器。相比之下,盡管MRAM器件在操作速度、耐用性和量產(chǎn)等方面具有優(yōu)勢,但其較低的電阻使MRAM存儲器在傳統(tǒng)的存內(nèi)計算架構(gòu)中無法達到低功耗要求。

在本篇論文中,三星電子的研究人員構(gòu)建了一種基于MRAM的新存內(nèi)計算架構(gòu),填補了這種空白。論文特別寫道,該研究并非和基于其他存儲器的存內(nèi)計算架構(gòu)競爭。到目前為止,沒有一種存儲器類型在電子產(chǎn)品中占據(jù)絕對主導,因為不同類型的存儲器各有自身的優(yōu)點和缺點。因此,基于不同存儲器的存內(nèi)計算也可能發(fā)展成不同的架構(gòu)。

從這個角度看,三星電子通過填補基于MRAM存儲器的存內(nèi)計算架構(gòu)空白,有助于存內(nèi)計算發(fā)展。

02.基于28nm CMOS工藝,準確檢測1851張人臉

三星電子構(gòu)建了一個64×64的MRAM陣列,其外圍電路通過28nm CMOS工藝進行了集成。

具體結(jié)構(gòu)上來說,MRAM陣列在寫/讀(W/R)電子元件和底部的TDC讀出電子元件之間,輸入數(shù)據(jù)控制器(IN)位于陣列左側(cè)。

為了彌補MRAM小電阻的問題,三星電子引入了一種新的位單元(陣列行列交叉處的元素,bit-cell),每個位單元組合成兩條路徑,每條路徑則由一個MTJ(磁性隧道結(jié))和一個FET(場效應管)開關(guān)串聯(lián)組成。

▲芯片布局與MRAM陣列排布(圖片來源:Nature)

研究人員將每列中這些新的位單元串聯(lián)起來,每個位單元的輸出電阻相加便得到了列電阻R。通過新的結(jié)構(gòu)設計,列電阻R取代了傳統(tǒng)(存內(nèi)計算)結(jié)構(gòu)中基于基爾霍夫定律的列電流總和,成為了列輸出,解決了MRAM器件電阻較小的問題。

簡單來說,就是三星電子開發(fā)了一種MRAM陣列芯片,用新的“電阻總和”內(nèi)存計算架構(gòu)取代了標準的“電流和”內(nèi)存計算架構(gòu),從而解決了單個MRAM器件的小電阻問題。

為了將這種新的MRAM陣列用于AI計算,研究人員采用了二值神經(jīng)網(wǎng)絡(BNN)算法。這種算法的精度可以以網(wǎng)絡大小為代價,將每個實值權(quán)值表示為二值化函數(shù),或以計算速度為代價將每個實值輸入數(shù)據(jù)表示為多個二值化函數(shù)序列,以提高BNN算法的精度。

該研究中,三星電子采用了后一種方式,將每個輸入數(shù)據(jù)擴展為8位編碼,以抑制噪聲。之后,研究人員用兩層BNN網(wǎng)絡以對MNIST數(shù)據(jù)集進行分類。

MNIST數(shù)據(jù)集來自美國國家標準與技術(shù)研究所(NIST),訓練集和測試集均由不同的手寫數(shù)字組成,數(shù)據(jù)集和測試集50%的手寫數(shù)字來自高中生,另外50%來自美國人口普查局的工作人員。

▲不同的手寫數(shù)字7(圖片來源:CSDN)

研究人員用MRAM陣列執(zhí)行了對1萬個手寫數(shù)字圖像的分類,并重復了三次,得到了93.23±0.05%的準確率。測試后,研究人員又通過VGG-8神經(jīng)網(wǎng)絡對1萬個手寫數(shù)字圖像進行了分類,其準確率高達98.86±0.06%。

除了手寫數(shù)字分類,三星電子還用4個MRAM陣列芯片運行了人臉檢測算法。在這一步,MRAM陣列芯片并沒有對場景中的所有對象進行人臉認證,而是先檢測場景中是否存在人臉,確認存在后再激活更高功率的人臉認證算法。

通過這種方法,MRAM陣列芯片從2000個無遮罩人臉場景中檢測到1851張人臉,準確率為92.5%;從500個遮罩人臉場景中檢測到483張人臉,準確率為96.6%,總體準確率為93.4%。此外,MRAM陣列芯片可以和相機結(jié)合實時檢測人臉。

▲4個MRAM陣列芯片與相機相連實時人臉檢測(圖片來源:Nature)

03.集成多種器件面臨挑戰(zhàn),未來或可用于生物神經(jīng)元網(wǎng)絡

對于這項研究,研究人員寫道,MRAM陣列運行存內(nèi)計算的一個重要挑戰(zhàn)是構(gòu)建AI SoC(片上系統(tǒng)),將許多陣列和數(shù)據(jù)轉(zhuǎn)換器、數(shù)字電子設備進行集成。

研究人員還強調(diào),寬泛來說,內(nèi)存陣列不僅可以用來運算神經(jīng)網(wǎng)絡算法,也可以作為潛在的生物神經(jīng)元網(wǎng)絡載體。

2021年9月,三星電子和哈佛聯(lián)合在Nature子刊Nature Electronics上發(fā)表了名為《Neuromorphic electronics based on copying and pasting the brain(基于復制和粘貼大腦的神經(jīng)形態(tài)電子學)》的論文,提出了一種將大腦神經(jīng)元連接圖(neuronal wiring map)“復制、粘貼”到高密度3維存儲網(wǎng)絡上的可能。

▲三星此前“復制、粘貼”大腦的研究(圖片來源:Nature)

MRAM陣列研究的第一作者Seungchul Jung稱,存內(nèi)計算與人類大腦的計算類似,因為人類的計算也發(fā)生在記憶或突觸網(wǎng)絡中。雖然MRAM陣列當前的計算目的并非模仿大腦,但這種固態(tài)存儲網(wǎng)絡將來可能會被用作模擬大腦突觸的平臺。

04.結(jié)語:新研究或?qū)⒇S富三星存內(nèi)計算產(chǎn)品

近年來,存內(nèi)計算已逐漸成為產(chǎn)業(yè)界和學術(shù)界的公識,相關(guān)論文反復出現(xiàn)在ISSCC和IEDM等電子領(lǐng)域的頂級會議中,臺積電等半導體頭部廠商也都在布局和探索。

三星電子作為全球存儲龍頭,更是一直在關(guān)注存內(nèi)計算技術(shù)。去年2月,三星電子便公布了其首款集成了AI計算能力的高帶寬內(nèi)存(HBM),可以節(jié)省70%以上的能耗并提供2倍以上的系統(tǒng)性能。本次基于MRAM的存內(nèi)計算研究豐富了三星在存內(nèi)計算領(lǐng)域的布局,未來或許能夠看到更多類型的存內(nèi)計算產(chǎn)品出現(xiàn)在市場上。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。