尊龙凯时 - 人生就是搏!


    当前位置 >>  首頁 >> 綜合信息 >> 綜合新聞

綜合新聞

尊龙凯时在片上學習存算一體芯片方面取得重要進展

稿件来源:重点实验室 王琳方、张康玮 發布時間:2024-02-26

當前,智能計算設備呈指數式增長,迫切需要低功耗與低延遲執行神經網絡推理任務,以及不依賴雲端的片上學習能力來動態適應邊緣端複雜多變的應用場景。非易失存算一體技術可最大化減少數據搬運帶來的功耗和延遲並消除靜態功耗,爲邊緣智能計算設備提供了一種極具競爭力的方案。非易失存算一體芯片近年來持續快速發展,其在集成規模、能效、算力等方面均取得了長足的進步,實現了對片上推理任務的高效支持。但進行片上學習通常需要對模型參數進行海量次數的更新以及高精度的反向傳播。受限于有限的擦寫次數、較高的擦寫功耗以及有限的計算精度,當前,非易失存算一體芯片仍然難以高效支持片上學習與訓練。

针对以上问题,中國科學院微电子研究所劉明院士团队设计了基于非易失/易失存储融合型的片上学习存算一体宏芯片。团队在14nm FinFET工艺上验证了具有多值存储能力的5晶体管型逻辑闪存单元,编程电压(-25%)与编程时间(-66%)较同类型器件均获得有效降低;在此基础上,团队进一步提出了逻辑闪存单元与SRAM融合的新型阵列,不仅可以利用非易失与易失性存储单元的特点满足片上学习过程中长期与短期信息的存储,还能通过对矩阵-向量乘与矩阵元素乘的高效处理加速片上学习过程中所需的关键算子。团队还提出了一种与存储阵列深度融合的低硬件开销差分型模数转换电路,采用采样电容复用的方法节省面积,通过多元素稀疏感知的方案节省功耗。该芯片可以有效支持具有突触可塑性的神经网络,基于前馈过程动态更新短期信息,从而实现动态的片上学习。该存算一体宏芯片在14nm FinFET工艺下流片,可实现小样本学习等片上学习任务,8比特矩阵-矩阵-向量计算能效达到了22.64TOP/W。这一研究结果为基于存算一体架构的片上学习芯片提供了新思路。

近期,本工作以“A Flash-SRAM-ADC-Fused Plastic Computing-in-Memory Macro for Learning in Neural Networks in a Standard 14nm FinFET Process为题发表在 ISSCC 2024国际会议上,微电子所博士生王琳方为第一作者、窦春萌研究員为通讯作者。参与本工作的主要研究人员还包括微电子所博士生李伟增以及硕士生周治道。该研究得到了科技部重点研发计划、国家自然科学基金、中國科學院战略先导专项等项目的支持。

14nm FinFET非易失-易失融合型片上学习存算一体芯片:(a)显微镜照片,(b)非易失逻辑闪存单元编程电压与时间对比,(c)工作频率与计算能效

附件: