通过混合神经网络推进类脑计算

2024-04-11 14:37:18深情的哈密瓜

人脑以其卓越的通用智能和卓越的功耗效率,为人工智能领域提供了源源不断的灵感和渴望。从大脑的基本结构和信息处理机制中汲取灵感,类脑计算已成为一种新的计算范式,有望引导人工智能从专业领域转向更广泛的通用智能应用。

通过混合神经网络推进类脑计算

国际半导体协会已将类脑计算视为后摩尔定律时代最有前途的两项颠覆性计算技术之一。

作为涉及芯片、软件、算法、模型等的交叉学科领域,类脑计算的概念和研究范式正在不断拓展和深化。值得注意的是,2019年清华大学类脑计算研究中心发布的天机芯片,标志着类脑计算领域的一个重要里程碑。

该芯片不仅支持面向计算机科学和面向神经科学的模型,而且能够实现它们的混合建模,为双脑驱动的异构类脑计算的新兴范式提供了强有力的支持。这一突破进一步刺激了混合神经网络(HNNs)的蓬勃发展和创新。

近日,清华大学赵荣教授团队与施路平教授团队合作,在《国家科学评论》上发表了一篇关于HNN的综合综述。该综述对HNNs进行了系统的概述,涵盖了HNNs的起源、概念、构建框架和支撑系统,同时也强调了HNNs的发展轨迹和未来方向。

作为双脑原理驱动的代表性研究范式,HNN无缝结合了面向神经科学的尖峰神经网络(SNN)和面向计算机科学的人工神经网络(ANN)。HNN利用这些异构网络在信息表示和处理方面的独特优势,为通用人工智能(AGI)的发展注入了新的活力。

HNN中的ANN和SNN固有的异质性为它们提供了广泛的灵活性和多样性。然而,这种异质性也给它们的构建带来了重大挑战。为了有效促进HNN的发展,必须建立涵盖集成范式、基础理论、信息流、交互模式和网络结构等各个视角的系统方法。

该协作团队首创了HNN的通用设计和计算框架来应对这些挑战。他们采用了一种创新的解耦方法,然后使用参数化混合单元(HU)进行集成,成功地克服了异构神经网络之间的连接问题。该集成策略结合了各种异构计算范式的独特特性,同时通过解耦提高了灵活性和构建效率。

通过采用这种新颖的框架,HNN可以受益于ANN和SNN的优势,同时减轻它们的局限性。这种方法不仅增强了HNN的性能和能力,而且为类脑计算领域的进一步研究和进步提供了基础。

通过考虑不同的设计维度,可以构建灵活多样的HNN模型。这些模型可以利用数据和支持系统的异构性来实现性能和成本之间更好的平衡。

目前,HNN已广泛应用于目标跟踪、语音识别、持续学习、决策控制等智能任务中,为这些领域提供了创新的解决方案。此外,受大脑异质性的启发,HNN还可以作为神经科学研究的建模工具,促进神经科学和HNN的协同发展。

这种协同作用为两个领域共同进步开辟了广阔的研究空间和机会。通过持续的研究和探索,HNN有望为AGI的发展和我们对大脑复杂机制的理解做出进一步的贡献。

为了有效部署和应用HNN,开发合适的支持系统至关重要。目前,芯片、软件、系统等配套基础设施已经开发完毕。在芯片设计方面,混合类脑芯片天机芯片针对HNN的无缝集成进行了全面优化。该芯片提供专为HNN应用量身定制的增强性能和效率。

在软件方面,神经形态完整性为HNN的编译和部署提供了理论支持和框架设计指导。这确保了软件系统能够有效处理HNN模型的独特特征和计算要求。

此外,经纬二号类脑计算系统还对集群层面的计算、存储和通信基础设施进行了优化。该系统通过提供必要的资源来处理复杂神经网络的计算需求,为大规模HNN的开发奠定了坚实的基础。

展望未来,大规模HNN的深入研究具有重要意义。例如,目前在深度学习领域,基于Transformer的数十亿甚至数万亿参数的模型在自然语言处理和图像理解方面取得了重大进展。然而,这些进步伴随着巨大的能源成本。

在最近举行的芯片设计会议ISSCC上,有报道称,利用HNN,成功构建了混合Transformer模型,从而大幅降低了能耗。这凸显了HNN在解决与大规模模型相关的能源效率挑战方面的潜力。

探索大规模HNN的设计和优化方法以及构建训练数据集将是未来的重要研究方向。这些领域具有很高的研究价值和广阔的应用前景,特别是在降低能耗的同时保持甚至提高复杂模型的性能方面。

推荐阅读

阅读排行