团队提出基于Python的大规模图神经网络推荐库

2024-04-02 14:52:30深情的哈密瓜

图神经网络(GNN)已在推荐系统中得到广泛采用。在处理大型图时,GNN可能会遇到源自多层消息传递操作的可扩展性问题。因此,近年来,缩放GNN已成为一个重要的研究领域,并提出了许多缩放策略。

团队提出基于Python的大规模图神经网络推荐库

为了促进GNN推荐的研究,许多开源推荐库已将GNN作为关键模型类别。然而,在处理大型图时,大多数现有库仍然存在两个限制。

第一个是对扩展策略考虑不够。大多数库仅实现特定的GNN算法,而不考虑扩展策略。第二个限制是缺乏大型图处理优化。许多官方模型实现忽略了某些编码细节,导致处理大型图时出现缩放问题。

为了解决这些问题,黄洪和金海领导的研究团队于2024年3月14日在《计算机科学前沿》上发表了他们的新研究。

该团队提出了一个名为XGCN的基于Python的库,以帮助用户在单机环境中快速构建和运行大规模GNN。该库支持各种扩展策略,提供大型图的优化实现,并具有易于使用的运行和开发界面。

具体来说,XGCN总共包括16个嵌入模型,涵盖了广泛的类型:从浅层模型到常见的GNN,具有三种主流的缩放策略:基于层采样、基于解耦和基于聚类的方法。它在模型的实现中融入了优化,例如一组Numba加速操作函数,使它们更适合大型图。还提供了详细的使用指导文档和模型运行脚本。

通过使用不同规模的数据集(从15万个节点到300万个节点)进行实验来评估经典图卷积操作的几种不同实现。据观察,现有的实现往往会遇到内存不足的问题,而XGCN始终展现出卓越的时间和内存效率。

推荐阅读

阅读排行