团队提出基于Python的大规模图神经网络推荐库

2024-04-02 14:52:30深情的哈密瓜

图神经网络(GNN)已在推荐系统中得到广泛采用。在处理大型图时，GNN可能会遇到源自多层消息传递操作的可扩展性问题。因此，近年来，缩放GNN已成为一个重要的研究领域，并提出了许多缩放策略。

为了促进GNN推荐的研究，许多开源推荐库已将GNN作为关键模型类别。然而，在处理大型图时，大多数现有库仍然存在两个限制。

第一个是对扩展策略考虑不够。大多数库仅实现特定的GNN算法，而不考虑扩展策略。第二个限制是缺乏大型图处理优化。许多官方模型实现忽略了某些编码细节，导致处理大型图时出现缩放问题。

为了解决这些问题，黄洪和金海领导的研究团队于2024年3月14日在《计算机科学前沿》上发表了他们的新研究。

该团队提出了一个名为XGCN的基于Python的库，以帮助用户在单机环境中快速构建和运行大规模GNN。该库支持各种扩展策略，提供大型图的优化实现，并具有易于使用的运行和开发界面。

具体来说，XGCN总共包括16个嵌入模型，涵盖了广泛的类型：从浅层模型到常见的GNN，具有三种主流的缩放策略：基于层采样、基于解耦和基于聚类的方法。它在模型的实现中融入了优化，例如一组Numba加速操作函数，使它们更适合大型图。还提供了详细的使用指导文档和模型运行脚本。

通过使用不同规模的数据集(从15万个节点到300万个节点)进行实验来评估经典图卷积操作的几种不同实现。据观察，现有的实现往往会遇到内存不足的问题，而XGCN始终展现出卓越的时间和内存效率。

声明：本站所有作品图文均由用户自行上传分享，仅供网友学习交流。若您的权利被侵害，请联系我们