[图神经网络]图卷积神经网络--GCN
创始人
2025-06-01 04:44:06
0

一、消息传递

        由于图具有“变换不变性”(即图的空间结构改变不会影响图的性状),故不能直接将其输入卷积神经网络。一般采用消息传递(Message pass)的方式来处理。

        消息传递机制通过局部邻域构建计算图实现,即某个节点的属性由其邻居节点来决定。汇聚这些邻居节点信息的工作由神经网络完成,不用人为干预。其形式如下例:

        每个节点都可构建属于自己的计算图,计算图可以表征一个其结构功能角色。 在计算过程中,每个计算图即为一个单独样本。

        需要注意的是,图神经网络的层数并不是神经网络的层数,而是计算图的层数。图神经网络的层数=计算图的层数=图中目标节点的邻居阶数。每一层的节点共享一套计算权重。

                        

         图神经网络的层数 k 可以视为卷积神经网络中的感受野。若 k 过大可能导致过平滑(所有节点输出同一张图)

二、图卷积神经网络

        1.计算单元

                图卷积神经网络基于消息传递方式,一般的计算方法是将邻居节点的属性特征逐元素求平均(与顺序无关,也可以是求最大值/求和),再将这个向量输入到神经元中

        2.数学表示

                k+1层 v 的嵌入是第k层v节点的邻域u计算(邻域u中的节点求和除以节点v连接数),其公式可以写作:

                        h^{(k+1)}_v=\sigma(\omega _k\sum \frac{h^k _u}{N(v)})       式中 \sigma为激活函数,\omega_k为权重

                其中,节点v的第0阶属性特征就是其本身:h_v^{(0)}=x_v

                神经网络输出的嵌入向量为z_v = h_v^K,K为网络的层数

        3.矩阵表示

                ①将k层所有节点的嵌入都记为H^{(k)}H^{(k)}=[h_1^{(k)}...h_{|v|}^{(k)}]^T,即下图中矩阵中的一行

                ②将此矩阵左乘一个邻接矩阵A_v : \sum_{u \in N_v}h_u^{(k)}=A_vH^{(k)} 可挑选出节点v的邻域节点(对应上式中的求和过程)

                ③找到一个矩阵D_v=Deg(v)=|N(v)|,该矩阵为一个由节点连接数构成的对角矩阵,表现为:

                         其逆矩阵即为连接数的倒数:D_v^{-1}=\frac{1}{|N(v)|}

                经过上述步骤,式\sum \frac{h^k _u}{N(v)}即可表示为D^{-1}AH^{(k)}

                但是这样计算的话,由于D^{-1}造成节点v仅会考虑自己的连接数而忽视对方的连接数(不考虑连接的质量,对全部渠道来得信息强行求平均), 可以将式子改进D^{-1}A --> D^{-1}AD^{-1},这样得到的结果是一个对称矩阵,既考虑了自身的连接数也考虑了对方的连接数。

                可改进后的向量幅值会减小,其特征值值域为(-1,1)。对于这种现象,可以继续对式子进行改进D^{-1}AD^{-1} --> D^{-\frac{1}{2}}AD^{-\frac{1}{2}},这样处理后最大特征值等于1。

                最后将此矩阵记为:\tilde{A}=D^{-\frac{1}{2}}AD^{-\frac{1}{2}},在此矩阵中,若两个节点i,j存在连接,则其在矩阵中为\tilde{A}=\frac{1}{\sqrt{d_i}\sqrt{d_j}},可以表示其连接权重(其中d_id_j是节点i和节点j的连接数)

                         矩阵\tilde{A}还可以用来计算拉普拉斯矩阵\xi = 1 - \tilde{A}

                则式子可以列为:h^{(k+1)}_v=\sigma(\tilde{D}^{-\frac{1}{2}}\tilde{A}\tilde{D}^{-\frac{1}{2}}H^{(l)}W^{(l)}),该式即可表示一层GCN;其中可学习参数为权重w^{(l)}

        4.计算图的改进

                上述方式(通过相邻节点描述本节点无法反映节点自身的情况),改进方法为:为每个节点加上指向自己的连接

                 这样改进后,邻接矩阵\tilde{A}即变为\tilde{A}=A+I(原矩阵加上单位阵,对角线全部为1)

                最终神经网络表达式H^{(k+1)}_v=\sigma(\tilde{D}^{-\frac{1}{2}}\tilde{A}\tilde{D}^{-\frac{1}{2}}H^{(l)}W^{(l)})可以写作:

                        H^K_i=\sigma(\sum \frac{\tilde{A_{ij}}}{\sqrt{\tilde{D_{ii}}}\tilde{D_{jj}} }H_j^{k-1}W^k)(一个式子包含了原权重矩阵和单位阵)

                也可拆分写作:

                        H^k_i=\sigma(\sum\frac{A_{ij}}{\sqrt{\tilde{D_{ii}}}\tilde{D_{jj}} }H^{k-1}_jW^k+\frac{1}{\tilde{D_i}}H^{k-1}_iW^k)(前面是对原权重矩阵的变换,后面是对单位矩阵的变换)

                进一步改进则可使用两套权重(汇聚节点信息一套,自循环节点信息一套),写作:

                        H^{(k+1)}_v=\sigma(W_k\sum\frac{h_u^{(k)}}{|N(v)|}+B_kh_v^{(k)})

                        且当B_k=1时,后式变为恒等映射,即为残差连接。

        !!!最终的矩阵简化形式为:H^{(k+1)}=\sigma(\tilde{A}H^{(k)}W_k^T+H^{(k)}B_k^T);其中\tilde{A}=D^{-\frac{1}{2}}AD^{-\frac{1}{2}}

三、GCN的训练

        1.监督学习

                损失函数:min\, l(y,f(z_v)),其中f为分类/回归预测头,y为节点标注信息

                交叉熵损失函数:l=\sum y_vlog(\sigma(z_v^T\theta ))+(1-y_v))log(1-\sigma(z_v^T\theta))

                GCN的输入是图结构,输出也是图结构,但输出的图中的节点嵌入了语义信息;输出结构具备:低维、连续、稠密的特点。

                 嵌入向量可以输入分类头进行分类,将其映射在二维空间上即可发现不同类别的节点在迭代中被分得越来越开

---->​​​​​​​

        2.无监督/自检断学习

                类似于Deepwalk/Node2vec,利用图自身的连接结构,迭代目的是让图中相连的两个结点嵌入的向量尽可能接近

                损失函数:l=\sum CE(y_{u,v},DEC(z_u,z_v)),当y_{u,v}=1时表示两个结点uv相似。

                一般采用“编码器--解码器”架构,由编码器将图嵌入到向量,再由解码器计算两个向量的相似度。

四、GCN的优势

        相较于传统的基于随机游走的机器学习而言

                ①GCN所有计算图共享权重参数量更小

                ②GCN为归纳式学习,拥有较强的泛化能力(可以泛化到新节点乃至新图--迁移学习)

                ③利用了节点的属性特征、结构功能角色和标注信息

                ④拟合学习能力强,得到的嵌入向量质量较高

五、对比CNN、Transformer

        1.与CNN对比

                CNN可以视为一个2层的GCN,卷积汇总了9个邻居节点和目标节点的信息,其数学式亦可被写成:h^{(l+1)}=\sigma(\sum W_l^uh_u^P(l)+B_lh_v^{(l)}),CNN可以被视为一个固定邻域、固定顺序的GCN。

                 但两者之间有以下不同

                        ①CNN不具备变换不变性,打乱像素点的顺序会影响网络的输出。

                        ②GCN的卷积核权重由\tilde{A}预定义,不需要学习。而CNN的权重需要学习得来

        2.与Transformer对比

                Transformer本身是自注意力机制,其训练的目的是让一个序列中的元素之间互相影响。

                 Transformer可以被视为一个全连接词图上的GCN。

相关内容

热门资讯

周代音乐内容分为几类 周代音乐内容分为几类A.3 B.4 C.5 D.6答案错误,务信,被坑了
古代的叙事诗 古代的叙事诗那个《孔雀东南飞》可能是,还有《木兰诗》、《长恨歌》、《琵琶行》应该也是的。其实是不是叙...
最新放假通知!连休8天 今天是端午节假期的最后一天下次休假在啥时候?根据国务院办公厅关于2025年部分节假日安排的通知今年的...
白头发男主角是王爷的小说 白头发男主角是王爷的小说不嫁妖孽王爷 白发王妃(女主白了头发,男主为了女主喝了一种药也白了头发)
用物理学原理解释彩虹为什么是弯... 用物理学原理解释彩虹为什么是弯的,中午为何很难看到彩虹是空气中水蒸气浓度不同造成的色散,所以必须在比...
大幅超去年同期 2025端午档... 据网络平台数据,截至6月2日12时47分,2025年端午档电影票房破4亿,大幅超去年同期。合家欢电影...
东方海洋:全资子公司取得医疗器... 每经AI快讯,6月2日,东方海洋公告,全资子公司艾维可生物科技有限公司自主研发的铁蛋白(Fer)测定...
晶科能源:收到政府补助9800... 晶科能源(688223)公告,5月29日收到政府补助人民币9800万元,属于与收益相关的政府补助款项...
北汽蓝谷:子公司5月销量同比增... 6月2日,北汽蓝谷公告称,子公司北京新能源汽车股份有限公司5月份产量为13,433辆,同比增长216...
采访体育记者可以问什么问题 采访体育记者可以问什么问题要做一个体育记者的人物专访,请问有什么问题可以问啊?求助啊.....为什么...
高凌信息:终止发行股份及支付现... 高凌信息(688175.SH)公告称,公司决定终止发行股份及支付现金购买资产并募集配套资金事项,主要...
为了培养学生吃苦耐劳、坚强自立... 为了培养学生吃苦耐劳、坚强自立的精神,教师给学生们讲了“卧薪尝胆”的故事。这体现了哪项德育方法?()...
送你一片浪漫花海 和薰衣草一起... 位于新疆伊犁河谷中部的伊宁县天山花海景区是国内薰衣草连片种植面积最大的薰衣草基地。这两天,当地2.2...
奇瑞集团5月销售汽车20.57... 人民财讯6月2日电,奇瑞集团消息,奇瑞集团2025年5月销售汽车20.57万辆,同比增长9.1%。其...
【特稿】一堂课、一座桥、一程游... “天津的企业给我们出资建设温室大棚,又手把手地教我们种植技术,还主动为我们的农产品找销路,实在太感谢...
一堂课、一座桥、一程游、一束菇... 转自:津云庆阳与天津相隔千山万水,但“对口帮扶”让两座城市亲如兄弟。海河之水悄然润泽着董志塬的沟壑,...
华仁药业:持股5%以上股东华仁... 华仁药业6月2日公告,公司持股5%以上股东华仁世纪集团计划自2025年6月24日至2025年9月23...
“苏超”火了!网友:没有人情世... 转自:宁波晚报足球世界里,太多夹杂着底蕴比拼与恩怨情仇的高手过招,被冠以“德比”之名而享誉全球——意...
A股千亿级研发投入行业:建筑行...   在科技自立自强与产业链升级的双重驱动下,A股上市公司的研发投入正成为观察中国经济动能转换的关键窗...
适合一个人干的小生意,夫妻店创...   嗨,我的朋友们。夫妻可以做生意吗      一起?对于做小生意,没问题。      但是做大生意...