[Model] add dfad-gnn (#212)

xy-Ji · gyzhou2000 · web-flow · commit 66bd9b2daacc · 2024-07-09T17:36:04.000+08:00
* [Model] add dfad-gnn

* update trainer

* update train_student.py

* update train_student.py

* update train_student.py

* add readme

* update readme.md

* update

---------

Co-authored-by: gyzhou2000 &lt;gyzhou2000@gmail.com&gt;
diff --git a/examples/dfad_gnn/readme.md b/examples/dfad_gnn/readme.md
@@ -0,0 +1,26 @@
+# Data-Free Adversarial Knowledge Distillation for Graph Neural Networks
+
+- Paper link: [https://arxiv.org/pdf/2205.03811](https://arxiv.org/pdf/2205.03811)
+- Author's code repo: [https://anonymous.4open.science/r/DF-GNNs-EC75](https://anonymous.4open.science/r/DF-GNNs-EC75)
+
+# Dataset Statics
+| Dataset  | # Graphs | # Nodes | # Edges | # Features | # Classes |
+| -------- | -------- | ------- | ------- | ---------- | --------- |
+| MUTAG    | 188      | ~17.9   | ~39.6   | 7          | 2         |
+
+Refer to [TUDataset](https://gammagl.readthedocs.io/en/latest/generated/gammagl.datasets.TUDataset.html).
+
+# Results
+
+```bash
+TL_BACKEND="torch" python train_teacher.py --dataset MUTAG 
+TL_BACKEND="torch" python train_student.py --dataset MUTAG --student gcn
+TL_BACKEND="torch" python train_student.py --dataset MUTAG --student gin
+```
+
+| Dataset    | Student Model | Paper      | Our(th)    |
+| ---------  | ------------- | ---------- | ---------- |
+| MUTAG      | gcn           | 76.2%      | 88.2%      |
+| MUTAG      | gin           | 90.8%      | 88.2%      |
+| MUTAG      | gat           | 79.5%      | 88.2%      |
+| MUTAG      | graphsage     | 79.1%      | 88.2%      |
diff --git a/examples/dfad_gnn/train_student.py b/examples/dfad_gnn/train_student.py
@@ -0,0 +1,230 @@
+import os
+# os.environ['CUDA_VISIBLE_DEVICES'] = '0'
+# os.environ['TL_BACKEND'] = 'torch'
+os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2' 
+# 0:Output all; 1:Filter out INFO; 2:Filter out INFO and WARNING; 3:Filter out INFO, WARNING, and ERROR
+
+import argparse
+import tensorlayerx as tlx
+from gammagl.models import GINModel, DFADModel, DFADGenerator
+from gammagl.loader import DataLoader
+from gammagl.data import Graph
+from gammagl.datasets import TUDataset
+from tensorlayerx.model import TrainOneStep, WithLoss
+import numpy 
+import scipy.sparse as sp
+from train_teacher import SemiSpvzLoss
+
+class GeneratorLoss(WithLoss):
+    def __init__(self, net, loss_fn):
+        super(GeneratorLoss, self).__init__(backbone=net, loss_fn=loss_fn)
+
+    def forward(self, student_logits, teacher_logits):
+        loss = -self._loss_fn(student_logits, teacher_logits)
+        return loss
+
+class StudentLoss(WithLoss):
+    def __init__(self, net, loss_fn, batch_size):
+        super(StudentLoss, self).__init__(backbone=net, loss_fn=loss_fn)
+        self.loss_fn = loss_fn
+        self.batch_size = batch_size
+
+    def forward(self, data, label):
+        logits = self.backbone_network(data['x'], data['edge_index'], data['x'].shape[0], data['batch'])
+        loss = self._loss_fn(logits, label)
+        return loss
+
+def dense_to_sparse(adj_mat):
+    adj_mat = tlx.convert_to_numpy(adj_mat)
+    adj_mat = sp.coo_matrix(adj_mat)
+    row = tlx.convert_to_tensor(adj_mat.row, dtype=tlx.int64)
+    col = tlx.convert_to_tensor(adj_mat.col, dtype=tlx.int64)
+    res = tlx.stack((row, col))
+    return res
+
+def Data_construct(batch_size, edges_logits, nodes_logits):
+    nodes_logits = tlx.softmax(nodes_logits, -1)
+    max_indices = tlx.argmax(nodes_logits, axis=2, keepdim=True)
+    nodes_logits = tlx.zeros_like(nodes_logits)
+    for i in range(len(nodes_logits)):  
+        for j in range(len(nodes_logits[0])):  
+            index = max_indices[i, j]
+            nodes_logits[i, j, index] = 1
+    edges_logits = tlx.sigmoid(tlx.cast(edges_logits, dtype=tlx.float32))
+    edges_logits = (edges_logits>0.3).long()
+    data_list = []
+    s=len(nodes_logits)
+    for i in range(s):
+        edge = dense_to_sparse(edges_logits[i])
+        x = nodes_logits[i]
+        data = Graph(x=x, edge_index=edge)
+        # draw(args,data,'filename',i)
+        data_list.append(data)
+    G_data = DataLoader(data_list, batch_size=batch_size, shuffle=False)
+    return G_data
+    
+
+def generate_graph(args, generator):
+    z = tlx.random_normal((args.batch_size, args.nz))  
+    adj, nodes_logits = generator(z) 
+    loader = Data_construct(args.batch_size, adj, nodes_logits)
+    return loader
+
+
+def train_student(args):
+    dataset = TUDataset(args.dataset_path,args.dataset)
+
+    dataset_unit = len(dataset) // 10
+    train_set = dataset[2 * dataset_unit:]
+    val_set = dataset[:dataset_unit]
+    test_set = dataset[dataset_unit: 2 * dataset_unit]
+    
+    train_loader = DataLoader(train_set, batch_size=args.batch_size)
+    val_loader = DataLoader(val_set, batch_size=args.batch_size)
+    test_loader = DataLoader(test_set, batch_size=args.batch_size)
+    
+    
+    teacher = GINModel(
+        in_channels=max(dataset.num_features, 1),
+        hidden_channels=args.t_hidden,
+        out_channels=dataset.num_classes,
+        num_layers=args.t_layers,
+        name="GIN"
+    )
+    
+    student = DFADModel(
+        model_name=args.student,
+        feature_dim=max(dataset.num_features, 1),
+        hidden_dim=args.hidden_units,
+        num_classes=dataset.num_classes,
+        num_layers=args.num_layers,
+        drop_rate=args.student_dropout
+    )
+    
+    
+    #initialize generator
+    x_example = dataset[0].x
+    generator = DFADGenerator([64, 128, 256], args.nz, args.vertexes, dataset.num_features, args.generator_dropout)
+
+    optimizer_s = tlx.optimizers.Adam(lr=args.student_lr, weight_decay=args.student_l2_coef)
+    optimizer_g = tlx.optimizers.Adam(lr=args.generator_lr, weight_decay=args.generator_l2_coef)
+    
+    optimizer = tlx.optimizers.Adam(lr=0.001, weight_decay=5e-4)
+    train_weights = teacher.trainable_weights
+    loss_func = SemiSpvzLoss(teacher, tlx.losses.softmax_cross_entropy_with_logits)
+    train_one_step = TrainOneStep(loss_func, optimizer, train_weights)
+    
+    teacher.set_train()
+    for data in train_loader:
+        train_loss = train_one_step(data, data.y)
+    teacher.set_eval()
+    teacher.load_weights("./teacher_" + args.dataset + ".npz", format='npz_dict')
+
+    student_trainable_weight = student.trainable_weights
+    generator_trainable_weights = generator.trainable_weights
+    s_loss_fun = tlx.losses.L1Loss
+    g_loss_fun = tlx.losses.L1Loss
+
+    s_with_loss = StudentLoss(student, s_loss_fun, args.batch_size)
+
+    g_with_loss = GeneratorLoss(generator, g_loss_fun) 
+    s_train_one_step = TrainOneStep(s_with_loss, optimizer_s, student_trainable_weight)
+    g_train_one_step = TrainOneStep(g_with_loss, optimizer_g, generator_trainable_weights)
+
+    epochs = args.n_epoch
+    student_epoch = args.student_epoch
+    g_epoch = args.g_epoch
+
+    best_acc = 0
+    for epoch in range(epochs):
+        student.set_train()
+        for _ in range(student_epoch):
+            # train student model
+            loader = generate_graph(args, generator)
+            teacher.set_eval()
+            s_loss = 0
+            for data in loader:
+                t_logits = teacher(data.x, data.edge_index, data.batch)
+                s_loss += s_train_one_step(data, t_logits)
+            # print('s_loss:', s_loss)
+        student.set_eval()
+
+        # train generator
+        generator.set_train()
+        for _ in range(g_epoch):
+            z = tlx.random_normal((args.batch_size, args.nz)) 
+            adj, nodes_logits = generator(z)
+            loader = Data_construct(z.shape[0], adj, nodes_logits)
+            g_loss = 0
+            for data in loader:
+                x, edge_index, num_nodes, batch = data.x, data.edge_index, data.num_nodes, data.batch
+                student_logits = student(x, edge_index, num_nodes, batch)
+                teacher_logits = teacher(x, edge_index, batch)
+                student_logits = tlx.nn.Softmax()(student_logits)
+                teacher_logits = tlx.nn.Softmax()(teacher_logits) 
+                g_loss += g_train_one_step(student_logits, teacher_logits)
+            # print('g_loss:', g_loss)
+        generator.set_eval()
+
+        total_correct = 0
+        for data in val_loader:
+            test_logits = student(data.x, data.edge_index, data.x.shape[0], data.batch)
+            teacher_logits = teacher(data.x, data.edge_index, data.batch)
+            pred = tlx.argmax(test_logits, axis=-1)
+            total_correct += int((numpy.sum(tlx.convert_to_numpy(pred == data['y']).astype(int))))
+        test_acc = total_correct / len(val_set)
+
+        if test_acc > best_acc:
+            best_acc = test_acc
+            student.save_weights(args.student + "_" + args.dataset + ".npz", format='npz_dict')
+        print("Epoch [{:0>3d}]  ".format(epoch + 1)
+              + "   acc: {:.4f}".format(test_acc))
+    
+    total_correct = 0
+    for data in test_loader:
+        teacher_logits = teacher(data.x, data.edge_index, data.batch)
+        pred = tlx.argmax(teacher_logits, axis=-1)
+        total_correct += int((numpy.sum(tlx.convert_to_numpy(pred == data['y']).astype(int))))
+    teacher_acc = total_correct / len(test_set)
+    
+    student.load_weights(args.student + "_" + args.dataset + ".npz", format='npz_dict')
+    total_correct = 0
+    for data in test_loader:
+        student_logits = student(data.x, data.edge_index, data.x.shape[0], data.batch)
+        pred = tlx.argmax(student_logits, axis=-1)
+        total_correct += int((numpy.sum(tlx.convert_to_numpy(pred == data['y']).astype(int))))
+    student_acc = total_correct / len(test_set)
+    
+    print('teacher_acc:', teacher_acc)
+    print('student_acc:', student_acc)
+    
+if __name__ == '__main__':
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--student", type=str, default='gcn', help="student model")
+    parser.add_argument("--student_lr", type=float, default=0.005, help="learning rate of student model")
+    parser.add_argument("--generator_lr", type=float, default=0.005, help="learning rate of generator")
+    parser.add_argument("--n_epoch", type=int, default=100, help="number of epoch")
+    parser.add_argument("--student_epoch", type=int, default=5)
+    parser.add_argument("--g_epoch", type=int, default=5)
+    parser.add_argument("--num_layers", type=int, default=5)
+    parser.add_argument("--t_hidden", type=int, default=128, help="dimention of hidden layers of teacher model")
+    parser.add_argument("--t_layers", type=int, default=5)
+    parser.add_argument("--hidden_units", type=int, default=128, help="dimention of hidden layers")
+    parser.add_argument("--student_l2_coef", type=float, default=5e-4, help="l2 loss coeficient for student")
+    parser.add_argument("--generator_l2_coef", type=float, default=5e-4, help="l2 loss coeficient for generator")
+    parser.add_argument('--dataset', type=str, default='MUTAG', help='dataset(MUTAG/IMDB-BINARY/REDDIT-BINARY)')
+    parser.add_argument("--dataset_path", type=str, default=r'', help="path to save dataset")
+    parser.add_argument('--vertexes', type=int, default=40, help='dimension of domain labels')
+    parser.add_argument("--generator_dropout", type=float, default=0.)
+    parser.add_argument("--student_dropout", type=float, default=0.)
+    parser.add_argument("--batch_size", type=int, default=128)
+    parser.add_argument("--nz", type=int, default=32)
+    parser.add_argument("--gpu", type=int, default=0)
+    args = parser.parse_args()
+    
+    if args.gpu >= 0:
+        tlx.set_device("GPU", args.gpu)
+    else:
+        tlx.set_device("CPU")
+    
+    train_student(args)
diff --git a/examples/dfad_gnn/train_teacher.py b/examples/dfad_gnn/train_teacher.py
@@ -0,0 +1,103 @@
+import os
+# os.environ['CUDA_VISIBLE_DEVICES'] = '0'
+# os.environ['TL_BACKEND'] = 'torch'
+os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2' 
+# 0:Output all; 1:Filter out INFO; 2:Filter out INFO and WARNING; 3:Filter out INFO, WARNING, and ERROR
+
+import argparse
+import tensorlayerx as tlx
+from gammagl.models import GINModel
+from gammagl.loader import DataLoader
+from gammagl.datasets import TUDataset
+from tensorlayerx.model import TrainOneStep, WithLoss
+import numpy 
+
+class SemiSpvzLoss(WithLoss):
+    def __init__(self, net, loss_fn):
+        super(SemiSpvzLoss, self).__init__(backbone=net, loss_fn=loss_fn)
+
+    def forward(self, data, y):
+        train_logits = self.backbone_network(data['x'], data['edge_index'], data['batch'])
+        loss = self._loss_fn(train_logits, data['y'])
+        return loss
+
+def train_teacher(args):
+    dataset = TUDataset(args.dataset_path,args.dataset)
+    
+    dataset_unit = len(dataset) // 10
+    train_set = dataset[2 * dataset_unit:]
+    val_set = dataset[:dataset_unit]
+    test_set = dataset[dataset_unit: 2 * dataset_unit]
+    
+    train_loader = DataLoader(train_set, batch_size=args.batch_size)
+    val_loader = DataLoader(val_set, batch_size=args.batch_size)
+    test_loader = DataLoader(test_set, batch_size=args.batch_size)
+    
+    teacher = GINModel(
+        in_channels=max(dataset.num_features, 1),
+        hidden_channels=args.hidden_dim,
+        out_channels=dataset.num_classes,
+        num_layers=args.num_layers,
+        name="GIN"
+    )
+    
+    optimizer = tlx.optimizers.Adam(lr=args.lr, weight_decay=args.l2_coef)
+    train_weights = teacher.trainable_weights
+    loss_func = SemiSpvzLoss(teacher, tlx.losses.softmax_cross_entropy_with_logits)
+    train_one_step = TrainOneStep(loss_func, optimizer, train_weights)
+
+    best_val_acc = 0
+    for epoch in range(args.n_epoch):
+        teacher.set_train()
+
+        for data in train_loader:
+            train_loss = train_one_step(data, data.y)
+
+        teacher.set_eval()
+
+        total_correct = 0
+        for data in val_loader:
+            val_logits = teacher(data.x, data.edge_index, data.batch)
+            pred = tlx.argmax(val_logits, axis=-1)
+            total_correct += int((numpy.sum(tlx.convert_to_numpy(pred == data.y).astype(int))))
+        val_acc = total_correct / len(val_set)
+
+        print("Epoch [{:0>3d}] ".format(epoch + 1) \
+              + "  train loss: {:.4f}".format(train_loss.item()) \
+              + "  val acc: {:.4f}".format(val_acc))
+        
+        if val_acc > best_val_acc:
+            best_val_acc = val_acc
+            teacher.save_weights("./teacher_" + args.dataset + ".npz", format='npz_dict')
+    
+    teacher.load_weights("./teacher_" + args.dataset + ".npz", format='npz_dict', skip=True)
+    teacher.set_eval()
+    total_correct = 0
+    for data in test_loader:
+        test_logits = teacher(data.x, data.edge_index, data.batch)
+        pred = tlx.argmax(test_logits, axis=-1)
+        total_correct += int((numpy.sum(tlx.convert_to_numpy(pred == data['y']).astype(int))))
+    test_acc = total_correct / len(test_set)
+
+    print("Test acc:  {:.4f}".format(test_acc))
+
+
+if __name__ == '__main__':
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--n_epoch", type=int, default=1000, help="number of epoch")
+    parser.add_argument("--lr", type=float, default=0.001, help="learning rate")
+    parser.add_argument("--num_layers", type=int, default=5)
+    parser.add_argument("--hidden_dim", type=int, default=128, help="dimention of hidden layers")
+    parser.add_argument("--l2_coef", type=float, default=5e-4, help="l2 loss coeficient")
+    parser.add_argument('--dataset', type=str, default='MUTAG', help='dataset(MUTAG/IMDB-BINARY/REDDIT-BINARY)')
+    parser.add_argument("--dataset_path", type=str, default=r'', help="path to save dataset")
+    parser.add_argument("--batch_size", type=int, default=128)
+    parser.add_argument("--gpu", type=int, default=0)
+    args = parser.parse_args()
+    
+    if args.gpu >= 0:
+        tlx.set_device("GPU", args.gpu)
+    else:
+        tlx.set_device("CPU")
+
+    train_teacher(args)
diff --git a/gammagl/models/__init__.py b/gammagl/models/__init__.py
@@ -59,6 +59,7 @@
 from .hid_net import Hid_net
 from .gnnlfhf import GNNLFHFModel
 from .dna import DNAModel
+from .dfad import DFADModel, DFADGenerator
 
 __all__ = [
     'HeCo',
@@ -123,7 +124,9 @@
     'hid_net',
     'HEAT',
     'GNNLFHFModel',
-    'DNAModel'
+    'DNAModel',
+    'DFADModel',
+    'DFADGenerator'
 ]
 
 classes = __all__
diff --git a/gammagl/models/dfad.py b/gammagl/models/dfad.py