- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【万字详文介绍】：迭代扩张卷积神经网络（IDCNN）

小馒头学Python 发表于 2024/11/22 21:37:13 2024/11/22

【摘要】 🍀引言在深度学习的快速发展中，卷积神经网络（CNN）在图像处理领域表现卓越。然而，处理序列数据（如语音或文本）时，IDCNN（空洞卷积网络）作为一种新兴的模型，展现出优越的性能。本博客将介绍IDCNN的基本概念及其应用实践，帮助您理解并实践这一高效的模型。 🍀IDCNN概述IDCNN，即空洞卷积网络（Iterated Dilated Convolutional Neural Netwo...

🍀引言

在深度学习的快速发展中，卷积神经网络（CNN）在图像处理领域表现卓越。然而，处理序列数据（如语音或文本）时，IDCNN（空洞卷积网络）作为一种新兴的模型，展现出优越的性能。本博客将介绍IDCNN的基本概念及其应用实践，帮助您理解并实践这一高效的模型。

🍀IDCNN概述

IDCNN，即空洞卷积网络（Iterated Dilated Convolutional Neural Network），是一种结合了深度卷积层和序列数据处理的新型模型。传统的RNN模型在处理长序列数据时易受梯度消失和梯度爆炸的影响，导致计算效率低下。而IDCNN通过空洞卷积的结构设计，能够在保持高效计算的同时，捕捉到序列中的长距离依赖特性，非常适合用于自然语言处理和序列数据分析等任务。

🍀特点与优势

IDCNN的独特之处在于其网络结构设计，主要体现在以下几个方面：

长距离依赖性：IDCNN利用空洞卷积能够在不增加计算量的情况下扩展感受野，有效捕捉序列数据中的长距离依赖。
高效性：相较于传统的RNN模型，IDCNN在计算上更为高效。它避免了循环结构带来的顺序依赖问题，因此可以实现并行计算。
灵活性：IDCNN支持增量学习，可在数据逐步增多的情况下动态更新模型结构和参数，适应更多样化的应用场景。## 🍀网络结构

长距离依赖性：IDCNN能够有效捕捉序列数据中的长距离依赖。
高效性：与传统的RNN相比，IDCNN在计算上更为高效，适合并行处理。
灵活性：支持增量学习，可以动态更新模型。

🍀网络结构

IDCNN的网络结构通常由多个卷积层和激活函数组成。这些卷积层采用空洞卷积的形式，通过逐层堆叠和扩展感受野的方式，捕捉输入数据中的时序特征。同时，IDCNN可以灵活地与其他网络模块（如CRF层）结合，以实现更精细的序列标注任务。

🍀实践IDCNN

🍀环境准备

在开始构建IDCNN模型前，首先需要配置必要的深度学习环境。常用的Python库包括：

PyTorch：用于构建深度学习模型。
scikit-learn：提供数据处理和评估的基本工具。
NumPy：用于数据处理和矩阵运算。
确保以上库的安装，可以使用以下命令：

pip install torch scikit-learn numpy

🍀数据集选择

IDCNN可以应用于多种序列数据任务中，如文本序列标注、语音识别等。在本文中，我们以自然语言处理中的命名实体识别（NER）任务为例，选择经典的CoNLL-2003数据集。该数据集包含英语句子的序列标注，标签包括人物、地点、组织等实体类型。

🍀加载和预处理数据

加载数据集

dataset = load_dataset("conll2003", trust_remote_code=True)

这里我们加载了 CoNLL-2003 数据集，它是一个常用于命名实体识别（NER）任务的数据集。trust_remote_code=True 参数允许 datasets 库执行远程代码，这在加载该数据集时是必须的。

标签编码

label_encoder = LabelEncoder()
label_encoder.fit([label for labels in dataset['train']['ner_tags'] for label in labels])
num_labels = len(label_encoder.classes_)

这里使用 scikit-learn 中的 LabelEncoder 将 NER 标签（即标注）转换为整数 ID，称为标签编码。num_labels 表示标签的种类数，用于定义模型的输出维度。

构建词汇表

word_to_index = {"<PAD>": 0}
for tokens in dataset["train"]["tokens"]:
    for token in tokens:
        if token not in word_to_index:
            word_to_index[token] = len(word_to_index)

我们通过 word_to_index 字典为每个唯一单词分配一个整数 ID。特殊标记 “<PAD>” 用于填充短句子，它的 ID 为 0。这个词汇表帮助我们将单词转换为整数索引。

数据预处理函数

def preprocess_data(split):
    sentences = []
    labels = []
    max_len = 50  # 假设每个句子都填充或截断到长度为50

    for item in dataset[split]:
        tokens = item['tokens']
        ner_tags = item['ner_tags']

        token_ids = [word_to_index.get(token, 0) for token in tokens]
        label_ids = label_encoder.transform(ner_tags)

        if len(token_ids) > max_len:
            token_ids = token_ids[:max_len]
            label_ids = label_ids[:max_len]
        else:
            token_ids = token_ids + [0] * (max_len - len(token_ids))
            label_ids = list(label_ids) + [0] * (max_len - len(label_ids))

        sentences.append(token_ids)
        labels.append(label_ids)

    return torch.tensor(sentences), torch.tensor(labels)

preprocess_data 函数的主要功能是：

使用 word_to_index 将单词转换为整数 ID。
使用 label_encoder 将标签转换为整数 ID。
将每个句子填充或截断至固定长度 max_len（这里假设为 50），确保输入尺寸一致。

🍀准备训练和测试数据

X_train, y_train = preprocess_data("train")
X_test, y_test = preprocess_data("test")

train_dataset = TensorDataset(X_train, y_train)
test_dataset = TensorDataset(X_test, y_test)

train_loader = DataLoader(train_dataset, batch_size=16, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=16)

我们对训练和测试集分别进行了预处理，并创建了 TensorDataset 对象。然后用 DataLoader 包装这些数据集，以便在训练过程中能够方便地进行批量处理和随机打乱。

🍀 定义 IDCNN 模型

class IDCNN(nn.Module):
    def __init__(self, input_dim, hidden_dim, output_dim):
        super(IDCNN, self).__init__()
        self.embedding = nn.Embedding(input_dim, hidden_dim)
        self.conv1 = nn.Conv1d(hidden_dim, hidden_dim, kernel_size=3, dilation=1, padding=1)
        self.conv2 = nn.Conv1d(hidden_dim, hidden_dim, kernel_size=3, dilation=2, padding=2)
        self.conv3 = nn.Conv1d(hidden_dim, hidden_dim, kernel_size=3, dilation=4, padding=4)
        self.fc = nn.Linear(hidden_dim, output_dim)

IDCNN 模型（膨胀卷积网络）定义了一个嵌入层和多个卷积层，其中卷积层使用不同的膨胀率（dilation）来捕捉不同长度的特征。

self.embedding：嵌入层，将输入的单词索引映射到一个 hidden_dim 维度的嵌入向量。
self.conv1、self.conv2、self.conv3：三层卷积，分别具有不同的膨胀率（1、2 和 4），以捕捉不同的上下文信息。
self.fc：全连接层，将卷积层的输出映射到标签空间，输出维度为 output_dim。

前向传播

def forward(self, x):
    x = self.embedding(x)  # (batch_size, sequence_length, hidden_dim)
    x = x.permute(0, 2, 1)  # 转换维度以适应Conv1d
    x = torch.relu(self.conv1(x))
    x = torch.relu(self.conv2(x))
    x = torch.relu(self.conv3(x))
    x = x.permute(0, 2, 1)  # 转换维度以适应全连接层
    x = self.fc(x)
    return x

前向传播过程中：

使用嵌入层将输入转换为嵌入向量。
使用三层膨胀卷积提取特征。
使用全连接层将特征映射到输出空间。

🍀模型训练

for epoch in range(num_epochs):
    model.train()
    total_loss = 0
    for inputs, labels in train_loader:
        optimizer.zero_grad()
        outputs = model(inputs)
        outputs = outputs.view(-1, output_dim)
        labels = labels.view(-1)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        total_loss += loss.item()
    print(f"Epoch [{epoch + 1}/{num_epochs}], Loss: {total_loss / len(train_loader):.4f}")

在训练过程中：

optimizer.zero_grad() 清除上一步的梯度。
outputs 将模型输出调整为 (batch_size * sequence_length, output_dim) 以便于计算损失。
oss.backward() 反向传播计算梯度。
optimizer.step() 更新模型参数。
每个 epoch 结束后打印平均损失。

🍀模型评估

model.eval()
all_preds = []
all_labels = []

with torch.no_grad():
    for inputs, labels in test_loader:
        outputs = model(inputs)
        outputs = outputs.view(-1, output_dim)
        _, preds = torch.max(outputs, dim=1)
        all_preds.extend(preds.cpu().numpy())
        all_labels.extend(labels.view(-1).cpu().numpy())

在评估阶段，关闭梯度计算以提高效率。我们获取每个输入的预测标签，并将其保存到 all_preds 中，用于后续的评估。

删除填充部分

true_labels = [label for label, pred in zip(all_labels, all_preds) if label != 0]
true_preds = [pred for label, pred in zip(all_labels, all_preds) if label != 0]

由于使用了填充，我们需要将填充的标签去除，仅保留真实标签。

输出分类报告

print(classification_report(true_labels, true_preds, target_names=[str(label) for label in label_encoder.classes_], zero_division=0))

使用 classification_report 打印分类报告，显示每个标签的精确度、召回率和 F1 分数。这些指标帮助我们评估模型的表现。

这样整个代码就完成了。这个流程实现了一个简单的命名实体识别模型，并在 CoNLL-2003 数据集上进行训练和评估，接下来我会将完整的代码放到下面，并在结尾附上使用CNN的评估结果供大家对比参考~

🍀完整的模型代码（示例跑着玩）

下面使用的数据是自定义的数据

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset
from sklearn.metrics import classification_report
import numpy as np

# 定义IDCNN模型
class IDCNN(nn.Module):
    def __init__(self, input_dim, hidden_dim, output_dim):
        super(IDCNN, self).__init__()
        # 三层空洞卷积，使用不同的dilation值
        self.conv1 = nn.Conv1d(input_dim, hidden_dim, kernel_size=3, dilation=1, padding=1)
        self.conv2 = nn.Conv1d(hidden_dim, hidden_dim, kernel_size=3, dilation=2, padding=2)
        self.conv3 = nn.Conv1d(hidden_dim, hidden_dim, kernel_size=3, dilation=4, padding=4)
        # 全连接层，用于输出最终的类别
        self.fc = nn.Linear(hidden_dim, output_dim)

    def forward(self, x):
        # 输入x的维度为 (batch_size, input_dim, sequence_length)
        x = torch.relu(self.conv1(x))
        x = torch.relu(self.conv2(x))
        x = torch.relu(self.conv3(x))
        # 对卷积输出维度进行平均池化，减少维度
        x = x.mean(dim=2)
        x = self.fc(x)
        return x

# 生成一些假数据，模拟序列标注任务
# 假设输入维度为128，隐藏层维度为256，输出类别数为10
input_dim = 128
hidden_dim = 256
output_dim = 10
sequence_length = 50
batch_size = 16
num_epochs = 10

# 创建随机的数据和标签
X_train = torch.randn(1000, input_dim, sequence_length)  # 1000个样本
y_train = torch.randint(0, output_dim, (1000,))          # 每个样本对应一个标签
X_test = torch.randn(200, input_dim, sequence_length)    # 200个测试样本
y_test = torch.randint(0, output_dim, (200,))            # 每个测试样本对应一个标签

# 创建数据加载器
train_dataset = TensorDataset(X_train, y_train)
train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
test_dataset = TensorDataset(X_test, y_test)
test_loader = DataLoader(test_dataset, batch_size=batch_size)

# 初始化模型、损失函数和优化器
model = IDCNN(input_dim=input_dim, hidden_dim=hidden_dim, output_dim=output_dim)
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 训练模型
for epoch in range(num_epochs):
    model.train()
    for inputs, labels in train_loader:
        # 前向传播
        outputs = model(inputs)
        loss = criterion(outputs, labels)

        # 反向传播和优化
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

    print(f"Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}")

# 模型评估
model.eval()
all_preds = []
all_labels = []

with torch.no_grad():
    for inputs, labels in test_loader:
        outputs = model(inputs)
        _, preds = torch.max(outputs, dim=1)
        all_preds.extend(preds.cpu().numpy())
        all_labels.extend(labels.cpu().numpy())

# 输出分类报告
print(classification_report(all_labels, all_preds, target_names=[f"Class {i}" for i in range(output_dim)], zero_division=1))

运行结果如下：

🍀完整的模型代码（CoNLL-2003数据集）

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset
from sklearn.metrics import classification_report
from datasets import load_dataset
from sklearn.preprocessing import LabelEncoder
import numpy as np

# 1. 加载并预处理数据

# 加载CoNLL-2003数据集，添加 trust_remote_code=True 参数
dataset = load_dataset("conll2003", trust_remote_code=True)


# 标签编码
label_encoder = LabelEncoder()
label_encoder.fit([label for labels in dataset['train']['ner_tags'] for label in labels])
num_labels = len(label_encoder.classes_)

# 构建词汇表（为了演示简单化，实际应用中建议使用预训练词向量，如GloVe或BERT）
word_to_index = {"<PAD>": 0}
for tokens in dataset["train"]["tokens"]:
    for token in tokens:
        if token not in word_to_index:
            word_to_index[token] = len(word_to_index)


# 数据预处理函数
def preprocess_data(split):
    sentences = []
    labels = []
    max_len = 50  # 假设每个句子都填充或截断到长度为50

    for item in dataset[split]:
        tokens = item['tokens']
        ner_tags = item['ner_tags']

        # 将tokens转换为词ID，labels转换为标签ID
        token_ids = [word_to_index.get(token, 0) for token in tokens]  # 简单示例，使用词ID
        label_ids = label_encoder.transform(ner_tags)

        # 确保 token_ids 和 label_ids 的长度相同
        if len(token_ids) > max_len:
            token_ids = token_ids[:max_len]
            label_ids = label_ids[:max_len]
        else:
            token_ids = token_ids + [0] * (max_len - len(token_ids))
            label_ids = list(label_ids) + [0] * (max_len - len(label_ids))

        sentences.append(token_ids)
        labels.append(label_ids)

    return torch.tensor(sentences), torch.tensor(labels)


# 准备训练和测试数据
X_train, y_train = preprocess_data("train")
X_test, y_test = preprocess_data("test")

train_dataset = TensorDataset(X_train, y_train)
test_dataset = TensorDataset(X_test, y_test)

train_loader = DataLoader(train_dataset, batch_size=16, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=16)


# 2. 定义IDCNN模型
class IDCNN(nn.Module):
    def __init__(self, input_dim, hidden_dim, output_dim):
        super(IDCNN, self).__init__()
        self.embedding = nn.Embedding(input_dim, hidden_dim)
        self.conv1 = nn.Conv1d(hidden_dim, hidden_dim, kernel_size=3, dilation=1, padding=1)
        self.conv2 = nn.Conv1d(hidden_dim, hidden_dim, kernel_size=3, dilation=2, padding=2)
        self.conv3 = nn.Conv1d(hidden_dim, hidden_dim, kernel_size=3, dilation=4, padding=4)
        self.fc = nn.Linear(hidden_dim, output_dim)

    def forward(self, x):
        x = self.embedding(x)  # (batch_size, sequence_length, hidden_dim)
        x = x.permute(0, 2, 1)  # 转换维度以适应Conv1d
        x = torch.relu(self.conv1(x))
        x = torch.relu(self.conv2(x))
        x = torch.relu(self.conv3(x))
        x = x.permute(0, 2, 1)  # 转换维度以适应全连接层
        x = self.fc(x)
        return x


# 参数设置
input_dim = len(word_to_index)
hidden_dim = 128
output_dim = num_labels
num_epochs = 5

# 初始化模型、损失函数和优化器
model = IDCNN(input_dim=input_dim, hidden_dim=hidden_dim, output_dim=output_dim)
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 3. 训练模型
for epoch in range(num_epochs):
    model.train()
    total_loss = 0
    for inputs, labels in train_loader:
        optimizer.zero_grad()
        outputs = model(inputs)
        outputs = outputs.view(-1, output_dim)
        labels = labels.view(-1)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        total_loss += loss.item()
    print(f"Epoch [{epoch + 1}/{num_epochs}], Loss: {total_loss / len(train_loader):.4f}")

# 4. 模型评估
model.eval()
all_preds = []
all_labels = []

with torch.no_grad():
    for inputs, labels in test_loader:
        outputs = model(inputs)
        outputs = outputs.view(-1, output_dim)
        _, preds = torch.max(outputs, dim=1)
        all_preds.extend(preds.cpu().numpy())
        all_labels.extend(labels.view(-1).cpu().numpy())

# 删除填充部分的标签和预测
true_labels = [label for label, pred in zip(all_labels, all_preds) if label != 0]
true_preds = [pred for label, pred in zip(all_labels, all_preds) if label != 0]

# 输出分类报告
print(classification_report(true_labels, true_preds, target_names=[str(label) for label in label_encoder.classes_], zero_division=0))

运行代码如下：

🍀完整的模型代码（CoNLL-2003数据集）（CNN版）

要将模型从 IDCNN（膨胀卷积神经网络）更改为普通的CNN，只需去掉膨胀率设置，将卷积层的 dilation 参数设置为 1（即默认值）。普通的CNN可以通过堆叠多个卷积层来实现。

我们将 IDCNN 类改名为 CNN。
在每个卷积层（conv1、conv2 和 conv3）中，去掉了 dilation 参数（默认为1），并保持了 padding=1。这样，每个卷积层会像普通的卷积操作那样，只关注相邻元素。

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset
from sklearn.metrics import classification_report
from datasets import load_dataset
from sklearn.preprocessing import LabelEncoder
import numpy as np

# 1. 加载并预处理数据

# 加载CoNLL-2003数据集，添加 trust_remote_code=True 参数
dataset = load_dataset("conll2003", trust_remote_code=True)

# 标签编码
label_encoder = LabelEncoder()
label_encoder.fit([label for labels in dataset['train']['ner_tags'] for label in labels])
num_labels = len(label_encoder.classes_)

# 构建词汇表（为了演示简单化，实际应用中建议使用预训练词向量，如GloVe或BERT）
word_to_index = {"<PAD>": 0}
for tokens in dataset["train"]["tokens"]:
    for token in tokens:
        if token not in word_to_index:
            word_to_index[token] = len(word_to_index)

# 数据预处理函数
def preprocess_data(split):
    sentences = []
    labels = []
    max_len = 50  # 假设每个句子都填充或截断到长度为50

    for item in dataset[split]:
        tokens = item['tokens']
        ner_tags = item['ner_tags']

        # 将tokens转换为词ID，labels转换为标签ID
        token_ids = [word_to_index.get(token, 0) for token in tokens]  # 简单示例，使用词ID
        label_ids = label_encoder.transform(ner_tags)

        # 确保 token_ids 和 label_ids 的长度相同
        if len(token_ids) > max_len:
            token_ids = token_ids[:max_len]
            label_ids = label_ids[:max_len]
        else:
            token_ids = token_ids + [0] * (max_len - len(token_ids))
            label_ids = list(label_ids) + [0] * (max_len - len(label_ids))

        sentences.append(token_ids)
        labels.append(label_ids)

    return torch.tensor(sentences), torch.tensor(labels)

# 准备训练和测试数据
X_train, y_train = preprocess_data("train")
X_test, y_test = preprocess_data("test")

train_dataset = TensorDataset(X_train, y_train)
test_dataset = TensorDataset(X_test, y_test)

train_loader = DataLoader(train_dataset, batch_size=16, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=16)

# 2. 定义普通CNN模型
class CNN(nn.Module):
    def __init__(self, input_dim, hidden_dim, output_dim):
        super(CNN, self).__init__()
        self.embedding = nn.Embedding(input_dim, hidden_dim)
        # 普通卷积网络，不使用膨胀卷积
        self.conv1 = nn.Conv1d(hidden_dim, hidden_dim, kernel_size=3, padding=1)
        self.conv2 = nn.Conv1d(hidden_dim, hidden_dim, kernel_size=3, padding=1)
        self.conv3 = nn.Conv1d(hidden_dim, hidden_dim, kernel_size=3, padding=1)
        self.fc = nn.Linear(hidden_dim, output_dim)

    def forward(self, x):
        x = self.embedding(x)  # (batch_size, sequence_length, hidden_dim)
        x = x.permute(0, 2, 1)  # 转换维度以适应Conv1d
        x = torch.relu(self.conv1(x))
        x = torch.relu(self.conv2(x))
        x = torch.relu(self.conv3(x))
        x = x.permute(0, 2, 1)  # 转换维度以适应全连接层
        x = self.fc(x)
        return x

# 参数设置
input_dim = len(word_to_index)
hidden_dim = 128
output_dim = num_labels
num_epochs = 5

# 初始化普通CNN模型、损失函数和优化器
model = CNN(input_dim=input_dim, hidden_dim=hidden_dim, output_dim=output_dim)
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 3. 训练模型
for epoch in range(num_epochs):
    model.train()
    total_loss = 0
    for inputs, labels in train_loader:
        optimizer.zero_grad()
        outputs = model(inputs)
        outputs = outputs.view(-1, output_dim)
        labels = labels.view(-1)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        total_loss += loss.item()
    print(f"Epoch [{epoch + 1}/{num_epochs}], Loss: {total_loss / len(train_loader):.4f}")

# 4. 模型评估
model.eval()
all_preds = []
all_labels = []

with torch.no_grad():
    for inputs, labels in test_loader:
        outputs = model(inputs)
        outputs = outputs.view(-1, output_dim)
        _, preds = torch.max(outputs, dim=1)
        all_preds.extend(preds.cpu().numpy())
        all_labels.extend(labels.view(-1).cpu().numpy())

# 删除填充部分的标签和预测
true_labels = [label for label, pred in zip(all_labels, all_preds) if label != 0]
true_preds = [pred for label, pred in zip(all_labels, all_preds) if label != 0]

# 输出分类报告
print(classification_report(true_labels, true_preds, target_names=[str(label) for label in label_encoder.classes_], zero_division=0))

运行结果如下：

🍀对比实验（CoNLL-2003数据集）

模型	Precision	Recall	F1-Score
CNN	0.83	0.49	0.60
IDCNN	0.82	0.53	0.64

从结果来看，IDCNN 的召回率和 F1-Score 略优于 CNN，显示出 IDCNN 模型在捕捉命名实体的特征方面具有一定优势。

🍀结论

IDCNN作为一种新兴的序列数据处理模型，凭借其高效性和灵活性在自然语言处理、语音识别等领域展现出广泛的应用潜力。通过空洞卷积的结构设计，IDCNN可以在保证计算效率的同时捕捉长距离依赖关系，为序列标注任务提供了有效的解决方案。

🍀参考文献

Yu, F., & Koltun, V. (2016). Multi-Scale Context Aggregation by Dilated Convolutions. arXiv preprint arXiv:1511.07122.
Ma, J., & Hovy, E. (2016). End-to-end sequence labeling via bi-directional LSTM-CNNs-CRF. arXiv preprint arXiv:1603.01354.
He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep residual learning for image recognition. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 770-778).

挑战与创造都是很痛苦的，但是很充实。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

【万字详文介绍】：迭代扩张卷积神经网络（IDCNN）

🍀引言

🍀IDCNN概述

🍀特点与优势

🍀网络结构

🍀实践IDCNN

🍀环境准备

🍀数据集选择

🍀加载和预处理数据

🍀准备训练和测试数据

🍀 定义 IDCNN 模型

🍀模型训练

🍀模型评估

🍀完整的模型代码（示例跑着玩）

🍀完整的模型代码（CoNLL-2003数据集）

🍀完整的模型代码（CoNLL-2003数据集）（CNN版）

🍀对比实验（CoNLL-2003数据集）

🍀结论

🍀参考文献

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

【万字详文介绍】：迭代扩张卷积神经网络（IDCNN）

🍀引言

🍀IDCNN概述

🍀特点与优势

🍀网络结构

🍀实践IDCNN

🍀环境准备

🍀数据集选择

🍀加载和预处理数据

🍀准备训练和测试数据

🍀 定义 IDCNN 模型

🍀模型训练

🍀模型评估

🍀完整的模型代码（示例跑着玩）

🍀完整的模型代码（CoNLL-2003数据集）

🍀完整的模型代码（CoNLL-2003数据集）（CNN版）

🍀对比实验（CoNLL-2003数据集）

🍀结论

🍀参考文献

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品