PyTorch手把手教你复现LeNet：从MNIST数据集到模型训练完整流程

张

张建站

2026/4/29 3:00:54

10分钟阅读

PyTorch实战从零复现LeNet-5模型与MNIST手写数字识别在深度学习领域卷积神经网络(CNN)是图像识别任务的基础架构。1998年由Yann LeCun提出的LeNet-5作为最早的CNN之一至今仍是入门计算机视觉的经典案例。本文将带您完整实现LeNet-5模型从数据集加载到训练可视化构建一个端到端的深度学习项目。1. 环境准备与数据加载首先确保已安装PyTorch和必要的依赖库。推荐使用Python 3.8环境和最新稳定版的PyTorchpip install torch torchvision matplotlib numpyMNIST数据集包含60,000张训练图像和10,000张测试图像每张都是28x28像素的手写数字灰度图。PyTorch的torchvision提供了便捷的加载方式import torch from torchvision import datasets, transforms # 定义数据预处理 transform transforms.Compose([ transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,)) ]) # 下载并加载数据集 train_set datasets.MNIST(data, trainTrue, downloadTrue, transformtransform) test_set datasets.MNIST(data, trainFalse, transformtransform) # 创建数据加载器 train_loader torch.utils.data.DataLoader(train_set, batch_size64, shuffleTrue) test_loader torch.utils.data.DataLoader(test_set, batch_size1000, shuffleFalse)提示数据标准化(减去均值0.5并除以标准差0.5)有助于模型更快收敛。批量大小(batch_size)可根据GPU内存调整。2. LeNet-5模型实现原始LeNet-5架构包含两个卷积层和三个全连接层。我们根据MNIST图像尺寸(28x28)稍作调整import torch.nn as nn import torch.nn.functional as F class LeNet5(nn.Module): def __init__(self): super(LeNet5, self).__init__() self.conv1 nn.Conv2d(1, 6, 5, padding2) # 输入1通道输出6通道5x5卷积核 self.pool1 nn.AvgPool2d(2, stride2) # 2x2平均池化 self.conv2 nn.Conv2d(6, 16, 5) # 输入6通道输出16通道 self.pool2 nn.AvgPool2d(2, stride2) self.fc1 nn.Linear(16*5*5, 120) # 第一个全连接层 self.fc2 nn.Linear(120, 84) # 第二个全连接层 self.fc3 nn.Linear(84, 10) # 输出层10个类别 def forward(self, x): x self.pool1(F.tanh(self.conv1(x))) # 卷积激活池化 x self.pool2(F.tanh(self.conv2(x))) x x.view(-1, 16*5*5) # 展平特征图 x F.tanh(self.fc1(x)) # 全连接激活 x F.tanh(self.fc2(x)) x self.fc3(x) # 输出层不使用激活函数 return x关键改进点使用padding2保持第一个卷积后的特征图尺寸不变采用tanh激活函数而非原始论文中的sigmoid平均池化(AvgPool)替代原始的最大池化(MaxPool)3. 训练流程与超参数配置模型训练需要定义损失函数和优化器并实现训练循环device torch.device(cuda if torch.cuda.is_available() else cpu) model LeNet5().to(device) criterion nn.CrossEntropyLoss() optimizer torch.optim.SGD(model.parameters(), lr0.01, momentum0.9) def train(epoch): model.train() train_loss 0 correct 0 total 0 for batch_idx, (inputs, targets) in enumerate(train_loader): inputs, targets inputs.to(device), targets.to(device) optimizer.zero_grad() outputs model(inputs) loss criterion(outputs, targets) loss.backward() optimizer.step() train_loss loss.item() _, predicted outputs.max(1) total targets.size(0) correct predicted.eq(targets).sum().item() acc 100.*correct/total print(fEpoch: {epoch} | Loss: {train_loss/(batch_idx1):.3f} | Acc: {acc:.2f}%) return train_loss/(batch_idx1), acc超参数选择建议参数推荐值说明学习率(lr)0.01-0.1可配合学习率调度器调整动量(momentum)0.9加速收敛批量大小(batch_size)64-256根据显存调整训练轮数(epochs)10-20观察验证集表现4. 模型评估与可视化训练过程中需要监控模型在测试集上的表现def test(): model.eval() test_loss 0 correct 0 total 0 with torch.no_grad(): for batch_idx, (inputs, targets) in enumerate(test_loader): inputs, targets inputs.to(device), targets.to(device) outputs model(inputs) loss criterion(outputs, targets) test_loss loss.item() _, predicted outputs.max(1) total targets.size(0) correct predicted.eq(targets).sum().item() acc 100.*correct/total print(fTest Loss: {test_loss/(batch_idx1):.3f} | Acc: {acc:.2f}%) return test_loss/(batch_idx1), acc使用Matplotlib可视化训练过程import matplotlib.pyplot as plt train_losses, train_accs [], [] test_losses, test_accs [], [] for epoch in range(1, 11): train_loss, train_acc train(epoch) test_loss, test_acc test() train_losses.append(train_loss) train_accs.append(train_acc) test_losses.append(test_loss) test_accs.append(test_acc) # 绘制损失曲线 plt.figure(figsize(12, 4)) plt.subplot(1, 2, 1) plt.plot(train_losses, labelTrain) plt.plot(test_losses, labelTest) plt.title(Loss Curve) plt.legend() # 绘制准确率曲线 plt.subplot(1, 2, 2) plt.plot(train_accs, labelTrain) plt.plot(test_accs, labelTest) plt.title(Accuracy Curve) plt.legend() plt.show()典型训练结果分析10个epoch后测试准确率可达98%以上损失曲线应平稳下降避免剧烈波动训练和测试准确率差距过大可能表明过拟合5. 模型优化与调试技巧当模型表现不佳时可尝试以下优化策略学习率调整方案scheduler torch.optim.lr_scheduler.StepLR(optimizer, step_size5, gamma0.1) # 在每个epoch后调用 scheduler.step()常见问题排查清单数据预处理是否正确检查图像归一化范围确认标签是否正确对应模型结构是否合理检查各层输入输出维度验证前向传播计算训练过程是否正常监控初始损失值观察参数更新幅度高级改进方向使用ReLU激活函数替代tanh添加Batch Normalization层尝试不同的优化器(如Adam)实现数据增强(旋转、平移等)# 数据增强示例 transform_aug transforms.Compose([ transforms.RandomRotation(10), transforms.RandomAffine(0, translate(0.1, 0.1)), transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,)) ])在实际项目中保存和加载模型是必要技能# 保存模型 torch.save(model.state_dict(), lenet5_mnist.pth) # 加载模型 model LeNet5().to(device) model.load_state_dict(torch.load(lenet5_mnist.pth)) model.eval()通过这个完整实现您不仅掌握了LeNet-5的核心结构还建立了深度学习项目开发的标准化流程。这种端到端的实践方法可以迁移到更复杂的计算机视觉任务中。

2026天津营业执照代办服务市场观察与选择要点

近期，基于对天津本地企业服务反馈的梳理，发现当前天津营业执照代办市场存在价格透明度不一、办理效率差异、合规风险参差不齐等现象。以下是从行业视角整理的服务选择要点，供企业参考。一、市场服务概况目前市场上提供营业执照代办的服务机构…...

2026/4/29 2:56:56 阅读更多 →

Python自动化脚本并发控制实战

想同时处理1000个任务，却担心内存爆炸？想让下载速度翻倍，又怕被服务器封IP？本文详细介绍Python中的并发编程技术——从threading到asyncio，从进程池到协程，让你轻松掌握高并发场景下的Python自动化脚本开发。什么时候需要并发并发编程不是银弹，滥用反而会让代码更复…...

2026/4/29 2:54:24 阅读更多 →

C# 运动控制流程引擎：实现类 PLC 的启动与暂停功能

前言工业自动化领域，可编程逻辑控制器（PLC）长期承担着流程控制的核心角色。然而，随着上位机性能的提升和运动控制卡功能的增强，越来越多的中小型设备开始尝试用 PC 软件的方式替代传统 PLC，以获得更高的灵…...

2026/4/29 2:48:26 阅读更多 →

如何在7分钟内搭建专业级仓库管理系统：从零到生产就绪的完整指南

如何在7分钟内搭建专业级仓库管理系统：从零到生产就绪的完整指南【免费下载链接】GreaterWMS This Inventory management system is the currently Ford Asia Pacific after-sales logistics warehousing supply chain process . After I leave Ford , I start thi…...

2026/4/28 6:15:44 阅读更多 →

星露谷物语模组加载器SMAPI：轻松打造个性化农场体验的终极指南

星露谷物语模组加载器SMAPI：轻松打造个性化农场体验的终极指南【免费下载链接】SMAPI The modding API for Stardew Valley. 项目地址: https://gitcode.com/gh_mirrors/smap/SMAPI 想要为《星露谷物语》添加无限乐趣，却担心模组安装复杂、游戏崩…...

2026/4/26 0:01:52 阅读更多 →

终极指南：4步构建专业级浏览器资源捕获与管理工作流

终极指南：4步构建专业级浏览器资源捕获与管理工作流【免费下载链接】cat-catch 猫抓浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 猫抓（cat-catch&#x…...

2026/4/26 0:04:21 阅读更多 →