一文搞懂CNN经典架构-EfficientNet！

张

张建站

2026/5/17 13:10:27

10分钟阅读

推荐直接网站在线阅读https://aicoting.cn随着深度学习的发展CNN 的精度不断提升但代价是网络越来越深、参数越来越多。例如 VGG-19 有 144M 参数ResNet-152 计算量达到 11.3 GFLOPs。这在实际应用如移动端推理中非常昂贵。2019 年谷歌团队提出 EfficientNet其核心思想是通过一种系统化的复合缩放Compound Scaling方法在计算量可控的前提下提升模型精度。EfficientNet 在 ImageNet 上取得了 SOTA 性能同时参数量和计算量都显著减少。核心思想传统 CNN 的扩展方式主要有三种加深Depth增加网络层数。加宽Width增加每层的通道数。加大分辨率Resolution输入更高分辨率的图像。但简单地单独扩展某一个维度往往无法获得最优效果。EfficientNet 提出复合缩放公式d e p t h α ϕ , w i d t h β ϕ , r e s o l u t i o n γ ϕ depth \alpha^\phi, \quad width \beta^\phi, \quad resolution \gamma^\phidepthαϕ,widthβϕ,resolutionγϕ其中α , β , γ \alpha, \beta, \gammaα,β,γ是常数超参数用来控制三个维度的比例ϕ \phiϕ是一个用户定义的全局系数决定计算资源的放大倍数。这种方法保证了深度、宽度和分辨率的协调扩展避免了资源浪费。网络结构EfficientNet 的基础网络是 EfficientNet-B0它由 MobileNetV2 的倒残差结构MBConv演化而来并结合 Squeeze-and-Excitation (SE) 注意力模块。EfficientNet-B0 的设计包括Stem3×3 卷积输出 32 通道。MBConv Blocks若干个倒残差模块扩展卷积 → 深度卷积 → SE 模块 → 压缩卷积。Head1×1 卷积扩展通道数全局平均池化全连接层输出分类结果。通过复合缩放方法EfficientNet 系列扩展为 B0 ~ B7B0基准网络约 5.3M 参数。B7最深最大版本约 66M 参数。关键优势系统化扩展通过复合缩放方法解决了 CNN 扩展的非最优问题。高效性在相同精度下参数量和计算量比 ResNet、DenseNet 显著减少。性能强大在 ImageNet 上EfficientNet-B7 Top-1 精度达到 84.3%远超同类模型。可迁移性好在目标检测、分割和医疗影像等下游任务中表现优异。示例代码我们用 PyTorch 实现一个简化版 EfficientNet-B0仅示例不完全复现所有细节并在 CIFAR-10 数据集上演示。importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorchvisionimportdatasets,transformsfromtorch.utils.dataimportDataLoader# Squeeze-and-Excitation 模块classSEModule(nn.Module):def__init__(self,channels,reduction4):super(SEModule,self).__init__()self.fc1nn.Conv2d(channels,channels//reduction,kernel_size1)self.relunn.ReLU(inplaceTrue)self.fc2nn.Conv2d(channels//reduction,channels,kernel_size1)self.sigmoidnn.Sigmoid()defforward(self,x):wtorch.mean(x,dim(2,3),keepdimTrue)# 全局平均池化wself.fc1(w)wself.relu(w)wself.fc2(w)wself.sigmoid(w)returnx*w# MBConv 模块classMBConv(nn.Module):def__init__(self,in_channels,out_channels,expansion6,stride1,use_seTrue):super(MBConv,self).__init__()mid_channelsin_channels*expansion self.use_residual(stride1andin_channelsout_channels)layers[]ifexpansion!1:layers.append(nn.Conv2d(in_channels,mid_channels,kernel_size1,biasFalse))layers.append(nn.BatchNorm2d(mid_channels))layers.append(nn.ReLU6(inplaceTrue))layers.extend([nn.Conv2d(mid_channels,mid_channels,kernel_size3,stridestride,padding1,groupsmid_channels,biasFalse),nn.BatchNorm2d(mid_channels),nn.ReLU6(inplaceTrue),])ifuse_se:layers.append(SEModule(mid_channels))layers.extend([nn.Conv2d(mid_channels,out_channels,kernel_size1,biasFalse),nn.BatchNorm2d(out_channels)])self.convnn.Sequential(*layers)defforward(self,x):outself.conv(x)ifself.use_residual:returnxoutelse:returnout# EfficientNet-B0 简化版classEfficientNetB0(nn.Module):def__init__(self,num_classes10):super(EfficientNetB0,self).__init__()self.stemnn.Sequential(nn.Conv2d(3,32,kernel_size3,stride1,padding1,biasFalse),nn.BatchNorm2d(32),nn.ReLU6(inplaceTrue))self.blocksnn.Sequential(MBConv(32,16,expansion1,stride1),MBConv(16,24,stride2),MBConv(24,40,stride2),MBConv(40,80,stride2),MBConv(80,112,stride1),MBConv(112,192,stride2),MBConv(192,320,stride1))self.headnn.Sequential(nn.Conv2d(320,1280,kernel_size1,biasFalse),nn.BatchNorm2d(1280),nn.ReLU6(inplaceTrue),nn.AdaptiveAvgPool2d((1,1)),)self.fcnn.Linear(1280,num_classes)defforward(self,x):xself.stem(x)xself.blocks(x)xself.head(x)xtorch.flatten(x,1)xself.fc(x)returnx# 数据预处理CIFAR-10transformtransforms.Compose([transforms.Resize(224),transforms.ToTensor(),transforms.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5))])train_datasetdatasets.CIFAR10(root./data,trainTrue,transformtransform,downloadTrue)train_loaderDataLoader(train_dataset,batch_size64,shuffleTrue)# 初始化模型、损失函数和优化器devicetorch.device(cudaiftorch.cuda.is_available()elsecpu)modelEfficientNetB0(num_classes10).to(device)criterionnn.CrossEntropyLoss()optimizeroptim.Adam(model.parameters(),lr0.001)# 简单训练循环forepochinrange(1):forbatch_idx,(data,target)inenumerate(train_loader):data,targetdata.to(device),target.to(device)outputsmodel(data)losscriterion(outputs,target)optimizer.zero_grad()loss.backward()optimizer.step()ifbatch_idx%1000:print(fEpoch [{epoch1}], Step [{batch_idx}], Loss:{loss.item():.4f})EfficientNet 提出了复合缩放的方法系统化地平衡了网络的深度、宽度和分辨率从而在精度和效率之间取得了最佳平衡。它在 ImageNet 和下游任务上都取得了出色表现成为轻量化 CNN 的代表之一。最新的文章都在公众号aicoting更新别忘记关注哦推荐阅读一文搞懂深度学习中的池化面试官给我讲一下卷积吧一文搞懂卷积神经网络面试官正则化都有哪些经典的方法面试官你在训模型的时候经常使用的学习率策略有哪些面试官深度学习中经典的优化算法都有哪些一文搞懂深度学习中的通用逼近定理一文搞懂深度学习中的表征学习理论一文搞懂深度学习中的信息论一文搞懂深度学习的反向传播与优化理论最新的文章都在公众号aicoting更新别忘记关注哦作者aicoting分享是一种信仰连接让成长更有温度。我们下次不见不散

从交易到生态：交易所的“权力升级”如何让DApp告别“孤岛时代”？

引言当区块链技术从“密码学实验”演变为重构全球价值网络的底层基础设施，去中心化应用（DApp）已成为连接Web2与Web3的关键桥梁。然而，当前DApp生态面临三大困境：用户门槛高、流动性割裂、开发者获客难。2024年&#xf…...

2026/3/31 22:19:04 阅读更多 →

Prompt工程避坑指南：从李继刚神模板到Fabric工具的高效写作秘诀

Prompt工程避坑指南：从李继刚神模板到Fabric工具的高效写作秘诀在AI写作领域，Prompt工程已经从最初的"玄学"逐渐演变为一门可系统化的技术。许多创作者在深夜反复调试Prompt却收效甚微，而另一些人却能通过简单的指令获得惊艳输出—…...

2026/3/31 22:18:17 阅读更多 →

解决部署难题：Meta-Llama-3-8B-Instruct常见报错分析与避坑指南

解决部署难题：Meta-Llama-3-8B-Instruct常见报错分析与避坑指南 1. 引言 1.1 部署挑战概述 Meta-Llama-3-8B-Instruct作为当前最受欢迎的中等规模开源大语言模型之一，凭借其80亿参数的轻量级设计和出色的指令遵循能力，成为许多开发者和企业…...

2026/3/31 22:17:10 阅读更多 →

app扫描wifi的时候需要打开GPS定位----否则扫不到

这是很奇怪的一个事情，wifi和定位有什么关系？但是就是要打开。...

2026/5/17 0:00:27 阅读更多 →

AMD Ryzen调试神器SMUDebugTool：免费开源工具让你的处理器性能飞起来！

AMD Ryzen调试神器SMUDebugTool：免费开源工具让你的处理器性能飞起来！ 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Tab…...

2026/5/17 0:07:16 阅读更多 →

Midjourney抽象表现主义风格迁移全链路（从梵高笔触到AI熵增美学的底层逻辑解密）

更多请点击： https://intelliparadigm.com 第一章：Midjourney抽象表现主义风格迁移全链路（从梵高笔触到AI熵增美学的底层逻辑解密） 抽象表现主义并非仅关乎色彩与笔触的失控，而是神经感知系统在高维特征空间中对抗坍缩…...

2026/5/17 0:11:51 阅读更多 →

2026届毕业生推荐的AI科研方案实际效果

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 处在学术研究的起始阶段，开题报告的撰写常常令好多研究生以及青年学者觉得麻烦&…...

2026/5/17 0:12:15 阅读更多 →