毕设：基于融合注意力机制的单目深度估计算法（纯小白钻研历程记录）-Day1 介绍基本情况

张

张建站

2026/4/17 1:37:46

10分钟阅读

毕设：基于融合注意力机制的单目深度估计算法（纯小白钻研历程记录）-Day1 介绍基本情况

一.基本概念融合注意力注意力机制是让模型在处理信息时自动分配权重对关键内容赋予更高关注度、忽略无关信息通过计算查询Q、键K的相似度得到注意力权重再对值V加权融合实现高效聚焦重要信息、长距离关联是 Transformer 与大模型的核心基础。而融合注意力机制则是叠加两层以上的权重赋能设计一套流程把两个注意力机制融合起来采用串行的方法先A后B进一步提升细节捕捉等能力。单目深度估计单目深度估计是指仅利用一张普通 RGB 图像在没有双目视差、激光雷达等额外信息的情况下通过深度学习或视觉算法预测图像中每个像素到相机的距离深度值从而恢复场景三维空间结构的技术。其中深度值就是图片的 “第三维信息”没有它就是平面照片有它就能知道远近、还原 3D、重建空间、编辑场景。二.论文出发点及实际意义融合注意力机制对单目深度估计的核心意义就是让模型精准聚焦对深度最有用的局部细节、捕捉全局空间 / 几何依赖、消除单目固有的深度歧义最终输出更清晰、更准、几何更一致的深度图。单目深度天生缺绝对尺度、易混淆纹理相似但远近不同的区域、CNN 只能抓局部邻域、长距离关系比如远处地平线、物体遮挡建模弱加入空间 / 通道 / 自注意力后模型能自适应给每个像素 / 通道 / 区域分配权重重点强化物体边界、纹理、遮挡处的深度特征弱化纯色 / 无意义背景同时建立像素间长距离关联、对齐多尺度深浅层特征、保持深度在边缘 / 平面 / 时序上的一致性大幅减少深度模糊、跳变、几何失真提升精度与鲁棒性。三.毕设思路

AI产品经理转型：从技术思维到商业决策

AI产品经理转型：从技术思维到商业决策

在人工智能浪潮席卷千行百业的当下，一个连接技术潜能与商业价值的核心角色正日益凸显——AI产品经理。对于身处软件测试领域的专业人士而言，这一转型不仅是职业赛道的跨越，更是一次将既有技术严谨性与系统思维，升维至产品定义与商…...

2026/4/17 1:35:14 阅读更多 →

开发者副业矩阵：10个零成本变现模式

开发者副业矩阵：10个零成本变现模式

在技术浪潮不断重塑行业格局的今天，构建多元化的收入结构已成为技术从业者，尤其是软件测试工程师，提升职业抗风险能力与实现个人价值跃迁的关键策略。副业不再仅仅是“赚外快”的途径，而是验证专业深度、拓展行业影响力、探索职业…...

2026/4/17 1:35:13 阅读更多 →

大语言模型架构演进：从BERT到GPT再到Mamba的正确打开方式

大语言模型架构演进：从BERT到GPT再到Mamba的正确打开方式

先说结论大模型架构的演进史，本质上是一部"如何更高效承载智能"的优化史。从BERT的双向理解，到GPT的单向生成，再到Mamba的线性复杂度——每一代架构都在解决上一代的瓶颈。这个东西是什么想象一下，你要处理一段文字。BE…...

2026/4/17 1:28:19 阅读更多 →

[实践指南] 一致性正则化：从平滑假设到半监督学习实战

[实践指南] 一致性正则化：从平滑假设到半监督学习实战

1. 一致性正则化：为什么我们需要它？ 想象一下你在教一个小朋友识别动物。刚开始你给他看了10张猫和狗的照片，并告诉他哪些是猫、哪些是狗。过几天你发现，这个小朋友虽然能准确认出那10张照片，但遇到新的猫狗照片就完全…...

2026/4/15 8:11:04 阅读更多 →

仅剩72小时！2026奇点大会未发布PPT流出：大模型API网关的LLM-Aware流量调度算法（含Go/Python双实现）

仅剩72小时！2026奇点大会未发布PPT流出：大模型API网关的LLM-Aware流量调度算法（含Go/Python双实现）

第一章：2026奇点智能技术大会：大模型API网关设计 2026奇点智能技术大会(https://ml-summit.org) 大模型API网关已成为企业级AI基础设施的核心组件，承担请求路由、鉴权限流、协议转换、可观测性注入与成本归因等关键职责。在2026奇点智能技术…...

2026/4/15 15:05:52 阅读更多 →

单亲宝爸带6岁“小魔王”累到崩溃，幸好有蕙兰瑜伽……

单亲宝爸带6岁“小魔王”累到崩溃，幸好有蕙兰瑜伽……

每天被儿子折腾到筋疲力尽，直到我遇见了蕙兰瑜伽“爸爸，我们来打仗吧！”儿子举着玩具剑，眼睛里闪着兴奋的光。“宝贝，让爸爸休息五分钟……”我瘫在沙发上，连抬手的力气都没有。这是我和6岁儿子的日常。我是…...

2026/4/16 10:48:38 阅读更多 →

ESP32蓝牙通信实战：从BLE广播到GATT服务构建

ESP32蓝牙通信实战：从BLE广播到GATT服务构建

1. 初识ESP32蓝牙通信：BLE与经典蓝牙的区别第一次接触ESP32的开发者常会被它的蓝牙功能搞晕——为什么文档里同时存在"Bluetooth Classic"和"BLE"两种模式？这得从蓝牙4.0标准说起。2010年蓝牙技术联盟推出蓝牙4.0时，在传…...

2026/4/15 10:43:04 阅读更多 →