导图社区 DFormer RGB-D表示学习的新框架

DFormer RGB-D表示学习的新框架

这是一篇关于DFormer RGB-D表示学习的新框架的思维导图，主要内容包括：引言，DFormer框架，DFormer架构，实验，消融研究和分析，相关工作，结论，致谢，参考文献。

编辑于2025-06-04 20:56:36

深度学习
计算机视觉
机器视觉

BingLee

他的近期作品查看更多>>

DFormer RGB-D表示学习的新框架
这是一篇关于DFormer RGB-D表示学习的新框架的思维导图，主要内容包括：引言，DFormer框架，DFormer架构，实验，消融研究和分析，相关工作，结论，致谢，参考文献。

DFormer RGB-D表示学习的新框架

社区模板帮助中心，点此进入>>

BingLee

他的近期作品查看更多>>

DFormer RGB-D表示学习的新框架
这是一篇关于DFormer RGB-D表示学习的新框架的思维导图，主要内容包括：引言，DFormer框架，DFormer架构，实验，消融研究和分析，相关工作，结论，致谢，参考文献。

相似推荐
大纲

互联网9大思维
- 38.1k
- 971
- 2.4k
- 402
- 0
MindMaster
组织架构-单商户商城webAPP 思维导图。
- 17.3k
- 3
- 186
- 9
- 1
Kacyun
域控上线
- 3.5k
- 169
- 11
- 4
- 0
jackrao
python思维导图
- 8.2k
- 550
- 242
- 7
- 0
(*^▽^*)
css
- 3.0k
- 1
- 43
- 3
- 0
A张舫
CSS
- 5.3k
- 271
- 189
- 33
- 0
journey
计算机操作系统思维导图
- 6.7k
- 353
- 208
- 16
- 0
journey
计算机组成原理
- 3.2k
- 98
- 70
- 8
- 0
journey
IMX6UL(A7)
- 2.0k
- 41
- 5
- 0
- 0
Handler XU
考试学情分析系统
- 2.7k
- 51
- 10
- 1
- 0
蒋龙

DFormer: RGB-D表示学习的新框架

引言

RGB-D数据的普及

3D传感器的广泛使用使得RGB-D数据更容易获取

RGB-D数据在高级场景理解中的潜力

RGB-D预训练方法的挑战

现有方法在预训练阶段未考虑深度信息

RGB和深度信息的交互在预训练阶段未得到解决

DFormer框架

创新点

使用ImageNet-1K的图像-深度对进行预训练

使DFormer能够编码RGB-D表示

RGB-D块的设计

通过新颖的构建块设计编码RGB和深度信息

避免了RGB预训练骨干在深度图中编码3D几何关系的不匹配问题

实验结果

在两个RGB-D语义分割数据集和五个RGB-D显著物体检测数据集上实现新的最先进性能

计算成本低于当前最佳方法的一半

DFormer架构

分层编码器

由四个阶段组成，用于生成多尺度RGB-D特征

每个阶段包含一系列RGB-D块

RGB-D预训练框架

使用图像-深度对进行预训练以生成可转移的RGB-D表示

任务特定解码器

在预训练的RGB-D骨干上添加轻量级解码器头以构建特定任务网络

实验

RGB-D语义分割

数据集和实现细节

在NYUDepthv2和SUN-RGBD数据集上进行微调和评估

与最先进方法的比较

DFormer在两个基准数据集上均实现新的最先进性能

RGB-D显著物体检测

数据集和实现细节

在五个流行的数据集上进行微调和测试

与最先进方法的比较

DFormer在所有测试数据集上均超越所有竞争者，并且计算成本最低

消融研究和分析

RGB-D块组件的有效性

基础模块、GAA模块和LEA模块均对DFormer至关重要

输入特征对解码器的影响

DFormer的RGB分支特征能够有效融合两种模态信息

解码器仅使用RGB特征即可节省计算成本