Toybrick

标题: 提炼任意深度:提炼打造更强大的单目深度估计器 [打印本页]

作者: leok    时间: 2025-3-3 15:21
标题: 提炼任意深度:提炼打造更强大的单目深度估计器
单目深度估计 (MDE) 旨在从单个 RGB 图像预测场景深度,在 3D 场景理解中起着至关重要的作用。零样本 MDE 的最新进展利用归一化深度表示和基于蒸馏的学习来提高跨不同场景的泛化能力。然而,当前依赖于全局归一化的深度归一化蒸馏方法会放大嘈杂的伪标签,从而降低蒸馏效果。在本文中,系统地分析了不同深度归一化策略对伪标签蒸馏的影响。基于研究结果,提出了跨上下文蒸馏,它整合了全局和局部深度线索来提高伪标签质量。此外,引入了一个多教师蒸馏框架,该框架利用不同深度估计模型的互补优势,从而实现更稳健、更准确的深度预测。在基准数据集上进行的大量实验表明,方法在数量和质量上都明显优于最先进的方法。



作者: leok    时间: 2025-3-3 15:21
paper:https://arxiv.org/pdf/2502.19204v1
github:https://github.com/Westlake-AGI-Lab/Distill-Any-Depth




欢迎光临 Toybrick (https://t.rock-chips.com/) Powered by Discuz! X3.3