首页
在没有3D监督的情况下学习3D对象形状和布局
返回

在没有3D监督的情况下学习3D对象形状和布局

2022-12-19 科技信息 By:佚名
最佳答案可以通过每个对象的3D形状和空间中对象的3D布局来指定3D场景。然而,直接测量3D结构通常是不切实际的;因此,从2D图像推断3D场景的形状和布局是计算机视觉中的一个基本问题。arXiv.org最近的一篇论文提出了一种从单个图像预测复杂场景中的3D对象形状和布局的方法。它在训练期间不使用地面实况形状或...

可以通过每个对象的3D形状和空间中对象的3D布局来指定3D场景。然而,直接测量3D结构通常是不切实际的;因此,从2D图像推断3D场景的形状和布局是计算机视觉中的一个基本问题。

arXiv.org最近的一篇论文提出了一种从单个图像预测复杂场景中的3D对象形状和布局的方法。它在训练期间不使用地面实况形状或布局,多视图图像中的对象轮廓用于学习。

预测3D形状的MeshR-CNN增加了一个布局网络,该网络估计每个对象的3D位置。三个数据集的结果展示了可扩展多视图监督的实用性。该方法可扩展到具有许多对象的复杂、逼真的场景,并且可以从嘈杂的真实世界视频中学习,而无需昂贵的地面实况。

3D场景由一组对象组成,每个对象都有一个形状和一个布局,给出了它们在空间中的位置。从2D图像中理解3D场景是一个重要目标,在机器人和图形学中都有应用。虽然最近在从单个图像预测3D形状和布局方面取得了进展,但大多数方法依赖于3D地面实况进行训练,而大规模收集的成本很高。我们克服了这些限制,并提出了一种无需任何地面实况形状或布局信息即可学习预测对象的3D形状和布局的方法:相反,我们依赖于具有2D监督的多视图图像,可以更轻松地大规模收集。通过对3DWarehouse、Hypersim和ScanNet的广泛实验,我们证明了我们的方法可以扩展到真实图像的大型数据集,并且与依赖3D地面实况的方法相比具有优势。在无法获得可靠的3D地面实况的Hypersim和ScanNet上,我们的方法优于在较小和较少多样化数据集上训练的监督方法。

猜你喜欢
金色的脚印百科(金色的脚印主要内容简)

金色的脚印百科(金色的脚印主要内容简)

12-18 0 阅读
介绍Windows 7恢复系统隐藏文件的两种方法

介绍Windows 7恢复系统隐藏文件的两种方法

12-18 0 阅读
诺基亚c5 01(诺基亚c505(诺基亚C505))

诺基亚c5 01(诺基亚c505(诺基亚C505))

12-18 0 阅读
小米air2se和2s有什么区别(小米2和2s有什么区别(小米2跟2s有什么区别))

小米air2se和2s有什么区别(小米2和2s有什么区别(小米2跟2s有什么区别))

12-19 0 阅读
市本级社保和区社保有什么区别(市本级)

市本级社保和区社保有什么区别(市本级)

12-19 0 阅读
我本将心向明月奈何明月照沟渠这句话是什么意思

我本将心向明月奈何明月照沟渠这句话是什么意思

12-18 0 阅读
热门推荐
钠离子外流属于什么运输方式(钠离子)

钠离子外流属于什么运输方式(钠离子)

12-19 0 阅读
梦幻西游手游表情(梦幻西游新表情)

梦幻西游手游表情(梦幻西游新表情)

12-18 0 阅读
张韶涵演唱会(关于张韶涵演唱会的介绍)

张韶涵演唱会(关于张韶涵演唱会的介绍)

12-19 0 阅读
氢氧化钾的电子式形成过程(氢氧化钾的电子式)

氢氧化钾的电子式形成过程(氢氧化钾的电子式)

12-18 0 阅读
面如土色的近义词和反义词(面如土色的近义词)

面如土色的近义词和反义词(面如土色的近义词)

12-18 0 阅读
琦基u2000(琦基u1000)

琦基u2000(琦基u1000)

12-18 0 阅读
音悦台怎么创建悦单(音悦台怎么打榜?音悦台打榜教程)

音悦台怎么创建悦单(音悦台怎么打榜?音悦台打榜教程)

12-18 0 阅读
苏州红砖价格多少钱一块(红砖价格多少钱一块)

苏州红砖价格多少钱一块(红砖价格多少钱一块)

12-18 0 阅读
厦门律师事务所免费咨询在线(厦门律师事务所免费咨询)

厦门律师事务所免费咨询在线(厦门律师事务所免费咨询)

12-18 0 阅读
大合唱的队形(大合唱队形及动作)

大合唱的队形(大合唱队形及动作)

12-18 0 阅读