首页
从大型语言模型中提取零样本常识用于机器人3D场景理解
返回

从大型语言模型中提取零样本常识用于机器人3D场景理解

2022-12-19 科技信息 By:佚名
最佳答案场景理解是机器人技术的主要挑战。机器人系统必须能够对大量环境和其中的实体进行语义理解。例如,如果被要求去厨房拿勺子,机器人应该了解厨房是什么,利用它的知识来确定哪些位置可能是厨房,并分割物体以识别要拿的勺子。arXiv.org上最近的一篇文章展示了如何将大型语言模型用于此类任务。研究人...

场景理解是机器人技术的主要挑战。机器人系统必须能够对大量环境和其中的实体进行语义理解。例如,如果被要求去厨房拿勺子,机器人应该了解厨房是什么,利用它的知识来确定哪些位置可能是厨房,并分割物体以识别要拿的勺子。

arXiv.org上最近的一篇文章展示了如何将大型语言模型用于此类任务。研究人员使用启发式方法挑选出房间内存在的少量语义信息对象,用这些对象标签构造一个查询字符串作为房间的描述,并将字符串传递给语言模型以推断房间的标签.

该方法不需要任何训练或微调,即使在零样本情况下也能实现良好的推理精度。

语义3D场景理解是机器人技术中至关重要的问题。虽然在同步定位和映射算法方面取得了重大进展,但机器人仍远未具备有关家庭物体及其普通人位置的常识。我们介绍了一种利用嵌入在大型语言模型中的常识来标记房间的新方法,因为其中包含的对象。该算法具有额外的好处:(i)不需要特定于任务的预训练(完全在零样本状态下运行)和(ii)泛化到任意房间和对象标签,包括以前看不见的标签——这两者都是机器人场景理解算法中非常理想的特征。所提出的算法在现代空间感知系统产生的3D场景图上运行,

猜你喜欢
金色的脚印百科(金色的脚印主要内容简)

金色的脚印百科(金色的脚印主要内容简)

12-18 0 阅读
介绍Windows 7恢复系统隐藏文件的两种方法

介绍Windows 7恢复系统隐藏文件的两种方法

12-18 0 阅读
诺基亚c5 01(诺基亚c505(诺基亚C505))

诺基亚c5 01(诺基亚c505(诺基亚C505))

12-18 0 阅读
小米air2se和2s有什么区别(小米2和2s有什么区别(小米2跟2s有什么区别))

小米air2se和2s有什么区别(小米2和2s有什么区别(小米2跟2s有什么区别))

12-19 0 阅读
市本级社保和区社保有什么区别(市本级)

市本级社保和区社保有什么区别(市本级)

12-19 0 阅读
我本将心向明月奈何明月照沟渠这句话是什么意思

我本将心向明月奈何明月照沟渠这句话是什么意思

12-18 0 阅读
热门推荐
钠离子外流属于什么运输方式(钠离子)

钠离子外流属于什么运输方式(钠离子)

12-19 0 阅读
梦幻西游手游表情(梦幻西游新表情)

梦幻西游手游表情(梦幻西游新表情)

12-18 0 阅读
张韶涵演唱会(关于张韶涵演唱会的介绍)

张韶涵演唱会(关于张韶涵演唱会的介绍)

12-19 0 阅读
氢氧化钾的电子式形成过程(氢氧化钾的电子式)

氢氧化钾的电子式形成过程(氢氧化钾的电子式)

12-18 0 阅读
面如土色的近义词和反义词(面如土色的近义词)

面如土色的近义词和反义词(面如土色的近义词)

12-18 0 阅读
琦基u2000(琦基u1000)

琦基u2000(琦基u1000)

12-18 0 阅读
音悦台怎么创建悦单(音悦台怎么打榜?音悦台打榜教程)

音悦台怎么创建悦单(音悦台怎么打榜?音悦台打榜教程)

12-18 0 阅读
苏州红砖价格多少钱一块(红砖价格多少钱一块)

苏州红砖价格多少钱一块(红砖价格多少钱一块)

12-18 0 阅读
厦门律师事务所免费咨询在线(厦门律师事务所免费咨询)

厦门律师事务所免费咨询在线(厦门律师事务所免费咨询)

12-18 0 阅读
大合唱的队形(大合唱队形及动作)

大合唱的队形(大合唱队形及动作)

12-18 0 阅读