首页
使用常识推理整理虚拟家庭
返回

使用常识推理整理虚拟家庭

2022-12-19 科技信息 By:佚名
最佳答案能够在没有明确指示的情况下清理房屋的机器人在日常生活中会很有用。arXiv.org 上最近的一篇论文提出了 Housekeep 任务,以衡量具身AI 代理使用物理常识推理和推断模仿人类在室内环境中首选物体放置的重新排列目标的能力。研究人员收集了人类在整洁和不整洁的房屋中放置物体的偏好数据集。他们提出...

能够在没有明确指示的情况下清理房屋的机器人在日常生活中会很有用。arXiv.org 上最近的一篇论文提出了 Housekeep 任务,以衡量具身AI 代理使用物理常识推理和推断模仿人类在室内环境中首选物体放置的重新排列目标的能力。

研究人员收集了人类在整洁和不整洁的房屋中放置物体的偏好数据集。他们提出了一个模块化基线,并证明从大型语言模型 (LLM) 中提取的具体常识是拟议任务的有效规划器。结果表明,该方法可以推广到重新排列看不见的对象,而无需访问显式指令。

需要进一步研究开发探索模块,以便代理可以更频繁地访问杂乱无章的区域和推理模块,以提高识别放错对象的精度。

我们介绍了 Housekeep,这是一个评估家中体现人工智能的常识推理的基准。在 Housekeep 中,具体化的代理必须通过重新排列放错位置的物体来整理房子,而无需明确说明需要重新排列哪些物体。相反,代理必须从人类偏好中学习并根据人类偏好来评估哪些物体属于整洁的房子中的哪个位置。具体来说,我们收集了一个数据集,其中人类通常将物体放置在整洁和不整洁的房屋中,包括 1799 个物体、268 个物体类别、585 个放置位置和 105 个房间。接下来,我们为 Housekeep 提出了一种模块化基线方法,该方法集成了规划、探索和导航。它利用在互联网文本语料库上训练的微调大型语言模型 (LLM) 进行有效规划。我们表明,我们的基线代理可以泛化为在未知环境中重新排列看不见的对象。

猜你喜欢
金色的脚印百科(金色的脚印主要内容简)

金色的脚印百科(金色的脚印主要内容简)

12-18 0 阅读
介绍Windows 7恢复系统隐藏文件的两种方法

介绍Windows 7恢复系统隐藏文件的两种方法

12-18 0 阅读
诺基亚c5 01(诺基亚c505(诺基亚C505))

诺基亚c5 01(诺基亚c505(诺基亚C505))

12-18 0 阅读
小米air2se和2s有什么区别(小米2和2s有什么区别(小米2跟2s有什么区别))

小米air2se和2s有什么区别(小米2和2s有什么区别(小米2跟2s有什么区别))

12-19 0 阅读
市本级社保和区社保有什么区别(市本级)

市本级社保和区社保有什么区别(市本级)

12-19 0 阅读
我本将心向明月奈何明月照沟渠这句话是什么意思

我本将心向明月奈何明月照沟渠这句话是什么意思

12-18 0 阅读
热门推荐
钠离子外流属于什么运输方式(钠离子)

钠离子外流属于什么运输方式(钠离子)

12-19 0 阅读
梦幻西游手游表情(梦幻西游新表情)

梦幻西游手游表情(梦幻西游新表情)

12-18 0 阅读
张韶涵演唱会(关于张韶涵演唱会的介绍)

张韶涵演唱会(关于张韶涵演唱会的介绍)

12-19 0 阅读
氢氧化钾的电子式形成过程(氢氧化钾的电子式)

氢氧化钾的电子式形成过程(氢氧化钾的电子式)

12-18 0 阅读
面如土色的近义词和反义词(面如土色的近义词)

面如土色的近义词和反义词(面如土色的近义词)

12-18 0 阅读
琦基u2000(琦基u1000)

琦基u2000(琦基u1000)

12-18 0 阅读
音悦台怎么创建悦单(音悦台怎么打榜?音悦台打榜教程)

音悦台怎么创建悦单(音悦台怎么打榜?音悦台打榜教程)

12-18 0 阅读
苏州红砖价格多少钱一块(红砖价格多少钱一块)

苏州红砖价格多少钱一块(红砖价格多少钱一块)

12-18 0 阅读
厦门律师事务所免费咨询在线(厦门律师事务所免费咨询)

厦门律师事务所免费咨询在线(厦门律师事务所免费咨询)

12-18 0 阅读
大合唱的队形(大合唱队形及动作)

大合唱的队形(大合唱队形及动作)

12-18 0 阅读