首页
深度强化学习架构结合了预先学习的技能可以动态创建新的技能
返回

深度强化学习架构结合了预先学习的技能 可以动态创建新的技能

2022-12-19 科技信息 By:佚名
最佳答案来自爱丁堡大学和浙江大学的一组研究人员已经开发出一种方法,可以将深度神经网络(DNN)组合在一起,以创建一种具有新型学习能力的新型系统。该小组在《科学机器人》杂志上描述了他们的新架构及其性能。深度神经网络能够通过反复训练多个示例来学习函数。迄今为止,它们已被广泛用于各种应用中,例如...

来自爱丁堡大学和浙江大学的一组研究人员已经开发出一种方法,可以将深度神经网络(DNN)组合在一起,以创建一种具有新型学习能力的新型系统。该小组在《科学机器人》杂志上描述了他们的新架构及其性能。

深度神经网络能够通过反复训练多个示例来学习函数。迄今为止,它们已被广泛用于各种应用中,例如识别人群中的面孔或确定贷款申请人是否信誉良好。在这项新工作中,研究人员将针对不同应用开发的几种DNN组合在一起,以创建一个具有所有DNN组成部分优势的新系统。他们报告说,最终的系统不仅仅是其各个部分的总和,而且还能够学习DNN不能单独工作的新功能。研究人员称其为多专家学习架构(MELA)。

更具体地说,这项工作涉及为不同功能培训多个DNN。例如,有人学会了使机器人小跑。另一个可以绕过障碍物。然后,所有DNN都连接到门控神经网络,该网络会随着时间的流逝学习如何在需要控制其在环境中移动的机器人时需要其特殊技能的其他DNN。这样,最终的系统便能够执行所有组合DNN的所有技能。

但是,这还不是练习的终点,因为MELA了解了更多有关其组成部分及其功能的知识,它学会了通过尝试和错误的方式将它们一起使用,而这是没有教过的。例如,它学会了如何结合跌倒后的起床和处理湿滑的地板,或者学会如何在其中一个电机发生故障时进行处理。研究人员认为,他们的工作标志着机器人技术研究的一个新的里程碑,提供了一种新的范例,当机器人遇到以前从未遇到过的问题时,人们不必干预。

猜你喜欢
金色的脚印百科(金色的脚印主要内容简)

金色的脚印百科(金色的脚印主要内容简)

12-18 0 阅读
介绍Windows 7恢复系统隐藏文件的两种方法

介绍Windows 7恢复系统隐藏文件的两种方法

12-18 0 阅读
诺基亚c5 01(诺基亚c505(诺基亚C505))

诺基亚c5 01(诺基亚c505(诺基亚C505))

12-18 0 阅读
小米air2se和2s有什么区别(小米2和2s有什么区别(小米2跟2s有什么区别))

小米air2se和2s有什么区别(小米2和2s有什么区别(小米2跟2s有什么区别))

12-19 0 阅读
市本级社保和区社保有什么区别(市本级)

市本级社保和区社保有什么区别(市本级)

12-19 0 阅读
我本将心向明月奈何明月照沟渠这句话是什么意思

我本将心向明月奈何明月照沟渠这句话是什么意思

12-18 0 阅读
热门推荐
钠离子外流属于什么运输方式(钠离子)

钠离子外流属于什么运输方式(钠离子)

12-19 0 阅读
梦幻西游手游表情(梦幻西游新表情)

梦幻西游手游表情(梦幻西游新表情)

12-18 0 阅读
张韶涵演唱会(关于张韶涵演唱会的介绍)

张韶涵演唱会(关于张韶涵演唱会的介绍)

12-19 0 阅读
氢氧化钾的电子式形成过程(氢氧化钾的电子式)

氢氧化钾的电子式形成过程(氢氧化钾的电子式)

12-18 0 阅读
面如土色的近义词和反义词(面如土色的近义词)

面如土色的近义词和反义词(面如土色的近义词)

12-18 0 阅读
琦基u2000(琦基u1000)

琦基u2000(琦基u1000)

12-18 0 阅读
音悦台怎么创建悦单(音悦台怎么打榜?音悦台打榜教程)

音悦台怎么创建悦单(音悦台怎么打榜?音悦台打榜教程)

12-18 0 阅读
苏州红砖价格多少钱一块(红砖价格多少钱一块)

苏州红砖价格多少钱一块(红砖价格多少钱一块)

12-18 0 阅读
厦门律师事务所免费咨询在线(厦门律师事务所免费咨询)

厦门律师事务所免费咨询在线(厦门律师事务所免费咨询)

12-18 0 阅读
大合唱的队形(大合唱队形及动作)

大合唱的队形(大合唱队形及动作)

12-18 0 阅读