«
模仿学习

时间:2023-4-1     作者:阎石     分类: 研究方向


随着深度学习等人工智能技术的发展,模仿学习技术逐渐成为了人工智能领域的研究热点。目前,模仿学习在实际应用中,尤其是在机器人和其他智能体的复杂环境中,模仿学习取得了很好的效果。

在传统的机器人研究应用技术中,机器人和其他智能体系统以人工编程的方式控制其自主行为,需要特定的知识和技能。但是机器人和其他智能体的应用环境已经从简单的环境转移到复杂的非结构化的环境,人工编程行为越来越具有挑战性,并且耗时、代价昂贵。最重要的是,由于机器人行为的多样性,人类不可能编程机器人的所有行为。为了解决以上实际难题,本团队正开展模仿学习技术的相关研究。

模仿学习(Imitation Learning,IL)是一种基于专家示教重建期望策略的方法,从示教中学习期望行为是一种很有效的解决方法。模仿学习方法通过模仿专家演示的样本以解决决策问题。它不需要从环境中获得奖赏反馈,其反馈信息来自于专家的决策样本。在许多实际问题中,相较于设置合适的奖赏函数,获取专家样本往往更容易且代价更小。

在IL中,专家示教提供了有效信息,从而提高了学习效率,并且适用于复杂任务,而无需人工编程所需要的相关专业技能和知识。目前本团队正在致力于基于机械臂研究模仿学习方法和应用技术,进一步挖掘将深度学习、模仿学习与机械臂控制技术融合的应用价值。