钟方威:北京大学信息科学与技术学院计算机应用专业在读博士生,导师王亦洲教授。主要研究方向是自主学习及其在机器人视觉中的应用。已有8篇论文在人工智能领域知名国际会议及期刊发表,如TPMAI, ICLR, ICML, CVPR, AAAI等。同时,担任多个顶级国际会议程序委员/审稿人,包括NeurIPS, ICML, ICLR, CVPR, ICCV, ECCV, AAAI等。
报告题目:基于强化学习的端到端主动目标跟踪研究
报告摘要:主动目标跟踪是指智能体根据视觉观测信息主动地移动相机,从而与目标保持特定距离和角度。主动目标跟踪在很多实际任务中都有需求,如无人机跟拍,无人车编队,智能监控等。然而,传统的实现方法是将图像中的目标跟踪和相机控制分成两个独立的任务,这导致系统在进行联调优化时变得繁琐复杂。此外,要单独实现这两个任务的代价也是高昂的,既需要大量人工标注目标位置用于训练跟踪模块,也需要在真实系统中通过试错整定控制器参数。为了解决上述问题,本文提出一种基于深度强化学习训练端到端模型的解决方案,包括了定义奖赏函数,仿真环境构建,环境增强技术,目标-跟踪器对抗训练机制等。
Spotlight:
第一个实现基于深度强化学习的端到端主动目标跟踪,性能超过传统方法;
构建了用于主动目标跟踪训练和测试的虚拟仿真环境;
提出了针对主动目标跟踪的环境增强技术,可显著提升模型泛化能力;
提出了一种智能体对抗训练机制,可进一步提高模型训练效率和鲁棒性。
1. End-to-end Active Object Tracking and Its Real-world Deployment via Reinforcement Learning
推荐理由:第一篇实现基于强化学习的端到端主动目标跟踪的工作,并实现了在真实机器人上的部署。
2. AD-VAT+ An Asymmetric Dueling Mechanism for Learning and Understanding Visual Active Tracking
推荐理由:提出了非对称博弈对抗机制用于跟踪器训练,可显著提升模型训练效率和鲁棒性。
3. Pose-Assisted Multi-Camera Collaboration for Active Object Tracking
推荐理由:利用相机之间的行为一致性,通过共享相机的位姿信息实现智能体之间高效的合作,提升多相机系统在复杂场景下的主动目标跟踪性能。
4. UnrealCV Virtual Worlds for Computer Vision
推荐理由:介绍了如何基于UE4引擎构建高逼真虚拟环境用于计算机视觉模型的训练和测试。
5. Virtual-to-real Learning to control in visual semantic segmentation
推荐理由:利用语义分割图实现基于强化学习的智能体从虚拟到真实场景的迁移。
6. Asynchronous Methods for Deep Reinforcement Learning
推荐理由:一种经典且比较实用的深度强化学习算法,可用于解决很多实际应用问题。