主动目标跟踪是指智能体根据视觉观测信息主动地移动相机,从而与目标保持特定距离和角度。主动目标跟踪在很多实际任务中都有需求,如无人机跟拍,无人车编队,智能监控等。然而,传统的实现方法是将图像中的目标跟踪和相机控制分成两个独立的任务,这导致系统在进行联调优化时变得繁琐复杂。此外,要单独实现这两个任务的代价也是高昂的,既需要大量人工标注目标位置用于训练跟踪模块,也需要在真实系统中通过试错整定控制器参数。本期论坛我们邀请到了来自北京大学信息科学技术学院的博士研究生钟方威同学,介绍他提出一种基于深度强化学习训练端到端模型的解决方案。