首页 >> 新闻公告 >> 新闻信息 >> 正文

杨耀东课题组荣获英国国家科研与创新局年度最佳论文奖

信息来源:     发布时间:2026-03-24     浏览量:

  近日,北京大学人工智能研究院杨耀东课题组及合作团队发表在Nature Machine Intelligence 的研究论文 Efficient and Scalable Reinforcement Learning for Large-Scale Network Control 荣获 UKRI AI & Robotics Research Awards 2026 Best Research Paper 奖项。该奖项由英国国家科研与创新局(UK Research and Innovation, UKRI)主办,面向人工智能与机器人领域年度代表性研究成果,综合考量工作的原创性、学术质量与现实影响。此次获奖,体现了该研究在大规模智能决策方向上的创新价值获得国际同行进一步认可。论文的第一作者为我院博士生马成栋,唯一通讯作者为我院助理教授杨耀东。

 


论文于2024年9月发表于国际顶级期刊 Nature Machine Intelligence(《自然·机器智能》),聚焦多智能体系统落地真实复杂场景的关键瓶颈:当大量智能体相互影响时,如何在通信受限、交互代价高昂、全局信息难以获取的条件下,仍实现高质量、可扩展的协同控制。这一问题广泛存在于智慧交通、智能电网、6G通信网络等核心领域,也是多智能体强化学习从理论迈向大规模应用必须跨越的门槛。围绕这一难题,研究团队提出一种面向大规模网络控制的高效强化学习方法,利用网络结构特征分解高度耦合的系统动态,使智能体仅依赖局部信息完成学习与决策,将学习复杂度从随智能体数量指数增长压缩至可控范围,首次使强化学习能够自然扩展至成百上千个智能体构成的复杂系统。


这项研究在理论与实证层面均取得重要突破,发表后迅速引发国际学术同行的广泛关注与高度评价。哈佛大学、华为、新加坡工程院等多位领域顶尖学者充分肯定该工作在去中心化策略学习方面的开创性贡献,并将其延伸至通信、自动驾驶、无人集群等交叉领域。这些来自不同领域的评价,充分印证了该研究在去中心化学习范式上的理论深度与普适性价值。新华网和科技日报在报道中都将其视为大规模多智能体系统实现高效去中心化协同决策的重要进展,认为其显著提升了人工智能方法在大规模系统中的扩展性和适用性,是首次由华人主导的多智能体强化学习应用,打破了此前该领域被西方机构垄断的局面。截至目前,该论文是 Nature Machine Intelligence 创刊以来下载量最高的强化学习研究。


值得一提的是,这项研究还进一步走向真实任务场景,在国内多家单位的多种复杂系统中展现出示范价值。面向由空中平台、地面平台等多类型智能单元组成的异构集群系统,该去中心化学习框架在多类复杂协同决策任务中相较基准方法取得显著优势,部分场景下任务成功率超过95%。在极端灾害条件下无人机集群救援的应用探索中,面对洪涝、地震等环境中通信受限、信息获取困难的挑战,该方法使无人机仅凭局部信息即可协同完成搜索、定位、路径规划与资源调度等任务,为无人集群智能救援提供了关键技术支撑。相关应用成果已获得气象技术发明一等奖(排名第四)。


此次获奖,不仅是对这项研究原创性、学术价值和应用前景的充分肯定,也进一步展现了我院在人工智能基础理论、关键技术突破与重大场景应用中的综合创新实力。