为了扩大我校研究生的国际化视野,2025年我校研究生国际学校课程拟邀请英国曼彻斯特大学Prof. Mingfei Sun孙明飞教授讲授,序列建模和强化学习旨在为学生提供建模时间数据和决策系统的基础和先进技术。本课程分为两部分:课程的前半部分侧重于序列建模,首先介绍神经网络和一阶优化方法。我们将探索如何使用这些技术通过基于梯度的方法更新参数来训练神经模型。在此基础上,我们将研究如何使用循环神经网络(rnn)和变压器等架构建模和预测序列数据,包括BERT和GPT-2等著名模型。在课程的后半部分,我们将转向强化学习(RL),将神经网络集成到RL框架中以研究深度强化学习。我们将发展对核心强化学习概念的理论理解,包括表格方法、基于价值的方法、政策梯度和行动者批评算法。此外,我们将介绍应用于深度强化学习任务的神经架构的实现。本课程将理论基础、实践实施和实际应用相结合,提供全面的动手学习经验。
授课对象: 2024级、2023级博士、硕士研究生。
证书发放:学习结束后,发放 结业证书。
课程时间:06月30日—07月06日,每天5个课时, 共7天,35课时 。
上课方式: 教室授课
授课语言: 全英语
讲课人简介:孙明飞 (Mingfei Sun) 教授在英国曼彻斯特大学(University of Manchester, UoM)计算机科学系从事机器学习研究,并领导该系的Agent Lab(智能体实验室)。他是曼彻斯特大学人工智能基础研究中心主要成员,欧洲学习与智能系统实验室(ELLIS)成员,复杂决策项目博士培训中心(AI CDT)的领导成员(board member),并分管学生工作。孙明飞教授长期从事深度强化学习及生成式模型研究,发表论文获得AAMAS最佳论文奖及Google Summer of Code谷歌编程奖;教学上,主要负责机器学习基础(Foundations of Machine Learning),强化学习(Reinforcement Learning),人工智能和博弈论(Game and AI)等本科和研究生课程教学。在加入曼彻斯特大学之前,孙明飞教授曾在微软剑桥研究院(Microsoft Research Cambridge)担任研究员,专注于基础模型(Foundation Models)研究;也曾在牛津大学从事博士后(Research Associate)研究工作,从事多智能体系统方面的研究。
联系电话: 王老师 67783097。
计算机与人工智能学院
2025年6月28日