202210359027
基于专家数据引导的IMPALA架构下的多智能体机器人深度强化学习策略优化
创新训练项目
合肥工业大学
一年期
工学
计算机类
2022-06-16
2024-07-10
姓名 专业班级 所在学院 项目中的分工 成员类型
于岩松 计算机科学与技术 计算机与信息学院(人工智能学院) 组织实施项目方案 第一主持人
汪义康 计算机科学与技术 计算机与信息学院(人工智能学院) 收集并融合专家数据 成员
雷俊杰 计算机科学与技术 计算机与信息学院(人工智能学院) IMPALA架构搭建 成员
赵公方 智能科学与技术 计算机与信息学院(人工智能学院) 强化学习环境 成员
饶鑫龙 电子信息工程 计算机与信息学院(人工智能学院) 调试模型 成员
姓名 职称 指导教师类型
方宝富 副教授 第一指导教师