原文地址:
http://deeprl.neurondance.com/d/154
美国
Stanford:Benjamin Van Roy (摘自 http://deeprl.neurondance.com/d/154)
伯克利:Sergey Levine(论文高产作者)、Pieter Abbel(和Levine并列)
(摘自 http://deeprl.neurondance.com/d/154)
非美国外
UCL:David Sliver(目前好像不指导学生了)、汪军老师等
(摘自 http://deeprl.neurondance.com/d/154)
Alberta:Richard Sutton老爷子、好几个理论的@蓝青峰大佬
(摘自 http://deeprl.neurondance.com/d/154)
莫斯科国立大学:NIPS比赛很强
巴黎Flowers Team:Intrinsic motivation方向
加拿大麦吉尔大学推理与学习实验室
(Doina Precup和Joelle Pineau分别在DeepMind和FAIR Montreal工作)
加拿大U Alberta的增强学习和人工智能(Rich Sutton,Michael Bowling,Patrick Pilarski在DeepMind Edmonton任职;CsabaSzepesvári在DeepMind London任职)
强化学习和在线学习小组,英国伦敦帝国学院(马克·迪森罗思在Prowler.IO)
英国牛津大学白森研究实验室
法国里尔的Inria SequeL(Mohammad Ghavamzadeh,RémiMunos,Bilal Piot在DeepMind,Alessandro Lazaric在FAIR Paris,Olivier Pietquin在Google Brain)
Juergen Schmidhuber的小组,瑞士IDSIA(现为NNAISENSE)
谢恩·曼诺(Shie Mannor)在以色列Technion的小组
Gergely Neu在UPF西班牙巴塞罗那举行
印度IIT-Madras的Balaraman Ravindran小组
加拿大多伦多大学/媒介研究所的Jimmy Ba的小组
加拿大媒介学会的阿米尔·马苏德·法拉赫曼德(Amir-Massoud Farahmand)的Alireza Makhzani
中国
上海交大张伟楠组
南京大学俞扬组
国防科大徐昕
哈工大深圳:
李衍杰老师 http://faculty.hitsz.edu.cn/liyanjie
李老师数学背景,做半马氏决策过程的,学生主要做RL在机器人上的应用(导航决策、调度规划等)
http://deeprl.neurondance.com/d/154/4
香港中文大学(深圳):
Jim Dai https://scholar.google.com/citations?user=HnO4jIMAAAAJ https://people.orie.cornell.edu/jdai/
Hongyuan Zha https://scholar.google.com/citations?hl=en&user=tqEWl8gAAAAJ
Baoxiang Wang https://bxiangwang.github.io/
http://deeprl.neurondance.com/d/154/3
香港中文大学:周博磊老师
清华大学:张崇洁老师、李升波老师等
北京大学:卢宗青老师等
南京大学:俞扬老师、高阳老师等
上海交通大学:张伟楠老师、俞凯老师(Reinforcement Learning: An Introduction书翻译作者)等
中国科学院:赵冬斌老师、张海峰老师等
天津大学:郝建业老师等
中科大:李厚强老师、周文罡老师、王杰老师、庄连生老师等
国防科技大学:徐昕老师
(摘自 http://deeprl.neurondance.com/d/154)
公司
国外
DeepMind(David Sliver, Marc G. Bellemare)
OpenAI(John Schulman)
FAIR(全方向):知名的有田渊栋和Noam Brown等,大佬巨多
Google Brain(全方向):大佬巨多
Salesforce Research
国内
(摘自https://zhuanlan.zhihu.com/p/140528407)
腾讯AI Lab:游戏等;
网易伏羲实验室:游戏;
字节跳动AI Lab:游戏、推荐;
滴滴:运筹优化;
阿里:推荐、运筹优化;
微软亚研院:Research,信息检索和搜索引擎;
华为诺亚方舟实验室:Research;
华为消费者BG智能汽车解决方案BU:RL+自动驾驶
平安保险:强化学习+NLP;
快手AI Lab:游戏、检索;
超参数科技:游戏;
Momenta:RL+自动驾驶
百度PARL团队:自研框架+RL比赛
地平线AI:RL+机器人、自动驾驶
启元世界
南栖仙策
标签:总结,国内外,http,154,老师,小组,neurondance,deeprl,com From: https://www.cnblogs.com/xyz/p/18622437