基本信息
浏览量:103

个人简介
Research interests:
Bandit theory
Optimistic algorithms (KL-UCB, UCB-V), Thompson sampling, many-armed bandits
Foundations of Monte-Carlo Tree Search
Optimistic optimization (HOO, SOO, StoSOO), optimistic planning (OP-MDP, OLOP)
Bandits in graphs and other structured spaces
Reinforcement Learning (RL)
Analysis of Reinforcement Learning and Dynamic Programming (DP) with function approximation
Finite-sample analysis of RL and DP (Lasso-TD, LSTD, AVI, API, BRM, compressed-LSTD)
Policy gradient and sensitivity analysis
Sampling methods for MDPs, Bayesian RL, POMDPs
Optimal control in continuous time
Numerical solutions to HJB equations
Stability analysis via viscosity solutions
Variable resolution discretizations
Statistical learning and randomization
Random projections for least squares regression
Adaptive sampling for Monte-Carlo integration
Active learning and sparse bandits
研究兴趣
论文共 284 篇作者统计合作学者相似作者
按年份排序按引用量排序主题筛选期刊级别筛选合作者筛选合作机构筛选
时间
引用量
主题
期刊级别
合作者
合作机构
arxiv(2023)
引用0浏览0引用
0
0
ICML 2023pp.14780-14816, (2023)
引用0浏览0EI引用
0
0
Mark Rowland,Rémi Munos,Mohammad Gheshlaghi Azar, Yunhao Tang,Georg Ostrovski, Anna Harutyunyan, Karl Tuyls,Marc G. Bellemare,Will Dabney
arxiv(2023)
引用0浏览0引用
0
0
CoRR (2023): 33720-33738
引用0浏览0EI引用
0
0
Thomas Mesnard, Wenqi Chen,Alaa Saade, Yunhao Tang,Mark Rowland,Theophane Weber,Clare Lyle,Audrunas Gruslys,Michal Valko,Will Dabney,Georg Ostrovski,Eric Moulines,
ICML 2023pp.24517-24531, (2023)
引用0浏览0EI引用
0
0
CoRR (2023): 17135-17175
引用0浏览0EI引用
0
0
CoRR (2023): 29210-29231
引用0浏览0EI引用
0
0
CoRR (2023): 33657-33673
引用0浏览0EI引用
0
0
加载更多
作者统计
合作学者
合作机构
D-Core
- 合作者
- 学生
- 导师
数据免责声明
页面数据均来自互联网公开来源、合作出版商和通过AI技术自动分析结果,我们不对页面数据的有效性、准确性、正确性、可靠性、完整性和及时性做出任何承诺和保证。若有疑问,可以通过电子邮件方式联系我们:report@aminer.cn