PAPINI, MATTEO

Nome completo

PAPINI, MATTEO

Afferenza

Dipartimento di Informatica Giovanni Degli Antoni

Mostra records

Risultati 1 - 20 di 31 (tempo di esecuzione: 0.0 secondi).

Do It for HER: First-Order Temporal Logic Reward Specification in Reinforcement Learning

2026 P. Olivieri, F. Lasca, A. Gianola, M. Papini

Convergence Analysis of Policy Gradient Methods with Dynamic Stochasticity

2025 A. Montenegro, M. Mussi, M. Papini, A.M. Metelli

Exploration-Free Reinforcement Learning with Linear Function Approximation

2025 L. Civitavecchia, M. Papini

Search or split: policy gradient with adaptive policy space

2025 G. Tedeschi, M. Papini, A.M. Metelli, M. Restelli

Projection by Convolution: Optimal Sample Complexity for Reinforcement Learning in Continuous-Space MDPs

2024 D. Maran, A. Maria Metelli, M. Papini, M. Restelli

Policy Gradient with Active Importance Sampling

2024 M. Papini, G. Manganini, A. Maria Metelli, M. Restelli

No-Regret Reinforcement Learning in Smooth MDPs

2024 D. Maran, A. Maria Metelli, M. Papini, M. Restelli

Offline Primal-Dual Reinforcement Learning for Linear MDPs

2024 G. Gabbianelli, G. Neu, N. Okolo, M. Papini

Importance-Weighted Offline Learning Done Right

2024 G. Gabbianelli, G. Neu, M. Papini

Learning Optimal Deterministic Policies with Stochastic Policy Gradients

2024 A. Montenegro, M. Mussi, A. Maria Metelli, M. Papini

Online Learning with Off-Policy Feedback in Adversarial MDPs

2024 F. Bacchiocchi, F. Stradi, M. Papini, A. Metelli, N. Gatti

Local Linearity: the Key for No-regret Reinforcement Learning in Continuous MDPs

2024 D. Maran, A. Maria Metelli, M. Papini, M. Restelli

Sample complexity of variance-reduced policy gradient: weaker assumptions and lower bounds

2024 G. Paczolay, M. Papini, A.M. Metelli, I. Harmati, M. Restelli

Last-Iterate Global Convergence of Policy Gradients for Constrained Reinforcement Learning

2024 A. Montenegro, M. Mussi, M. Papini, A. Maria Metelli

Optimistic Information-Directed Sampling

2023 G. Neu, M. Papini, L. Schwartz

Online Learning with Off-Policy Feedback

2023 G. Gabbianelli, G. Neu, M. Papini

Lifting the Information Ratio: An Information-Theoretic Analysis of Thompson Sampling for Contextual Bandits

2022 G. Neu, M. Papini, J. Olkhovskaya, L. Schwartz

Smoothing policies and safe policy gradients

2022 M. Papini, M. Pirotta, M. Restelli

Scalable Representation Learning in Linear Contextual Bandits with Constant Regret Guarantees

2022 A. Tirinzoni, M. Papini, A. Touati, A. Lazaric, M. Pirotta

Reinforcement Learning in Linear MDPs: Constant Regret and Representation Selection

2021 M. Papini, A. Tirinzoni, A. Pacchiano, M. Restelli, A. Lazaric, M. Pirotta

Titolo	Data di pubblicazione	Autori	Tipo	Abstract
Do It for HER: First-Order Temporal Logic Reward Specification in Reinforcement Learning	2026	Olivieri, PierriccardoLasca, FaustoGianola, AlessandroPapini, Matteo + -	Book Part (author)	-
Convergence Analysis of Policy Gradient Methods with Dynamic Stochasticity	2025	A. MontenegroM. MussiM. PapiniA. M. Metelli + -	Book Part (author)	-
Exploration-Free Reinforcement Learning with Linear Function Approximation	2025	Luca CivitavecchiaMatteo Papini + -	Article (author)	-
Search or split: policy gradient with adaptive policy space	2025	Tedeschi, GianmarcoPapini, MatteoMetelli, Alberto MariaRestelli, Marcello + -	Article (author)	-
Projection by Convolution: Optimal Sample Complexity for Reinforcement Learning in Continuous-Space MDPs	2024	Davide MaranAlberto Maria MetelliMatteo PapiniMarcello Restelli + -	Book Part (author)	-
Policy Gradient with Active Importance Sampling	2024	Matteo PapiniGiorgio ManganiniAlberto Maria MetelliMarcello Restelli + -	Article (author)	-
No-Regret Reinforcement Learning in Smooth MDPs	2024	Davide MaranAlberto Maria MetelliMatteo PapiniMarcello Restelli + -	Book Part (author)	-
Offline Primal-Dual Reinforcement Learning for Linear MDPs	2024	Gabbianelli G.Neu G.Okolo N.Papini M. + -	Book Part (author)	-
Importance-Weighted Offline Learning Done Right	2024	Gabbianelli G.Neu G.Papini M. + -	Book Part (author)	-
Learning Optimal Deterministic Policies with Stochastic Policy Gradients	2024	Alessandro MontenegroMarco MussiAlberto Maria MetelliMatteo Papini + -	Book Part (author)	-
Online Learning with Off-Policy Feedback in Adversarial MDPs	2024	F. BacchiocchiFE. StradiM. PapiniAM. MetelliN. Gatti + -	Book Part (author)	-
Local Linearity: the Key for No-regret Reinforcement Learning in Continuous MDPs	2024	Davide MaranAlberto Maria MetelliMatteo PapiniMarcello Restelli + -	Book Part (author)	-
Sample complexity of variance-reduced policy gradient: weaker assumptions and lower bounds	2024	Paczolay, GaborPapini, MatteoMetelli, Alberto MariaHarmati, IstvanRestelli, Marcello + -	Article (author)	-
Last-Iterate Global Convergence of Policy Gradients for Constrained Reinforcement Learning	2024	Alessandro MontenegroMarco MussiMatteo PapiniAlberto Maria Metelli + -	Book Part (author)	-
Optimistic Information-Directed Sampling	2023	Neu G.Papini M.Schwartz L. + -	Book Part (author)	-
Online Learning with Off-Policy Feedback	2023	Gabbianelli G.Neu G.Papini M. + -	Book Part (author)	-
Lifting the Information Ratio: An Information-Theoretic Analysis of Thompson Sampling for Contextual Bandits	2022	Neu G.Papini M.Olkhovskaya J.Schwartz L. + -	Book Part (author)	-
Smoothing policies and safe policy gradients	2022	Papini M.Pirotta M.Restelli M. + -	Article (author)	-
Scalable Representation Learning in Linear Contextual Bandits with Constant Regret Guarantees	2022	Tirinzoni A.Papini M.Touati A.Lazaric A.Pirotta M. + -	Book Part (author)	-
Reinforcement Learning in Linear MDPs: Constant Regret and Representation Selection	2021	Matteo PapiniAndrea TirinzoniAldo PacchianoMarcello RestelliAlessandro LazaricMatteo Pirotta + -	Book Part (author)	-

IRIS Institutional Research Information System - AIR Archivio Istituzionale della Ricerca

PAPINI, MATTEO

Do It for HER: First-Order Temporal Logic Reward Specification in Reinforcement Learning

Convergence Analysis of Policy Gradient Methods with Dynamic Stochasticity

Exploration-Free Reinforcement Learning with Linear Function Approximation

Search or split: policy gradient with adaptive policy space

Projection by Convolution: Optimal Sample Complexity for Reinforcement Learning in Continuous-Space MDPs

Policy Gradient with Active Importance Sampling

No-Regret Reinforcement Learning in Smooth MDPs

Offline Primal-Dual Reinforcement Learning for Linear MDPs

Importance-Weighted Offline Learning Done Right

Learning Optimal Deterministic Policies with Stochastic Policy Gradients

Online Learning with Off-Policy Feedback in Adversarial MDPs

Local Linearity: the Key for No-regret Reinforcement Learning in Continuous MDPs

Sample complexity of variance-reduced policy gradient: weaker assumptions and lower bounds

Last-Iterate Global Convergence of Policy Gradients for Constrained Reinforcement Learning

Optimistic Information-Directed Sampling

Online Learning with Off-Policy Feedback

Lifting the Information Ratio: An Information-Theoretic Analysis of Thompson Sampling for Contextual Bandits

Smoothing policies and safe policy gradients

Scalable Representation Learning in Linear Contextual Bandits with Constant Regret Guarantees

Reinforcement Learning in Linear MDPs: Constant Regret and Representation Selection