IRIS Institutional Research Information System - AIR Archivio Istituzionale della Ricerca

We introduce a novel theoretical framework for Return On Investment (ROI) maximization in repeated decision-making. Our setting is motivated by the use case of companies that regularly receive proposals for technological innovations and want to quickly decide whether they are worth implementing. We design an algorithm for learning ROI-maximizing decision-making policies over a sequence of innovation proposals. Our algorithm provably converges to an optimal policy in class Π at a rate of order min {1/(N ∆2), N−1/3}, where N is the number of innovations and ∆ is the suboptimality gap in Π. A significant hurdle of our formulation, which sets it aside from other online learning problems such as bandits, is that running a policy does not provide an unbiased estimate of its performance.

ROI Maximization in Stochastic Online Decision-Making / N. Cesa Bianchi, T. Cesari, Y. Mansour, V. Perchet (ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS). - In: Advances in Neural Information Processing Systems / [a cura di] M. Ranzato, A. Beygelzimer, Y. Dauphin, P.S. Liang, J. Wortman Vaughan. - [s.l] : Curran Associates, 2021. - ISBN 9781713845393. - pp. 9152-9166 (( Intervento presentato al 34. convegno Neural Information Processing Systems tenutosi a virtual nel 2021.

ROI Maximization in Stochastic Online Decision-Making

N. Cesa Bianchi^Primo;T. Cesari^Secondo;Y. Mansour;V. Perchet

2021

Abstract

We introduce a novel theoretical framework for Return On Investment (ROI) maximization in repeated decision-making. Our setting is motivated by the use case of companies that regularly receive proposals for technological innovations and want to quickly decide whether they are worth implementing. We design an algorithm for learning ROI-maximizing decision-making policies over a sequence of innovation proposals. Our algorithm provably converges to an optimal policy in class Π at a rate of order min {1/(N ∆2), N−1/3}, where N is the number of innovations and ∆ is the suboptimality gap in Π. A significant hurdle of our formulation, which sets it aside from other online learning problems such as bandits, is that running a policy does not provide an unbiased estimate of its performance.

Scheda breve

Scheda completa

Scheda completa (DC)

	Presenza di coautori internazionali
	
				Sì
			
	Lingua del contributo
	
				English
			
	Settori scientifico-disciplinari del contributo (sola visualizzazione)
	
				Settore INF/01 - Informatica
			
	Tipo
	
				Intervento a convegno
			
	Revisione (peer review)
	
				Esperti anonimi
			
	Classificazione in base al tipo di ricerca
	
				Ricerca di base
			
	Classificazione della pubblicazione
	
				Pubblicazione scientifica
			
	Titolo del progetto
	
	Titolo Progetto
	
									European Learning and Intelligent Systems Excellence (ELISE)
								
	Acronimo
	
									ELISE
								
	Nome finanziatore
	
										EUROPEAN COMMISSION
									
	Finanziamento
	
									H2020
								
	N. Contratto
	
									951847
								
	Titolo del volume
	
				Advances in Neural Information Processing Systems
			
	Curatori del volume
	
				M. Ranzato, A. Beygelzimer, Y. Dauphin, P.S. Liang, J. Wortman Vaughan
			
	Editore
	
				Curran Associates
			
	Data di pubblicazione
	
				2021
			
	Pagina iniziale
	
				9152
			
	Pagina finale
	
				9166
			
	Numero di pagine
	
				15
			
	ISBN
	
				9781713845393
			
	Collana
	
				ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS
			
	Numero del volume
	
				34
			
	Tipo di volume
	
				Volume a diffusione internazionale
			
	Contributo pubblicato in Open Access GOLD o DIAMOND
	
				Gold
			
	Costo sostenuto
	
				0
			
	Nome del convegno
	
				Neural Information Processing Systems
			
	Luogo del convegno
	
				virtual
			
	Anno del convegno
	
				2021
			
	Numero del convegno
	
				34
			
	Tipo di convegno
	
				Convegno internazionale
			
	Sezione
	
				Intervento inviato
			
	URL
	
				https://papers.nips.cc/paper/2021/hash/4c4ea5258ef3fb3fb1fc48fee9b4408c-Abstract.html
			
	Centro di ricerca coordinata
	
				DSRC - Data science research center
			
	Banca dati sorgente
	
				manual
			
	Identificativo ISI
	
				WOS:000922928406003
			
	Identificativo SCOPUS
	
				2-s2.0-85125029994
			
	Adesione alla policy Open Access di Ateneo
	
				Aderisco
			
	Tutti gli autori
	
						N. Cesa Bianchi, T. Cesari, Y. Mansour, V. Perchet
					
	Tipologia
	
				Book Part (author)
			
	Fulltext
	
				open
			
	Tipologia sito docente
	
				273
			
	Citazione
	
				ROI Maximization in Stochastic Online Decision-Making / N. Cesa Bianchi, T. Cesari, Y. Mansour, V. Perchet (ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS). - In: Advances in Neural Information Processing Systems / [a cura di] M. Ranzato, A. Beygelzimer, Y. Dauphin, P.S. Liang, J. Wortman Vaughan. - [s.l] : Curran Associates, 2021. - ISBN 9781713845393. - pp. 9152-9166 (( Intervento presentato al 34. convegno Neural Information Processing Systems tenutosi a virtual nel 2021.
			
	Tipologia
	
				info:eu-repo/semantics/bookPart
			
	Numero autori
	
				4
			
	Tipologia
	
				Prodotti della ricerca::03 - Contributo in volume
			
	Appare nelle tipologie:
	
				03 - Contributo in volume

File in questo prodotto:

File	Dimensione	Formato
NeurIPS-2021-roi-maximization-in-stochastic-online-decision-making-Paper.pdf accesso aperto Tipologia: Post-print, accepted manuscript ecc. (versione accettata dall'editore) Dimensione 386.99 kB Formato Adobe PDF Visualizza/Apri	386.99 kB	Adobe PDF	Visualizza/Apri

Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/2434/905994

Citazioni

ND

4

0

ND

social impact