Enhancing deep learning algorithm accuracy and stability using multicriteria optimization: an application to distributed learning with MNIST digits

La Torre, D.; Liuzzi, D.; Repetto, M.; Rocca, M.

doi:10.1007/s10479-022-04833-x

The training phase is the most crucial stage during the machine learning process. In the case of labeled data and supervised learning, machine learning entails minimizing the loss function under various constraints. We provide an innovative model for learning with numerous data sets, resulting from the application of multicriteria optimization techniques to existing deep learning algorithms. Data fitting is formulated as a multicriteria model in which each criterion measures the data fitting error on a specific data set. This is an optimization model involving a vector-valued function, and it has to be analyzed using the notion of Pareto efficiency. We present stability results for efficient solutions in the presence of input and output data perturbations. The multiple data set environment comes into play to eliminate the bias caused by the selection of a specific training set. To apply this concept, we present a scalarization strategy as well as numerical experiments in digit classification using MNIST data.

Enhancing deep learning algorithm accuracy and stability using multicriteria optimization: an application to distributed learning with MNIST digits / D. La Torre, D. Liuzzi, M. Repetto, M. Rocca. - In: ANNALS OF OPERATIONS RESEARCH. - ISSN 0254-5330. - (2022), pp. 1-21. [Epub ahead of print] [10.1007/s10479-022-04833-x]

Enhancing deep learning algorithm accuracy and stability using multicriteria optimization: an application to distributed learning with MNIST digits

D. La Torre^Primo;D. Liuzzi;Repetto, M;Rocca, M^Ultimo

2022

Abstract

The training phase is the most crucial stage during the machine learning process. In the case of labeled data and supervised learning, machine learning entails minimizing the loss function under various constraints. We provide an innovative model for learning with numerous data sets, resulting from the application of multicriteria optimization techniques to existing deep learning algorithms. Data fitting is formulated as a multicriteria model in which each criterion measures the data fitting error on a specific data set. This is an optimization model involving a vector-valued function, and it has to be analyzed using the notion of Pareto efficiency. We present stability results for efficient solutions in the presence of input and output data perturbations. The multiple data set environment comes into play to eliminate the bias caused by the selection of a specific training set. To apply this concept, we present a scalarization strategy as well as numerical experiments in digit classification using MNIST data.

Scheda breve

Scheda completa

Scheda completa (DC)

	Parole chiave
	
			Artificial intelligence; Deep learning; Machine learning; Multicriteria optimization; Classification; MINST data
		
	Settori scientifico-disciplinari dell'articolo
	
			Settore SECS-S/06 - Metodi mat. dell'economia e Scienze Attuariali e Finanziarie
		
	Data di pubblicazione
	
			2022
		
	Data ahead of print o data di stampa
	
			11-lug-2022
		
	Rivista in ANCE
	
			ANNALS OF OPERATIONS RESEARCH
		
	DOI
	
			https://dx.doi.org/10.1007/s10479-022-04833-x
		
	Tipologia
	
			Article (author)
		
	Appare nelle tipologie:
	
			01 - Articolo su periodico

File in questo prodotto:

File	Dimensione	Formato
DeepLearningMulticriteriaOptimizationLaTorreLiuzziRepettoRocca_ANOR.pdf accesso aperto Tipologia: Pre-print (manoscritto inviato all'editore) Dimensione 944.66 kB Formato Adobe PDF Visualizza/Apri	944.66 kB	Adobe PDF	Visualizza/Apri
s10479-022-04833-x.pdf accesso riservato Descrizione: online first Tipologia: Publisher's version/PDF Dimensione 1.11 MB Formato Adobe PDF Visualizza/Apri Richiedi una copia	1.11 MB	Adobe PDF	Visualizza/Apri Richiedi una copia

Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/2434/961137

Citazioni

ND

2

1

IRIS Institutional Research Information System - AIR Archivio Istituzionale della Ricerca