Gaussian mixture models provide a probabilistically sound clustering approach. However, their tendency to be over-parameterized endangers their utility in high dimensions. To induce sparsity, penalized model-based clustering strategies have been explored. Some of these approaches, exploiting the link between Gaussian graphical models and mixtures, allow to handle large precision matrices, encoding variables relationships. By assuming similar components sparsity levels, these methods fall short when the dependence structures are group-dependent. Our proposal, by penalizing group-specific transformations of the precision matrices, automatically handles situations where under or over-connectivity between variables is witnessed. The performances of the method are shown via a real data experiment

La sovra-parametrizzazione dei modelli di mistura Gaussiani, che rapp- resentano un approccio probabilistico al clustering, mette a rischio la loro utilit`a in dimensioni elevate. Per questo motivo sono state proposte strategie di stima penaliz- zate che permettono di gestire matrici di precisioni di grandi dimensioni, sfruttando il legame tra modelli grafici Gaussiani e modelli mistura. Questi metodi, assumendo sparsit`a simile tra tutte le componenti, falliscono quando la struttura di dipendenza varia di gruppo in gruppo. La nostra proposta, penalizzando una trasformazione delle matrici di precisione differente per ogni componente, gestisce situazioni in cui il numero di connessioni tra le variabili `e diverso tra i gruppi. La validit`a del metodo `e evidenziata grazie ad un’applicazione a dati reali

Group-wise penalized estimation schemes in model-based clustering = Strategie di stima penalizzata a livello di gruppo nel clustering basato su modello / A. Casa, A. Cappozzo, M. Fop - In: SIS 2022 | Book of Short Papers / [a cura di] A. Balzanella M. Bini C. Cavicchia R. Verde. - [s.l] : Pearson, 2022. - ISBN 9788891932310. - pp. 534-539 (( Intervento presentato al 51. convegno Scientific Meeting of the Italian Statistical Society tenutosi a Caserta nel 2022.

Group-wise penalized estimation schemes in model-based clustering = Strategie di stima penalizzata a livello di gruppo nel clustering basato su modello

A. Cappozzo;
2022

Abstract

Gaussian mixture models provide a probabilistically sound clustering approach. However, their tendency to be over-parameterized endangers their utility in high dimensions. To induce sparsity, penalized model-based clustering strategies have been explored. Some of these approaches, exploiting the link between Gaussian graphical models and mixtures, allow to handle large precision matrices, encoding variables relationships. By assuming similar components sparsity levels, these methods fall short when the dependence structures are group-dependent. Our proposal, by penalizing group-specific transformations of the precision matrices, automatically handles situations where under or over-connectivity between variables is witnessed. The performances of the method are shown via a real data experiment
La sovra-parametrizzazione dei modelli di mistura Gaussiani, che rapp- resentano un approccio probabilistico al clustering, mette a rischio la loro utilit`a in dimensioni elevate. Per questo motivo sono state proposte strategie di stima penaliz- zate che permettono di gestire matrici di precisioni di grandi dimensioni, sfruttando il legame tra modelli grafici Gaussiani e modelli mistura. Questi metodi, assumendo sparsit`a simile tra tutte le componenti, falliscono quando la struttura di dipendenza varia di gruppo in gruppo. La nostra proposta, penalizzando una trasformazione delle matrici di precisione differente per ogni componente, gestisce situazioni in cui il numero di connessioni tra le variabili `e diverso tra i gruppi. La validit`a del metodo `e evidenziata grazie ad un’applicazione a dati reali
Model-based clustering; Graphical lasso; EM algorithm; Gaussian graphical models
Settore SECS-S/01 - Statistica
2022
https://it.pearson.com/content/dam/region-core/italy/pearson-italy/pdf/Docenti/Università/Sis-2022-4c-low.pdf
Book Part (author)
File in questo prodotto:
File Dimensione Formato  
Casa_SIS2022.pdf

accesso aperto

Tipologia: Publisher's version/PDF
Dimensione 128.12 kB
Formato Adobe PDF
128.12 kB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/2434/1039360
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact