Gaussian mixture models provide a probabilistically sound clustering approach. However, their tendency to be over-parameterized endangers their utility in high dimensions. To induce sparsity, penalized model-based clustering strategies have been explored. Some of these approaches, exploiting the link between Gaussian graphical models and mixtures, allow to handle large precision matrices, encoding variables relationships. By assuming similar components sparsity levels, these methods fall short when the dependence structures are group-dependent. Our proposal, by penalizing group-specific transformations of the precision matrices, automatically handles situations where under or over-connectivity between variables is witnessed. The performances of the method are shown via a real data experiment
La sovra-parametrizzazione dei modelli di mistura Gaussiani, che rapp- resentano un approccio probabilistico al clustering, mette a rischio la loro utilit`a in dimensioni elevate. Per questo motivo sono state proposte strategie di stima penaliz- zate che permettono di gestire matrici di precisioni di grandi dimensioni, sfruttando il legame tra modelli grafici Gaussiani e modelli mistura. Questi metodi, assumendo sparsit`a simile tra tutte le componenti, falliscono quando la struttura di dipendenza varia di gruppo in gruppo. La nostra proposta, penalizzando una trasformazione delle matrici di precisione differente per ogni componente, gestisce situazioni in cui il numero di connessioni tra le variabili `e diverso tra i gruppi. La validit`a del metodo `e evidenziata grazie ad un’applicazione a dati reali
Group-wise penalized estimation schemes in model-based clustering = Strategie di stima penalizzata a livello di gruppo nel clustering basato su modello / A. Casa, A. Cappozzo, M. Fop - In: SIS 2022 | Book of Short Papers / [a cura di] A. Balzanella M. Bini C. Cavicchia R. Verde. - [s.l] : Pearson, 2022. - ISBN 9788891932310. - pp. 534-539 (( Intervento presentato al 51. convegno Scientific Meeting of the Italian Statistical Society tenutosi a Caserta nel 2022.
Group-wise penalized estimation schemes in model-based clustering = Strategie di stima penalizzata a livello di gruppo nel clustering basato su modello
A. Cappozzo;
2022
Abstract
Gaussian mixture models provide a probabilistically sound clustering approach. However, their tendency to be over-parameterized endangers their utility in high dimensions. To induce sparsity, penalized model-based clustering strategies have been explored. Some of these approaches, exploiting the link between Gaussian graphical models and mixtures, allow to handle large precision matrices, encoding variables relationships. By assuming similar components sparsity levels, these methods fall short when the dependence structures are group-dependent. Our proposal, by penalizing group-specific transformations of the precision matrices, automatically handles situations where under or over-connectivity between variables is witnessed. The performances of the method are shown via a real data experimentFile | Dimensione | Formato | |
---|---|---|---|
Casa_SIS2022.pdf
accesso aperto
Tipologia:
Publisher's version/PDF
Dimensione
128.12 kB
Formato
Adobe PDF
|
128.12 kB | Adobe PDF | Visualizza/Apri |
Pubblicazioni consigliate
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.