Improving Clustering and Cluster Validation with Missing Data Using Distance Estimation Methods
Publiceringsår
2022
Upphovspersoner
Niemelä, Marko; Kärkkäinen, Tommi
Abstrakt
Missing data introduces a challenge in the field of unsupervised learning. In clustering, when the form and the number of clusters are to be determined, one needs to deal with the missing values both in the clustering process and in the cluster validation. In the previous research, the clustering algorithm has been treated using robust clustering methods and available data strategy, and the cluster validation indices have been computed with the partial distance approximation. However, lately special methods for distance estimation with missing values have been proposed and this work is the first one where these methods are systematically applied and tested in clustering and cluster validation. More precisely, we propose, implement, and analyze the use of distance estimation methods to improve the discrimination power of clustering and cluster validation indices. A novel, robust prototype-based clustering process in two stages is suggested. Our results and conclusions confirm the usefulness of the distance estimation methods in clustering but, surprisingly, not in cluster validation.
Visa merOrganisationer och upphovspersoner
Publikationstyp
Publikationsform
Artikel
Moderpublikationens typ
Samlingsverk
Artikelstyp
Annan artikel
Målgrupp
VetenskapligKollegialt utvärderad
Kollegialt utvärderadUKM:s publikationstyp
A3 Del av bok eller annat samlingsverkPublikationskanalens uppgifter
Moderpublikationens namn
Moderpublikationens redaktörer
Tuovinen, Tero T.; Periaux, Jacques; Neittaanmäki, Pekka
Förläggare
Sidor
123-133
ISSN
ISBN
Publikationsforum
Publikationsforumsnivå
2
Öppen tillgång
Öppen tillgänglighet i förläggarens tjänst
Nej
Parallellsparad
Ja
Övriga uppgifter
Vetenskapsområden
Matematik; Data- och informationsvetenskap
Nyckelord
[object Object],[object Object],[object Object]
Publiceringsland
Schweiz
Förlagets internationalitet
Internationell
Språk
engelska
Internationell sampublikation
Nej
Sampublikation med ett företag
Nej
DOI
10.1007/978-3-030-70787-3_9
Publikationen ingår i undervisnings- och kulturministeriets datainsamling
Ja