undefined

Improving Clustering and Cluster Validation with Missing Data Using Distance Estimation Methods

Publiceringsår

2022

Upphovspersoner

Niemelä, Marko; Kärkkäinen, Tommi

Abstrakt

Missing data introduces a challenge in the field of unsupervised learning. In clustering, when the form and the number of clusters are to be determined, one needs to deal with the missing values both in the clustering process and in the cluster validation. In the previous research, the clustering algorithm has been treated using robust clustering methods and available data strategy, and the cluster validation indices have been computed with the partial distance approximation. However, lately special methods for distance estimation with missing values have been proposed and this work is the first one where these methods are systematically applied and tested in clustering and cluster validation. More precisely, we propose, implement, and analyze the use of distance estimation methods to improve the discrimination power of clustering and cluster validation indices. A novel, robust prototype-based clustering process in two stages is suggested. Our results and conclusions confirm the usefulness of the distance estimation methods in clustering but, surprisingly, not in cluster validation.
Visa mer

Organisationer och upphovspersoner

Jyväskylä universitet

Niemelä Marko Orcid -palvelun logo

Kärkkäinen Tommi Orcid -palvelun logo

Publikationstyp

Publikationsform

Artikel

Moderpublikationens typ

Samlingsverk

Artikelstyp

Annan artikel

Målgrupp

Vetenskaplig

Kollegialt utvärderad

Kollegialt utvärderad

UKM:s publikationstyp

A3 Del av bok eller annat samlingsverk

Publikationskanalens uppgifter

Moderpublikationens redaktörer

Tuovinen, Tero T.; Periaux, Jacques; Neittaanmäki, Pekka

Förläggare

Springer

Sidor

123-133

Publikationsforum

5952

Publikationsforumsnivå

2

Öppen tillgång

Öppen tillgänglighet i förläggarens tjänst

Nej

Parallellsparad

Ja

Övriga uppgifter

Vetenskapsområden

Matematik; Data- och informationsvetenskap

Nyckelord

[object Object],[object Object],[object Object]

Publiceringsland

Schweiz

Förlagets internationalitet

Internationell

Språk

engelska

Internationell sampublikation

Nej

Sampublikation med ett företag

Nej

DOI

10.1007/978-3-030-70787-3_9

Publikationen ingår i undervisnings- och kulturministeriets datainsamling

Ja