Automatic optimization of outlier detection ensembles using a limited number of outlier examples
Publiceringsår
2020
Upphovspersoner
Reunanen, Niko; Räty, Tomi; Lintonen, Timo
Abstrakt
In data analysis, outliers are deviating and unexpected observations. Outlier detection is important, because outliers can contain critical and interesting information. We propose an approach for optimizing outlier detection ensembles using a limited number of outlier examples. In our work, a limited number of outlier examples are defined as from 1 to 10% of the available outliers. The optimized outlier detection ensembles consist of outlier detection algorithms, which provide an outlier score and utilize adjustable parameters. The automatic optimization determines the parameter values, which enhance the discrimination of inliers and outliers. This increases the efficiency of the outlier detection. Outliers are rare by definition, which makes the optimization with a few examples beneficial. Obtaining examples of outliers can be prohibitively challenging, and the outlier examples should be used efficiently.
Visa merOrganisationer och upphovspersoner
Publikationstyp
Publikationsform
Artikel
Moderpublikationens typ
Tidning
Artikelstyp
En originalartikel
Målgrupp
VetenskapligKollegialt utvärderad
Kollegialt utvärderadUKM:s publikationstyp
A1 Originalartikel i en vetenskaplig tidskriftPublikationskanalens uppgifter
Volym
10
Nummer
4
Sidor
377-394
ISSN
Publikationsforum
Publikationsforumsnivå
1
Öppen tillgång
Öppen tillgänglighet i förläggarens tjänst
Ja
Licens för förläggarens version
CC BY
Parallellsparad
Nej
Övriga uppgifter
Vetenskapsområden
Matematik; Data- och informationsvetenskap; Företagsekonomi
Språk
engelska
Internationell sampublikation
Nej
Sampublikation med ett företag
Ja
DOI
10.1007/s41060-020-00222-4
Publikationen ingår i undervisnings- och kulturministeriets datainsamling
Ja