Clotho dataset
Beskrivning
Clotho is a novel audio captioning dataset, consisting of 4981 audio samples, and each audio sample has five captions (a total of 24 905 captions). Audio samples are of 15 to 30 s duration and captions are eight to 20 words long.
Visa merPubliceringsår
2021
Typ av data
Upphovspersoner
Konstantinos Drosos - Upphovsperson
Samuel Lipping - Upphovsperson
Tuomas Virtanen - Upphovsperson
Zenodo - Utgivare
Projekt
Övriga uppgifter
Vetenskapsområden
Data- och informationsvetenskap
Språk
engelska
Öppen tillgång
Öppet