Clotho dataset

Beskrivning

Clotho is a novel audio captioning dataset, consisting of 4981 audio samples, and each audio sample has five captions (a total of 24 905 captions). Audio samples are of 15 to 30 s duration and captions are eight to 20 words long.
Visa mer

Publiceringsår

2021

Typ av data

Upphovspersoner

Konstantinos Drosos - Upphovsperson

Samuel Lipping - Upphovsperson

Tuomas Virtanen - Upphovsperson

Zenodo - Utgivare

Projekt

Övriga uppgifter

Vetenskapsområden

Data- och informationsvetenskap

Språk

engelska

Öppen tillgång

Öppet

Licens

Other

Nyckelord

Computer and information sciences

Ämnesord

Temporal täckning

undefined

Relaterade till denna forskningsdata