OPUS Wikimedia Parallel Corpus

Beskrivning

Translations published by the Wikimedia foundation and their article translation system. The parallel data sets are published at https://dumps.wikimedia.org/other/contenttranslation/
Visa mer

Publiceringsår

2024

Typ av data

Upphovspersoner

Jörg Tiedemann Orcid -palvelun logo - Kurator, Utgivare, Upphovsperson

Projekt

Övriga uppgifter

Vetenskapsområden

Data- och informationsvetenskap; Språkvetenskaper

Språk

flera språk

Öppen tillgång

Öppet

Licens

Creative Commons Attribution 4.0 International (CC BY 4.0)

Nyckelord

natural language processing, machine translation, parallel corpus

Ämnesord

konekäännös

Temporal täckning

undefined

Relaterade till denna forskningsdata