Varhaisen kielenoppimisen laskennallinen mallinnus suuren mittakaavan realistisista kieliaineistoista

Bidragets beskrivning

Kysymys siitä, miten vauvat oppivat ymmärtämään äidinkieltään vuorovaikutuksessa ympäristönsä kanssa, on askarruttanut tutkijoita jo pitkään. Aiheen aiempi tutkimus on tuottanut merkittäviä määriä tietämystä kielenoppimisen eri osa-alueista, mutta tämän tiedon yhdistely kokonaiskuvan ymmärtämiseksi on ollut haasteellista. Kielenoppimisen laskennallisesta mallinnuksesta on tässä apua, sillä ihmisen kaltaiseen oppimiseen tähtäävät simulaatiomallit pystyvät huomioimaan useita kieleen liittyviä ilmiöitä samanaikaisesti. Nämä mallit käyttävät syötteenään lapsen kuulemaa puhetta, ja pyrkivät oppimaan siitä kielen rakenteita käyttäen ihmisenkaltaisia oppimismekanismeja. Toistaiseksi mallien laajuutta ja vaikuttavuutta on kuitenkin rajoittanut lasten todellisia kielikokemuksia vastaavien opetusainestojen puute. Lisäksi malleja on lähinnä arvioitu kielitieteellisten rakenteiden näkökulmasta, eikä vertaamalla mallien toimintatapaa ihmislapsilta erilaisissa koeasetelmissa mitattuun empiiriseen tutkimusdataan. Tässä hankkeessa tavoitteena on mahdollistaa aiempaa tarkempien ja sitä kautta hyödyllisempien laskennallisten mallien kehitys puuttumalla edellä mainittuihin rajoitteisiin. Hankkeessa hyödynnetään viime vuosina kerättyjä massiivisia lapsikeskeisiä ääniaineistoja, joiden pohjalta rakennetaan työkalut lasten kielikokemusten realistiseen simulointiin, mahdollistaen erilaisten kielikokemusten vaikutusten arvioimisen malleissa. Lisäksi hankkeessa kehitetään mallien arviointimenetelmiä, joissa malleja verrataan lasten kielenoppimisesta saatuun ja meta-analyyseillä varmennettuun tutkimusdataan useiden kieleen liittyvien ilmiöiden osalta. Ratkaisemalla sekä mallien opetuksen että arvioinnin nykyiset pullonkaulat, hanke mahdollistaa koko tutkimusalueen kehittymisen kohti entistä vaikuttavampia ja kokonaisvaltaisia kielenoppimisen malleja, ja sitä kautta kytkee laskennallisen mallinnuksen entistä vahvemmin muuhun kielentutkimuksen empiiriseen ja teoreettiseen tutkimukseen.
Visa mer

Startår

2022

Beviljade finansiering

Okko Räsänen Orcid -palvelun logo
353 600 €

Finansiär

Koneen säätiö

Typ av finansiering

Forskningsbidrag

Utlysning

Övriga uppgifter

Finansieringsbeslutets nummer

Koneen Säätiö_202103088

Temaområden

Kehityspsykologia, Puheteknologia, Kognitiotiede, Kielitiede

Nyckelord

kielenkehitys, laskennallinen mallinnus, puheenkäsittely, suuren mittakaavan kieliaineistot, varhainen kielenoppiminen

Identifierade teman

languages, linguistics, speech