Eesti murrete digitaalne arhiiv

Grethe Juhkason

Tartu Ülikooli eesti murrete ja sugulaskeelte arhiiv sisaldab eesti murrete ja sugulaskeelte helisalvestisi alates 1950. aastatest, käsikirjalisi materjale, keele kogumise ja keeleteadusega seotud fotosid ning videosalvestusi.

Arhiivi kogusid on digitaliseeritud alates 2000. aastast, seda tööd on juhtinud Liina Lindström ja Pärtel Lippus. Praeguseks on digitaliseeritud linte ja kassette u 919 tundi, käsikirju u 191 000 lk ja fotosid ligi 800. Arhiivi maht kasvab pidevalt välitöömaterjalide ning lõputööde lisandudes.

Aastal 2012 valmis kõigile huvilistele avatud veebipõhine andmebaas, mis asub aadressil http://www.murre.ut.ee/arhiiv/. Arhiivi eraldiseisev osa on eesti murrete korpus (www.murre.ut.ee/murdekorpus) – andmekogu, mis sisaldab sama tüüpi litereeritud murdetekste kõigist eesti murretest. Selle põhieesmärk on teha hästi valitud ja täpselt litereeritud materjalid kõigist eesti murretest uurijatele elektrooniliselt kättesaadavaks. Lisaks on murdekorpuse tekstid märksõnastatud ja morfoloogiliselt märgendatud. Korpuse põhjal on võimalik uurida võrdlevalt eesti murdeid nii häälikulisel, morfoloogilisel kui süntaktilisel tasandil. Korpuse praegune maht on üle 1,5 miljoni tekstisõna.