Korpuspõhiste keele-, kirjanduse ja folklooriuuringute töörühm

Heiki-Jaan Kaalep (Tartu Ülikool), Helle Metslang (Tartu Ülikool)

Töörühmas on üsnagi tasakaalukalt ühendatud keele-, kirjanduse- ja folklooriuuringute suund. Esindatud on nii korpuste ja andmebaaside kasutajad kui ka koostajad ja haldajad.

Keeleuuringute osas on esindatud korpuspõhised morfoloogia, grammatika, semantika, lauseprosoodia, keele varieerumise uuringud (Heiki-Jaan Kaalepi, Liina Lindströmi, Helle Metslangi, Renate Pajusalu, Heete Sahkai, Kristiina Rossi töörühmad). Nii eri tasandite keelematerjali korpuste kasutamist kui haldamist ja koostamist esindavad Heiki-Jaan Kaalep ja Einar Meister koos kaastöötajatega.

Kirjandusuuringute suunal koostatakse ja kasutatakse mitmesuguseid andmebaase (ilukirjanduse, kriitika, luule tekstikorpused – Marin Laak, Külliki Kuusk, Maria-Kristiina Lotman; vanema kirjanduse digitekstikogu – Liina Lukas; kirjanike leksikon – Jüri Talvet; koos kaastöötajatega).

Folklooriuuringute suunal koostatakse ja kasutatakse mitmekesist materjali sisaldavaid regilaulude, fraseoloogia, õudusnarratiivide, muinasjuttude korpusi (Mari Sarv, Anneli Baran, Kairi Jets, Risto Järv koos kaastöötajatega); ka visuaalset materjali sisaldavad kohapärimuse ja sotsiaalmeedia materjali andmebaasid (Mari-Ann Remmel, Liisi Laineste).

Suundade uurimishuvide kokkupuute- ja koostööalad kujunevad peamiselt uuritavate tekstitüüpide (rahvalaul, kirikulaul, ilukirjandus jne;) või geograafilise varieerumise pinnalt (murded ja rahvalaul, kohapärimus ja murded).

Töörühma tegevuse kavandamiseks ja huvide selgitamiseks kavandame korraldada novembris 2016 seminari, mille keskmes on tegija-kasutaja vaatenurk ja vajadused; dialoog andmebaaside/korpuste kasutajate ja tegijate-haldajate vahel.

Liikmed

Anneli Baran – fraseoloogia ja selle seosed teiste rahvaluule lühivormide ja muude žanridega eesti fraseologismide andmebaasi põhjal
Heiki-Jaan Kaalep - keeletehnoloogia võimaluste (praegused) piirid ja puudused korpuslingvistika seisukohalt
Kairi Jets – õudusnarratiivide uurimine korpusanalüüsi kaudu
Risto Järv, Kärri Toomeos-Orglaan jt muinasjuttude töörühma liikmed – muinasjutukorpuse märgendamine ja korpusanalüüs
Külliki Kuusk – Uku Masingu luule korpuse loomine, märgendamine
Marin Laak – tahaks luua ja märgendada kaks “kirjanduskorpust”: 1) ilukirjanduse tekstikorpus ja 2) kriitika tekstikorpus, koostöö Liina Lukasega ja  Arne Merilaiga. Mõlemal juhul on vajalik märgendamisaluste
väljatöötamine; ilukirjandustekstid on digiteeritud, kriitikakorpus tuleb luua, nende märgendamise väljatöötamisel loodetav sünergia Tiit Hennostega (nõuab palju abitööjõudu tehniliste tööde teostamiseks)
Liisi Laineste – tänapäeva folkloori leviku- ja muutumismehhanismid (nt meemide kultuuriülesus ja/või spetsiifilisus), sotsiaalmeedia pildimaterjali andmebaasi loomine ja analüüsimine
Liina Lindström, Kristel Uiboaed, Helen Plado ja Maarja-Liisa Pilvik – korpuspõhine grammatika uurimine, kvantitatiivne lähenemine, grammatiline varieerumine
Ahti Lohk – varieeruvate allkeelte korpused (rahvalaul, kirikulaul, vanemad piiblitõlked)
Maria-Kristiina Lotman – Eesti värss (http://www.ut.ee/verse/index.php?m=main)
Liina Lukas, Vahur Aabrams – Eesti vanema kirjanduse digitaaltekstikogu EEVA (hõlmab Balti kirjakultuuri tekste kuni 1918, vt www.utlib.ut.ee/eeva). Suunatud uurijale, tekstid bibliografeeritud ja märgendatud, mis võimaldab detailset otsimootorit kasutades uurijal kiiresti luua oma vajadustele vastav tekstikorpus. Arendusvajadus (uued tehnoloogilised lahendused), koostöösoov
Einar Meister, Lya Meister – kõnekorpuste mitmekihilne märgendamine, otsingud kõnekorpustes, erinevate korpuste integreerimine ühtsesse otsingusüsteemi
Helle Metslang, Külli Habicht, Tiit Hennoste, Anni Jürine, Kirsi Laanesoo, David Ogren – Korpusepõhised keelekasutuse ja - varieerumise uuringud
Huvitab väga regilaulude keeleline märgendamine koostöös Kristiina Rossiga; teiseks oleks minu huvi see, et murdekorpus (miks mitte ka vana kirjakeele vm korpused) ja regilauluandmebaas (ning muud rahvaluulekogud) oleks kasutatavad samal platvormil, ning keeleliselt märgendatud tekste saaks kasutada võrdlevate uuringute, levikukaartide jms. tegemiseks (koostöö võtmeisikuks Liina Lindström, ka H.-J. Kaalepi töörühm)
Janika Oras – regilauluandmebaasi märgendamine ka esituse alaste andmete kasutamiseks.
Renate Pajusalu (ja doktorandid Maria Reile, Helen Hint, Piia Taremaa) – korpuspõhine referentsiaalsete vahendite ja praktikate uurimine
Mari-Ann Remmel – kohapärimuse andmebaasi täiendamine ja otsingusüsteemi arendamine andmete ruumiliseks kaardistamise jaoks, visuaalsete andmete ja helifailide liitmisvõimaluse loomine
Kristiina Ross – rahvalaulu ja kirikulaulu korpusepõhine kõrvutav uurimine
Liina Saarlo – regilauluandmebaasi (jätkuv) märgendamine tüpoloogiliste rägastike lahendamiseks; regilauluandmebaasi kasutamisvõimalused väljaannete koostamisel
Heete Sahkai – korpuste kasutamine lauseprosoodia uurimisel
Mari Sarv – korpuseanalüüsi meetodite rakendamine regilaulude andmebaasi tekstidele. Jüri Talvet, Arne Merilai – EWOD (Estonian Writers Online Dictionary, vt https://sisu.ut.ee/ewod/avaleht
Haldur Õim, Mare Koit – tekstide (monoloog-, suhtlus-) semantiline ja pragmaatiline analüüs ja tõlgendamine; kirjeldusvahendid (kontseptuaalsed, formaalsed); allkorpuste ja muude andmeressursside koostamine sõltuvalt teksti või suhtluse tüübist ja uurimiseesmärgist)