{"id":466,"date":"2025-12-15T13:47:06","date_gmt":"2025-12-15T11:47:06","guid":{"rendered":"https:\/\/www.etkad.ee\/?page_id=466"},"modified":"2026-03-25T13:23:31","modified_gmt":"2026-03-25T13:23:31","slug":"ukrainian-and-estonian-folk-songs","status":"publish","type":"post","link":"https:\/\/www.etkad.ee\/en\/humal\/toovood\/ukrainian-and-estonian-folk-songs\/","title":{"rendered":"Comparative Topic Analysis of Ukrainian and Estonian Folk Songs Using AI Translation and Computational Methods"},"content":{"rendered":"\n<div class=\"wp-block-group is-layout-constrained wp-block-group-is-layout-constrained\"><div class=\"kb-row-layout-wrap kb-row-layout-id466_63111d-2d alignnone wp-block-kadence-rowlayout\"><div class=\"kt-row-column-wrap kt-has-2-columns kt-row-layout-equal kt-tab-layout-inherit kt-mobile-layout-row kt-row-valign-top\">\n\n<div class=\"wp-block-kadence-column kadence-column466_954b77-08\"><div class=\"kt-inside-inner-col\">\n<p>Uurimuse eesm\u00e4rk oli tuvastada ukraina ja eesti rahvalaulude temaatilist kattuvust, kultuurilisi sarnasusi ja ainuomaseid teemasid arvutuslike meetodite abil, kasutades eelk\u00f5ige tehisintellektip\u00f5hist t\u00f5lget ja LDA-teemamodelleerimist. <\/p>\n\n\n\n<p>Kuigi ukraina ja eesti rahvalaulud esindavad erinevaid keele- ja kultuuritraditsioone (l\u00e4\u00e4nemeresoome ja idaslaavi), on m\u00f5lemat kultuuri \u00fchendanud ajaloolised kontaktiperioodid, mis v\u00f5ivad kajastuda ka rahvap\u00e4rimuses. Juba varakeskajal \u00fchendasid m\u00f5lemat piirkonda p\u00f5hja\u2013l\u00f5unasuunalised kaubateed, eelk\u00f5ige L\u00e4\u00e4nemere ja Musta mere vaheline varjaagide tee (Pritsak 1981). Need kaubateed soodustasid lisaks kaubavahetusele ka narratiivsete motiivide, rituaalsete struktuuride ja m\u00fctoloogiliste kujutelmade levikut. Vaatamata keelelisele kaugusele ilmneb nii ukraina kui ka eesti folklooris m\u00e4rkimisv\u00e4\u00e4rseid temaatilisi paralleele, mis teeb need traditsioonid v\u00f5rdleva anal\u00fc\u00fcsi jaoks eriti sobivaks.<\/p>\n\n\n\n<p class=\"kt-adv-heading466_cbf802-e8_2 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading466_cbf802-e8_2\">Uurimus keskendus kolmele p\u00f5hik\u00fcsimusele: (1) Milliseid teemasid, motiive ja narratiivseid struktuure saab ukraina ja eesti rahvalauludest teemamodelleerimise abil tuvastada? (2) Kuidas sobituvad arvutuslikult tuvastatud temaatilised struktuurid traditsiooniliste folkloristlike klassifikatsioonidega? (3) Kuidas m\u00f5jutab t\u00f5lke kasutamine kahe keele temaatilise kattuvuse anal\u00fc\u00fcsi?<\/p>\n<\/div><\/div>\n\n\n\n<div class=\"wp-block-kadence-column kadence-column466_46cd84-95\"><div class=\"kt-inside-inner-col\">\n<ul class=\"wp-block-list has-theme-palette-8-background-color has-background\">\n<li><strong>Autorid:<\/strong>\n<ul class=\"wp-block-list\">\n<li><a href=\"\/humal\/olha-petrovych\/\" data-type=\"page\" data-id=\"129\">Olha Petrovych<\/a> (Eesti Kirjandusmuuseum)<\/li>\n\n\n\n<li><a href=\"https:\/\/www.etkad.ee\/humal\/mari-vaina\/\" data-type=\"page\" data-id=\"1311\">Mari V\u00e4ina<\/a> (Eesti Kirjandusmuuseum)<\/li>\n\n\n\n<li><a href=\"\/humal\/kaarel-veskis\/\" data-type=\"page\" data-id=\"101\">Kaarel Veskis<\/a> (Eesti Kirjandusmuuseum &amp; Tartu \u00dclikool)<\/li>\n\n\n\n<li>Liina Saarlo (Eesti Kirjandusmuuseum)<\/li>\n\n\n\n<li>T\u00f6\u00f6voog on loodud k\u00f5igi autorite poolt (st see on kavandatud, arendatud ja rakendatud \u00fchiselt), m\u00f5ned meeskonnaliikmed on andnud suurema panuse t\u00f6\u00f6voo praeguse kirjelduse koostamisse, kuid selle loomise autorlus kuulub k\u00f5igile meeskonnaliikmetele.<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li><strong>Litsents:<\/strong> <a href=\"https:\/\/creativecommons.org\/licenses\/by\/4.0\/deed.en\" target=\"_blank\" rel=\"noreferrer noopener\">Creative Commons Attribution 4.0 International<\/a><\/li>\n\n\n\n<li><strong>M\u00e4rks\u00f5nad (sisu):<\/strong> <a href=\"https:\/\/ems.elnet.ee\/id\/EMS020697\">regilaulud<\/a>, <a href=\"https:\/\/ems.elnet.ee\/id\/EMS009238\" data-type=\"link\" data-id=\"https:\/\/ems.elnet.ee\/id\/EMS009238\" target=\"_blank\" rel=\"noreferrer noopener\">rahvaluule<\/a><\/li>\n\n\n\n<li><strong>M\u00e4rks\u00f5nad (<a href=\"https:\/\/tadirah.info\/index.html\">Tadirah<\/a>):<\/strong> <a href=\"\/humal\/toovood\/marksonad\/teemade-modelleerimine\/\" data-type=\"marksonad\" data-id=\"164\">Teemade modelleerimine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/tolkimine\/\" data-type=\"marksonad\" data-id=\"168\">T\u00f5lkimine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/vordlemine\/\" data-type=\"marksonad\" data-id=\"43\">V\u00f5rdlemine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/andmete-visualiseerimine\/\" data-type=\"marksonad\" data-id=\"60\">Andmete visualiseerimine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/tolgendamine\/\" data-type=\"marksonad\" data-id=\"98\">T\u00f5lgendamine<\/a><\/li>\n\n\n\n<li><strong>Eriala:<\/strong> <a href=\"https:\/\/www.etkad.ee\/eriala\/arvutuslik-folkloristika\/\" data-type=\"eriala\" data-id=\"79\">arvutuslik folkloristika<\/a><\/li>\n\n\n\n<li><strong>Andmete meediat\u00fc\u00fcp:<\/strong> <a href=\"https:\/\/www.etkad.ee\/andmete-meediatuup\/tekst\/\" data-type=\"andmete-meediatuup\" data-id=\"91\">tekst<\/a><\/li>\n\n\n\n<li><strong>V\u00e4ljund:<\/strong> <a href=\"https:\/\/www.etkad.ee\/valjund\/teadusartikkel\/\" data-type=\"valjund\" data-id=\"97\">teadusartikkel<\/a>, <a href=\"https:\/\/www.etkad.ee\/valjund\/andmestik\/\" data-type=\"valjund\" data-id=\"93\">andmestik<\/a>, <a href=\"https:\/\/www.etkad.ee\/valjund\/visualiseering\/\" data-type=\"valjund\" data-id=\"98\">visualiseering<\/a><\/li>\n\n\n\n<li><strong>Seotud materjalid:<\/strong>\n<ul class=\"wp-block-list\">\n<li>Projekt <a href=\"https:\/\/www.etis.ee\/Portal\/Projects\/Display\/d4bbec88-b43b-4fef-8310-c5d598904b22\" target=\"_blank\" rel=\"noreferrer noopener\">Eesti ja ukraina rahvalaulude v\u00f5rdlev korpusp\u00f5hine arvutuslik anal\u00fc\u00fcs<\/a><\/li>\n<\/ul>\n<\/li>\n\n\n\n<li><strong>Viide:<\/strong> Petrovych, Olha, V\u00e4ina, Mari, Veskis, Kaarel, Saarlo, Liina (2026). Ukraina ja eesti rahvalaulude v\u00f5rdlev teemaanal\u00fc\u00fcs tehisintellektip\u00f5hise t\u00f5lke ja arvutuslike meetodite abil. <a href=\"https:\/\/www.etkad.ee\/humal\/toovood\/ukrainian-and-estonian-folk-songs\/\">https:\/\/www.etkad.ee\/humal\/toovood\/ukrainian-and-estonian-folk-songs\/<\/a> <\/li>\n<\/ul>\n<\/div><\/div>\n\n<\/div><\/div>\n\n\n<figure data-wp-context=\"{&quot;imageId&quot;:&quot;69de881479d62&quot;}\" data-wp-interactive=\"core\/image\" data-wp-key=\"69de881479d62\" class=\"wp-block-image size-large wp-lightbox-container\"><img loading=\"lazy\" decoding=\"async\" width=\"582\" height=\"1024\" data-wp-class--hide=\"state.isContentHidden\" data-wp-class--show=\"state.isContentVisible\" data-wp-init=\"callbacks.setButtonStyles\" data-wp-on--click=\"actions.showLightbox\" data-wp-on--load=\"callbacks.setButtonStyles\" data-wp-on-window--resize=\"callbacks.setButtonStyles\" src=\"https:\/\/www.etkad.ee\/wp-content\/uploads\/2025\/12\/lauluuuring_EST-582x1024.png\" alt=\"\" class=\"wp-image-1399\" srcset=\"https:\/\/www.etkad.ee\/wp-content\/uploads\/2025\/12\/lauluuuring_EST-582x1024.png 582w, https:\/\/www.etkad.ee\/wp-content\/uploads\/2025\/12\/lauluuuring_EST-170x300.png 170w, https:\/\/www.etkad.ee\/wp-content\/uploads\/2025\/12\/lauluuuring_EST-7x12.png 7w, https:\/\/www.etkad.ee\/wp-content\/uploads\/2025\/12\/lauluuuring_EST.png 643w\" sizes=\"auto, (max-width: 582px) 100vw, 582px\" \/><button\n\t\t\tclass=\"lightbox-trigger\"\n\t\t\ttype=\"button\"\n\t\t\taria-haspopup=\"dialog\"\n\t\t\taria-label=\"Enlarge\"\n\t\t\tdata-wp-init=\"callbacks.initTriggerButton\"\n\t\t\tdata-wp-on--click=\"actions.showLightbox\"\n\t\t\tdata-wp-style--right=\"state.imageButtonRight\"\n\t\t\tdata-wp-style--top=\"state.imageButtonTop\"\n\t\t>\n\t\t\t<svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"12\" height=\"12\" fill=\"none\" viewBox=\"0 0 12 12\">\n\t\t\t\t<path fill=\"#fff\" d=\"M2 0a2 2 0 0 0-2 2v2h1.5V2a.5.5 0 0 1 .5-.5h2V0H2Zm2 10.5H2a.5.5 0 0 1-.5-.5V8H0v2a2 2 0 0 0 2 2h2v-1.5ZM8 12v-1.5h2a.5.5 0 0 0 .5-.5V8H12v2a2 2 0 0 1-2 2H8Zm2-12a2 2 0 0 1 2 2v2h-1.5V2a.5.5 0 0 0-.5-.5H8V0h2Z\" \/>\n\t\t\t<\/svg>\n\t\t<\/button><\/figure>\n<\/div>\n\n\n\n<div class=\"wp-block-group alignfull is-layout-constrained wp-block-group-is-layout-constrained\"><div class=\"kb-row-layout-wrap kb-row-layout-id466_f56c88-c6 alignfull has-light-beige-background-color kt-row-has-bg wp-block-kadence-rowlayout\"><div class=\"kt-row-column-wrap kt-has-1-columns kt-row-layout-equal kt-tab-layout-inherit kt-mobile-layout-row kt-row-valign-top kb-theme-content-width\">\n\n<div class=\"wp-block-kadence-column kadence-column466_e83fa2-0b kb-section-dir-vertical inner-column-1\"><div class=\"kt-inside-inner-col\"><div class=\"kb-row-layout-wrap kb-row-layout-id466_5ebe89-a6 alignnone wp-block-kadence-rowlayout\"><div class=\"kt-row-column-wrap kt-has-1-columns kt-row-layout-equal kt-tab-layout-inherit kt-mobile-layout-row kt-row-valign-top\">\n\n<div class=\"wp-block-kadence-column kadence-column466_3160d7-bb\"><div class=\"kt-inside-inner-col\">\n<h2 class=\"kt-adv-heading466_cd4701-3d wp-block-kadence-advancedheading has-theme-palette-3-color has-text-color\" data-kb-block=\"kb-adv-heading466_cd4701-3d\">T\u00d6\u00d6VOO SAMMUD<\/h2>\n\n\n\n<div class=\"wp-block-kadence-accordion alignnone\"><div class=\"kt-accordion-wrap kt-accordion-id466_bf334c-82 kt-accordion-has-9-panes kt-active-pane-0 kt-accordion-block kt-pane-header-alignment-left kt-accodion-icon-style-basic kt-accodion-icon-side-left\" style=\"max-width:none\"><div class=\"kt-accordion-inner-wrap\" data-allow-multiple-open=\"false\" data-start-open=\"0\">\n<div class=\"wp-block-kadence-pane kt-accordion-pane kt-accordion-pane-1 kt-pane466_c64f17-c1\"><div class=\"kt-accordion-header-wrap\"><button class=\"kt-blocks-accordion-header kt-acccordion-button-label-show\" type=\"button\"><span class=\"kt-blocks-accordion-title-wrap\"><span class=\"kt-blocks-accordion-title\"><strong>1.<\/strong> <strong>Korpuse kogumine ja valik<\/strong><\/span><\/span><span class=\"kt-blocks-accordion-icon-trigger\"><\/span><\/button><\/div><div class=\"kt-accordion-panel kt-accordion-panel-hidden\"><div class=\"kt-accordion-panel-inner\">\n<p><strong>M\u00e4rks\u00f5nad:<\/strong> <a href=\"\/humal\/toovood\/marksonad\/kogumine\/\" data-type=\"marksonad\" data-id=\"39\">Kogumine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/korraldamine\/\" data-type=\"marksonad\" data-id=\"119\">Korraldamine<\/a><\/p>\n\n\n\n<p>Juhtumiuuringu esimene samm oli kahe korpuse koostamine, millel p\u00f5hineb kogu edasine anal\u00fc\u00fcs: 2762 Podoolia (ukr Podillja) piirkonna ukraina rahvalaulu, mis on kogutud aastatel 1918\u20132013 (Dei 1965; Dmytrenko &amp; Jefremova 2014; Myshanych 1976), ning Eesti Kirjandusmuuseumi hallatav eesti regilaulude andmebaas (ERAB) (Sarv &amp; Oras 2020), kusjuures keskenduti J\u00e4rvamaa lauludele, kuna selle piirkonna murded on kirjakeelele k\u00f5ige sarnasemad. Eesti andmestik sisaldas aastatel 1833\u20131908 \u00fcles kirjutatud k\u00e4sikirjaliste arhiividokumentide digitaaltekste.<\/p>\n\n\n\n<p>Eesm\u00e4rk oli tagada, et m\u00f5lemad korpused oleksid mahult, struktuurilt ja esinduslikkuselt v\u00f5rreldavad, et arvutuslikud meetodid suudaksid tuvastada nii \u00fchiseid kui ka kultuurispetsiifilisi teemasid. Selleks eemaldati ukraina korpusest refr\u00e4\u00e4nid ja tervet v\u00e4rsirida h\u00f5lmavad kordused, kuna need v\u00f5isid s\u00f5nasagedusi kunstlikult suurendada ja temaatilist klasterdamist moonutada. Eesti ainestiku puhul andis esialgne SQL-p\u00e4ring FILTER-andmebaasist tulemuseks 6553 J\u00e4rvamaa laulu. Korpuste mahu \u00fchtlustamiseks v\u00e4hendati J\u00e4rvamaa andmestikku 2852 lauluni, j\u00e4ttes alles peamiselt t\u00fc\u00fcpilised regilaulutekstid (kuna andmebaas sisaldab ka \u017eanripiiridele j\u00e4\u00e4vaid ning muudesse \u017eanritesse kuuluvaid tekste).<\/p>\n<\/div><\/div><\/div>\n\n\n\n<div class=\"wp-block-kadence-pane kt-accordion-pane kt-accordion-pane-2 kt-pane466_2e7a00-38\"><div class=\"kt-accordion-header-wrap\"><button class=\"kt-blocks-accordion-header kt-acccordion-button-label-show\" type=\"button\"><span class=\"kt-blocks-accordion-title-wrap\"><span class=\"kt-blocks-accordion-title\"><strong>2. Laulutekstide t\u00f5lkimine inglise keelde<\/strong><\/span><\/span><span class=\"kt-blocks-accordion-icon-trigger\"><\/span><\/button><\/div><div class=\"kt-accordion-panel kt-accordion-panel-hidden\"><div class=\"kt-accordion-panel-inner\">\n<p><strong><strong>M\u00e4rks\u00f5nad<\/strong>:<\/strong> <a href=\"\/humal\/toovood\/marksonad\/tolkimine\/\" data-type=\"marksonad\" data-id=\"168\">T\u00f5lkimine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/rikastamine\/\" data-type=\"marksonad\" data-id=\"78\">Rikastamine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/tolgendamine\/\" data-type=\"marksonad\" data-id=\"98\">T\u00f5lgendamine<\/a><\/p>\n\n\n\n<p>T\u00f5lkeetapp l\u00f5i v\u00f5imaluse v\u00f5rrelda ukraina ja eesti rahvalaule \u00fchises keelelises raamistikus, mis on usaldusv\u00e4\u00e4rse teemamodelleerimise ja klasterdamise eeldus. Tuli valida sobiv t\u00f5lkemudel ja t\u00f6\u00f6tada v\u00e4lja t\u00f5hus t\u00f5lket\u00f6\u00f6voog. Katsetati mitut tehisintellektimudelit ning valiti Claude 3.5 Sonnet, kuna see m\u00f5istis k\u00f5ige paremini piirkondlikke murdeid, folkloristlikku s\u00f5navara ja laulude poeetilisi struktuure.<br>Koostati eraldi t\u00f5lkeskript koos iteratiivselt t\u00e4iustatud juhise ehk viibaga (<em>prompt<\/em>), mis sisaldas iga laulu pealkirja, \u017eanrim\u00e4\u00e4ratlust ja murdekirjeldust. Oluline p\u00f5him\u00f5te oli s\u00e4ilitada algtekstide kultuurilised n\u00fcansid, nii et \u00fchtlasi oleks tagatud ka t\u00f5lgete s\u00f5nas\u00f5naline t\u00e4psus ja s\u00f5navaraline j\u00e4rjekindlus, mida arvutusanal\u00fc\u00fcs eeldab. T\u00f5lkeprotsessi tulemusena valmis 5614 lauluga andmestik (ukraina + eesti), kus iga tekst on esitatud nii algkeeles kui ka ingliskeelses t\u00f5lkes. T\u00f5lkeetapp oli tihedalt seotud j\u00e4rgmiste etappidega: t\u00f5lgitud tekstid olid aluseks eelt\u00f6\u00f6tlusele, vektoriseerimisele ja kogu uurimuse keskmes olevale keelte\u00fclesele temaatilisele v\u00f5rdlusele<\/p>\n<\/div><\/div><\/div>\n\n\n\n<div class=\"wp-block-kadence-pane kt-accordion-pane kt-accordion-pane-3 kt-pane466_e80c91-1f\"><div class=\"kt-accordion-header-wrap\"><button class=\"kt-blocks-accordion-header kt-acccordion-button-label-show\" type=\"button\"><span class=\"kt-blocks-accordion-title-wrap\"><span class=\"kt-blocks-accordion-title\"><strong>3. Andmeanal\u00fc\u00fcs<\/strong><br><strong>3.1.<\/strong> <strong>T\u00f5lgitud tekstide puhastamine ja eelt\u00f6\u00f6tlus Google Colabis<\/strong><\/span><\/span><span class=\"kt-blocks-accordion-icon-trigger\"><\/span><\/button><\/div><div class=\"kt-accordion-panel kt-accordion-panel-hidden\"><div class=\"kt-accordion-panel-inner\">\n<p><strong><strong>M\u00e4rks\u00f5nad<\/strong>:<\/strong> <a href=\"\/humal\/toovood\/marksonad\/eeltootlus\/\" data-type=\"marksonad\" data-id=\"128\">Eelt\u00f6\u00f6tlus<\/a>, <a href=\"\/humal\/toovood\/marksonad\/loomuliku-keele-tootlemine\/\" data-type=\"marksonad\" data-id=\"115\">Loomuliku keele t\u00f6\u00f6tlemine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/lemmatiseerimine\/\" data-type=\"marksonad\" data-id=\"101\">Lemmatiseerimine<\/a><\/p>\n\n\n\n<p>P\u00e4rast t\u00f5lkimist tuli tekstid arvutusanal\u00fc\u00fcsiks ette valmistada. See samm h\u00f5lmas ingliskeelsete laulutekstide normaliseerimist: v\u00e4iket\u00e4heliseks \u00fchtlustamist, kirjavahem\u00e4rkide eemaldamist, lemmatiseerimist ja stopps\u00f5nade eemaldamist. Lemmatiseerimine taandas s\u00f5nade grammatilised vormid (nt <em>sing, sings, singing<\/em>) \u00fchele algvormile, et mudel saaks neid k\u00e4sitleda \u00fche m\u00f5istena. Stopps\u00f5nade ehk funktsioonis\u00f5nade (nt <em>and<\/em>, <em>the<\/em>, <em>but<\/em>) eemaldamine v\u00f5imaldas keskenduda temaatilise anal\u00fc\u00fcsi seisukohalt k\u00f5ige olulisematele s\u00f5naklassidele \u2014 nimi-, tegu-, omadus- ja m\u00e4\u00e4rs\u00f5nadele \u2014, mis kannavad semantilist sisu, millele teemamodelleerimine mustrite tuvastamisel tugineb. Eelt\u00f6\u00f6tlusvalikud m\u00f5jutasid otseselt nii teemamodelleerimise kui ka klasterdamise tulemuste kvaliteeti ja t\u00f5lgendatavust.<\/p>\n<\/div><\/div><\/div>\n\n\n\n<div class=\"wp-block-kadence-pane kt-accordion-pane kt-accordion-pane-4 kt-pane466_957a8c-05\"><div class=\"kt-accordion-header-wrap\"><button class=\"kt-blocks-accordion-header kt-acccordion-button-label-show\" type=\"button\"><span class=\"kt-blocks-accordion-title-wrap\"><span class=\"kt-blocks-accordion-title\"><strong>3.2. Andmestiku \u00fclesehitus ja integreerimine<\/strong><\/span><\/span><span class=\"kt-blocks-accordion-icon-trigger\"><\/span><\/button><\/div><div class=\"kt-accordion-panel kt-accordion-panel-hidden\"><div class=\"kt-accordion-panel-inner\">\n<p><strong>M\u00e4rks\u00f5nad:<\/strong> <a href=\"\/humal\/toovood\/marksonad\/koostamine\/\" data-type=\"marksonad\" data-id=\"44\">Koostamine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/suntaksianaluus\/\" data-type=\"marksonad\" data-id=\"120\">S\u00fcntaksianal\u00fc\u00fcs<\/a>, <a href=\"\/humal\/toovood\/marksonad\/transkodeerimine\/\" data-type=\"marksonad\" data-id=\"165\">Transkodeerimine<\/a><\/p>\n\n\n\n<p>P\u00e4rast eelt\u00f6\u00f6tlust \u00fchendati ukraina ja eesti korpused \u00fcheks andmestikuks. Eesm\u00e4rk oli v\u00f5imaldada v\u00f5rdlevat anal\u00fc\u00fcsi: algoritmid pidid m\u00f5lemat korpust anal\u00fc\u00fcsima samas tunnusruumis, nii et sarnasused ja erinevused ilmneksid \u00fchises arvutuslikus raamistikus. Selguse huvides m\u00e4rgendati iga laul kultuurilise p\u00e4ritolu j\u00e4rgi, et hilisemates visualiseeringutes ja statistilistes anal\u00fc\u00fcsides saaks ukraina ja eesti ainestikku eristada.<\/p>\n\n\n\n<p>\u00dchendatud andmestiku koostamine eeldas tekstide, metaandmete ja m\u00e4rgenduse hoolikat struktureerimist. See integreeritud andmestik oli k\u00f5igi j\u00e4rgnevate etappide \u2013 tunnuste eraldamise, modelleerimise ja t\u00f5lgendamise \u2013 alus. Ilma \u00fchtse struktuuri ja selgete m\u00e4rgenditeta poleks olnud v\u00f5imalik teemasid keelte\u00fcleselt v\u00f5rrelda ega hinnata, kuidas kultuuritraditsioonid kujundavad lauludes leiduvat s\u00fcmboolikat ja narratiivseid mustreid.<\/p>\n<\/div><\/div><\/div>\n\n\n\n<div class=\"wp-block-kadence-pane kt-accordion-pane kt-accordion-pane-6 kt-pane466_392af3-48\"><div class=\"kt-accordion-header-wrap\"><button class=\"kt-blocks-accordion-header kt-acccordion-button-label-show\" type=\"button\"><span class=\"kt-blocks-accordion-title-wrap\"><span class=\"kt-blocks-accordion-title\"><strong>3.3. Tunnuste eraldamine ja vektoriseerimine<\/strong><\/span><\/span><span class=\"kt-blocks-accordion-icon-trigger\"><\/span><\/button><\/div><div class=\"kt-accordion-panel kt-accordion-panel-hidden\"><div class=\"kt-accordion-panel-inner\">\n<p><strong>M\u00e4rks\u00f5nad:<\/strong> <a href=\"\/humal\/toovood\/marksonad\/ekstraheerimine\/\" data-type=\"marksonad\" data-id=\"82\">Ekstraheerimine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/andmekaeve\/\" data-type=\"marksonad\" data-id=\"58\">Andmekaeve<\/a><\/p>\n\n\n\n<p>Enne kui andmemudelid saavad lauludes mustreid tuvastada, tuleb tekstid teisendada formaati, mis v\u00f5imaldab neid s\u00fcstemaatiliselt v\u00f5rrelda. Inimesed suudavad tekstide sarnasusi \u00e4ra tunda lihtsalt neid lugedes ja v\u00f5rreldes, kuid algoritmid vajavad sisu numbrilist esitusviisi. Seega on tunnuste ekstraheerimine ja vektoriseerimine oluline sild kvalitatiivse materjali ja kvantitatiivse anal\u00fc\u00fcsi vahel.<\/p>\n\n\n\n<p><br>Selles t\u00f6\u00f6voos kasutatakse TF-IDF vektoriseerimist, et teisendada iga laul numbriliseks vektoriks. See laialt kasutatav meetod v\u00f5tab arvesse iga s\u00f5na iseloomulikkust antud tekstis, arvestades nii selle esinemissagedust laulus (termini esinemissagedus = TF) kui ka jaotust kogu korpuses (dokumendi esinemissageduse p\u00f6\u00f6rdv\u00e4\u00e4rtus = IDF). Minimaalse dokumendi esinemissageduse 5% seadmisega keskendub anal\u00fc\u00fcs terminitele, mis esinevad piisavalt sageli, et peegeldada kultuurilisi teemasid.<\/p>\n\n\n\n<p><br>Saadud TF-IDF maatriks teenib mitut eesm\u00e4rki: see annab sisendi LDA teemamudelitele, toetab hierarhilisi klastrite moodustamise meetodeid, nagu Wardi algoritm, ja toimib t-SNE poolt kasutatava k\u00f5rgedimensioonilise sisendandmena. t-SNE ise teostab projektsiooni madaldimensioonilisse ruumi, kuid vajab selleks TF-IDF omadusi l\u00e4htepunktina. See dimensioonide v\u00e4hendamise protsess loob kahem\u00f5\u00f5tmelise kaardi, mis aitab visualiseerida klastreid, leksikaalset sarnasust ja tekstidevahelisi seoseid. See tunnuste ekstraheerimise etapp toimib seega sillana toorete poeetiliste tekstide ja j\u00e4rgneva kvantitatiivse temaatilise anal\u00fc\u00fcsi vahel. Kuigi TF-IDF + t-SNE t\u00f6\u00f6voog toodab korpuse ruumilise esitusviisi, mis p\u00f5hineb \u00fchisel s\u00f5navaral ja leksikaalsetel mustritel, j\u00e4\u00e4b see keskendunuks laulude omavahelisele l\u00e4hedusele. Teemamudelite loomine toimib aga abstraktsemal tasandil, tuvastades kogu korpuse kujundavad varjatud teemad.<\/p>\n<\/div><\/div><\/div>\n\n\n\n<div class=\"wp-block-kadence-pane kt-accordion-pane kt-accordion-pane-7 kt-pane466_eb28c6-c1\"><div class=\"kt-accordion-header-wrap\"><button class=\"kt-blocks-accordion-header kt-acccordion-button-label-show\" type=\"button\"><span class=\"kt-blocks-accordion-title-wrap\"><span class=\"kt-blocks-accordion-title\"><strong>3.4.<\/strong> <strong>Teemamodelleerimine ja muud klasterdamismeetodid<\/strong><\/span><\/span><span class=\"kt-blocks-accordion-icon-trigger\"><\/span><\/button><\/div><div class=\"kt-accordion-panel kt-accordion-panel-hidden\"><div class=\"kt-accordion-panel-inner\">\n<p><strong>M\u00e4rks\u00f5nad:<\/strong> <a href=\"\/humal\/toovood\/marksonad\/teemade-modelleerimine\/\" data-type=\"marksonad\" data-id=\"164\">Teemade modelleerimine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/andmete-vastendus\/\" data-type=\"marksonad\" data-id=\"57\">Andmete vastendus<\/a>, <a href=\"\/humal\/toovood\/marksonad\/klasteranaluus\/\" data-type=\"marksonad\" data-id=\"35\">Klasteranal\u00fc\u00fcs<\/a><\/p>\n\n\n\n<p>J\u00e4rgmises etapis rakendati masin\u00f5ppemeetodeid andmestiku varjatud temaatiliste struktuuride tuvastamiseks. Esmalt kasutati latentset Dirichlet\u2019 jaotust (LDA) 35 teema tuvastamiseks, millest iga\u00fcht iseloomustab sageli koos esinevate ja sisuliselt seotud s\u00f5nade r\u00fchm. Iga laul oli tavaliselt seotud mitme teemaga, kuid kahe traditsiooni v\u00f5rdlemiseks vaadeldi \u00fcksnes iga teksti domineerivat teemat. Lisaks tehti t\u00e4iendav anal\u00fc\u00fcs BERTopic-mudeliga, mis oma detailsema teemajaotusega (95 teemat) pakkus alternatiivset vaatenurka ja avardas t\u00f5lgendusv\u00f5imalusi.<br>Teemamudelite k\u00f5rval kasutati hierarhilist klasterdamist ja t-SNE-tehnikat laulude leksikaalsete seoste visualiseerimiseks. Wardi hierarhiline klasterdamine r\u00fchmitas laule s\u00f5nakasutuse sarnasuse alusel, samas kui t-SNE l\u00f5i kahem\u00f5\u00f5tmelise kaardi, mis illustreeris, kuidas laulud moodustavad klastreid v\u00f5i kattuvad. Need meetodid t\u00e4iendasid teemamodelleerimist: LDA ja BERTopic pakkusid struktureeritud temaatilisi kategooriaid, t-SNE ja hierarhiline klasterdamine aga n\u00e4itlikustasid laulude paiknemist laiemas leksikaalses ja semantilises ruumis, tuues esile kahe suulise traditsiooni seosed ja erinevused.<br><\/p>\n<\/div><\/div><\/div>\n\n\n\n<div class=\"wp-block-kadence-pane kt-accordion-pane kt-accordion-pane-8 kt-pane466_f9ffdf-ac\"><div class=\"kt-accordion-header-wrap\"><button class=\"kt-blocks-accordion-header kt-acccordion-button-label-show\" type=\"button\"><span class=\"kt-blocks-accordion-title-wrap\"><span class=\"kt-blocks-accordion-title\"><strong>4. V\u00f5rdlev anal\u00fc\u00fcs ja tulemuste t\u00f5lgendamine<\/strong><\/span><\/span><span class=\"kt-blocks-accordion-icon-trigger\"><\/span><\/button><\/div><div class=\"kt-accordion-panel kt-accordion-panel-hidden\"><div class=\"kt-accordion-panel-inner\">\n<p><strong>M\u00e4rks\u00f5nad:<\/strong> <a href=\"\/humal\/toovood\/marksonad\/analuusimine\/\" data-type=\"marksonad\" data-id=\"21\">Anal\u00fc\u00fcsimine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/tolgendamine\/\" data-type=\"marksonad\" data-id=\"98\">T\u00f5lgendamine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/kontekstualiseerimine\/\" data-type=\"marksonad\" data-id=\"48\">Kontekstualiseerimine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/selgitamine\/\" data-type=\"marksonad\" data-id=\"79\">Selgitamine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/pohjendamine\/\" data-type=\"marksonad\" data-id=\"136\">P\u00f5hjendamine<\/a><\/p>\n\n\n\n<p>Kui temaatilised struktuurid olid tuvastatud, oli vaja tulemusi t\u00f5lgendada folkloristlike teadmiste ja kultuurikonteksti valguses. See etapp h\u00f5lmas ukraina ja eesti rahvalaulude v\u00f5rdlemist selliste teemade l\u00f5ikes nagu n\u00e4iteks pereelu, kosimine, p\u00f5llut\u00f6\u00f6 ja rituaalid. Kahe korpuse teemade jaotumise anal\u00fc\u00fcs \u2013 millised teemad esinevad ainult \u00fches, millised aga m\u00f5lemas traditsioonis \u2013 t\u00f5i esile nii suulise p\u00e4rimuse \u00fchisjooni kui ka kultuurispetsiifilisi narratiivseid mustreid.<\/p>\n\n\n\n<p>See t\u00f5lgendamisetapp sidus arvutuslikud tulemused traditsioonilise folkloristikaga. Teemaklastreid hinnati, k\u00f5rvutades neid v\u00e4ljakujunenud \u017eanriklassifikatsioonide, etnograafiliste kirjelduste ja suulise p\u00e4rimuse teooriatega, et arvutuslikud tulemused oleksid nii statistiliselt p\u00f5hjendatud kui ka kultuuriliselt t\u00e4henduslikud. Nii muundas v\u00f5rdlev anal\u00fc\u00fcs arvulised mustrid sisuliseks teadmiseks selle kohta, kuidas eri kultuurides on laulude kaudu v\u00e4ljendatud identiteeti, suhteid, emotsioone ja sotsiaalseid v\u00e4\u00e4rtusi.<\/p>\n<\/div><\/div><\/div>\n\n\n\n<div class=\"wp-block-kadence-pane kt-accordion-pane kt-accordion-pane-9 kt-pane466_e0ad62-bd\"><div class=\"kt-accordion-header-wrap\"><button class=\"kt-blocks-accordion-header kt-acccordion-button-label-show\" type=\"button\"><span class=\"kt-blocks-accordion-title-wrap\"><span class=\"kt-blocks-accordion-title\"><strong>5. Tulemuste visualiseerimine ja esitlemine<\/strong><\/span><\/span><span class=\"kt-blocks-accordion-icon-trigger\"><\/span><\/button><\/div><div class=\"kt-accordion-panel kt-accordion-panel-hidden\"><div class=\"kt-accordion-panel-inner\">\n<p><strong>M\u00e4rks\u00f5nad:<\/strong> <a href=\"\/humal\/toovood\/marksonad\/andmete-visualiseerimine\">Andmete visualiseerimine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/disain\/\" data-type=\"marksonad\" data-id=\"64\">Disain<\/a>, <a href=\"\/humal\/toovood\/marksonad\/diagrammide-koostamine\/\" data-type=\"marksonad\" data-id=\"65\">Diagrammide koostamine<\/a>, <a href=\"\/humal\/toovood\/marksonad\/graafika-programmeerimine\/\" data-type=\"marksonad\" data-id=\"88\">Graafika programmeerimine<\/a><\/p>\n\n\n\n<p>Viimane etapp h\u00f5lmas tulemuste esitamist visualiseeringutena. Dendrogrammid n\u00e4itavad laulude hierarhilist klasterdumist, samas kui t-SNE graafikud esitavad TF-IDF-andmete madalam\u00f5\u00f5tmelise projektsiooni, v\u00f5imaldades temaatilisi struktuure ja lauludevahelisi seoseid visuaalselt uurida. Kuigi t-SNE ise teemasid otseselt ei tuvasta, peegeldab see tekstide sarnasust s\u00f5nakasutuse p\u00f5hjal, mist\u00f5ttu graafikul ilmnevad klastrid kattuvad sageli teemamodelleerimise abil tuvastatud r\u00fchmadega. T\u00e4iendavad visualiseeringud kujutavad teemade osakaalusid, temaatilisi kattuvusi ja kultuuridevahelisi paralleele, aidates esitada keerukaid arvutuslikke tulemusi arusaadavamal kujul.<\/p>\n\n\n\n<p>Uurimusel on kolm peamist akadeemilist v\u00e4ljundit:<\/p>\n\n\n\n<p><strong>a. Konverentsiettekanne<\/strong><\/p>\n\n\n\n<p>Visuaalsed graafikud ja temaatilised kokkuv\u00f5tted l\u00f5imiti DHNB 2025 konverentsiettekande slaididesse, v\u00f5imaldades kuulajatel j\u00e4lgida t\u00f6\u00f6voogu ja m\u00f5ista tulemusi konkreetsete n\u00e4idete abil.<\/p>\n\n\n\n<p><strong>b. T\u00f6\u00f6voo dokumentatsioon HUMALis<\/strong><\/p>\n\n\n\n<p>HUMALi jaoks koostati \u00fcksikasjalikum samm-sammuline t\u00f6\u00f6voo kirjeldus, mis n\u00e4itab, kuidas iga metoodiline valik \u2013 eelt\u00f6\u00f6tlusest ja vektoriseerimise parameetritest kuni modelleerimiseni \u2013 m\u00f5jutab l\u00f5pptulemusi.<\/p>\n\n\n\n<p><strong>c. Ajakirjaartikkel<\/strong><\/p>\n\n\n\n<p>Uurimisprotsess ja -tulemused kavatsetakse avaldada eelretsenseeritavas teadusajakirjas. Visualiseeringud toetavad artikli arutlusk\u00e4iku, illustreerides temaatiliste struktuuride kultuuridevahelist v\u00f5rdlust.<\/p>\n<\/div><\/div><\/div>\n<\/div><\/div><\/div>\n<\/div><\/div>\n\n<\/div><\/div><\/div><\/div>\n\n<\/div><\/div><\/div>\n\n\n\n<div class=\"wp-block-group is-layout-constrained wp-block-group-is-layout-constrained\"><div class=\"kb-row-layout-wrap kb-row-layout-id466_1eaeb3-37 alignnone wp-block-kadence-rowlayout\"><div class=\"kt-row-column-wrap kt-has-1-columns kt-row-layout-equal kt-tab-layout-inherit kt-mobile-layout-row kt-row-valign-top\">\n\n<div class=\"wp-block-kadence-column kadence-column466_1ab585-72\"><div class=\"kt-inside-inner-col\">\n<h4 class=\"wp-block-heading\"><strong>Kasutatud kirjandus<\/strong><\/h4>\n\n\n\n<p class=\"kt-adv-heading466_314e29-cf wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading466_314e29-cf\">Dei, Oleksii (red.). 1965. Pisni Yavdokhy Zuikhy: zapysav Hnat Tantsiura [Songs of Yavdokha Zuikha: recorded by Hnat Tantsiura]. Kyiv : Naukova dumka. 810 s.<\/p>\n\n\n\n<p class=\"kt-adv-heading466_42b81e-dd wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading466_42b81e-dd\">Dmytrenko, Mykola &amp; Liudmyla Yefremova (red.). 2014. Narodni pisni Khmelnychchyny (z kolektsii zbyrachiv folkloru) [Folk songs of Khmelnytskyi region (from the collections of folklore collectors)]. Kyiv: Naukova dumka. 720 s.<\/p>\n\n\n\n<p class=\"kt-adv-heading466_b5e4b5-58 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading466_b5e4b5-58\">Myshanych, Stepan (red.). 1976. Pisni Podillia: zapysy Nasti Prysiazhniuk v seli Pohrebyshche. 1920-1970 rr. [Songs of Podillia: recordings of Nastia Prysiazhniuk in the village of Pohrebyshche. 1920-1970.] Kyiv: Naukova dumka. 520 p.<\/p>\n\n\n\n<p class=\"kt-adv-heading466_168b39-9b wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading466_168b39-9b\">Pritsak, Omeljan (1981). The Origin of Rus: Old Scandinavian Sources Other than the Sagas. Cambridge, Massachusetts: Harvard University Press<\/p>\n\n\n\n<p class=\"kt-adv-heading466_1b9915-50 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading466_1b9915-50\">Sarv, Mari &amp; Janika Oras,. 2020. From tradition to data: The case of Estonian runosong. In: Arv. Nordic Yearbook of Folklore, 76, 105\u2212117.<\/p>\n<\/div><\/div>\n\n<\/div><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Uurimuse eesm\u00e4rk oli tuvastada ukraina ja eesti rahvalaulude temaatilist kattuvust, kultuurilisi sarnasusi ja ainuomaseid teemasid arvutuslike meetodite abil, kasutades eelk\u00f5ige tehisintellektip\u00f5hist t\u00f5lget ja LDA-teemamodelleerimist. Kuigi ukraina ja eesti rahvalaulud esindavad erinevaid keele- ja kultuuritraditsioone (l\u00e4\u00e4nemeresoome ja idaslaavi), on m\u00f5lemat kultuuri \u00fchendanud ajaloolised kontaktiperioodid, mis v\u00f5ivad kajastuda ka rahvap\u00e4rimuses. Juba varakeskajal \u00fchendasid m\u00f5lemat piirkonda p\u00f5hja\u2013l\u00f5unasuunalised kaubateed, [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[77],"tags":[],"marksonad":[8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32],"eriala":[],"valjund":[],"andmete-meediatuup":[],"class_list":["post-466","post","type-post","status-publish","format-standard","hentry","category-toovood","marksonad-analuusimine","marksonad-andmekaeve","marksonad-andmete-vastendus","marksonad-andmete-visualiseerimine","marksonad-diagrammide-koostamine","marksonad-disain","marksonad-eeltootlus","marksonad-ekstraheerimine","marksonad-graafika-programmeerimine","marksonad-klasteranaluus","marksonad-kogumine","marksonad-kontekstualiseerimine","marksonad-koostamine","marksonad-korraldamine","marksonad-lemmatiseerimine","marksonad-loomuliku-keele-tootlemine","marksonad-pohjendamine","marksonad-rikastamine","marksonad-selgitamine","marksonad-suntaksianaluus","marksonad-teemade-modelleerimine","marksonad-tolgendamine","marksonad-tolkimine","marksonad-transkodeerimine","marksonad-vordlemine"],"_links":{"self":[{"href":"https:\/\/www.etkad.ee\/en\/wp-json\/wp\/v2\/posts\/466","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.etkad.ee\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.etkad.ee\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.etkad.ee\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.etkad.ee\/en\/wp-json\/wp\/v2\/comments?post=466"}],"version-history":[{"count":29,"href":"https:\/\/www.etkad.ee\/en\/wp-json\/wp\/v2\/posts\/466\/revisions"}],"predecessor-version":[{"id":1654,"href":"https:\/\/www.etkad.ee\/en\/wp-json\/wp\/v2\/posts\/466\/revisions\/1654"}],"wp:attachment":[{"href":"https:\/\/www.etkad.ee\/en\/wp-json\/wp\/v2\/media?parent=466"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.etkad.ee\/en\/wp-json\/wp\/v2\/categories?post=466"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.etkad.ee\/en\/wp-json\/wp\/v2\/tags?post=466"},{"taxonomy":"marksonad","embeddable":true,"href":"https:\/\/www.etkad.ee\/en\/wp-json\/wp\/v2\/marksonad?post=466"},{"taxonomy":"eriala","embeddable":true,"href":"https:\/\/www.etkad.ee\/en\/wp-json\/wp\/v2\/eriala?post=466"},{"taxonomy":"valjund","embeddable":true,"href":"https:\/\/www.etkad.ee\/en\/wp-json\/wp\/v2\/valjund?post=466"},{"taxonomy":"andmete-meediatuup","embeddable":true,"href":"https:\/\/www.etkad.ee\/en\/wp-json\/wp\/v2\/andmete-meediatuup?post=466"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}