Triibuseelikute mustrianalüüs

See töövoog kirjeldab, kuidas masinõppe toel piltide mustreid võrdleme. Soovime teada saada, milline mustriloogika valitses 18.–19. sajandi Eesti triibuseelikutes ning kuidas need mustrid suhestuvad Inglismaalt Norwichi tehasest pärit triibuliste läigestatud pinnaga villaste callimanco-kangastega. Töövoog kombineerib digihumanitaaria meetodeid ja masinõpet. Suurte pildiandmekogude analüüsimiseks kasutame visuaalsete mustrite äratundmiseks loodud masinõppemudeleid –  konvolutsioonilisi närvivõrke (CNN-e). CNN-i kasutatakse eelkõige visuaalsete tunnuste eraldamiseks ja mustrite sarnasuse hindamiseks, mitte uue mudeli nullist treenimiseks. CNNi abil saame võrrelda triibumustrite rütme, värvikasutust ja struktuuri ning tuvastada võimalikud sarnasused kahe tekstiilitüübi vahel. Uurimuse keskne küsimus on, kas Eesti rahvarõivaseelikud olid inspireeritud konkreetsetest imporditud kangastest ning millised visuaalsed tunnused seost kõige paremini selgitavad.
Töövoog kirjeldab protsessi alates muuseumikogude piltide kogumisest ja standardiseerimisest kuni mustrianalüüsi tulemuste tõlgendamiseni. Praegu oleme uurimuses tulemuste tõlgendamise faasis.

Töövoo Sammud

Märksõnad: Avastamine, Kogumine, Kontekstualiseerimine, Infootsing

Eesmärk

Selles etapis koondame uurimistöö aluseks vajalikud visuaalsed allikad. Meie põhifookus Eesti materjali puhul on Eesti Rahva Muuseumi kollektsioonidel, mis on avalikult kättesaadavad MUIS-i veebivärava kaudu. Lisaks kogume fotosid Inglismaalt pärinevatest Norwichi callimanco-kangastest – müügikataloogidest ja tehase väljasaatmisraamatutest. Sellesse etappi kuulub ka kontaktivõtt eri muuseumide ja kangauurijatega, et leida võimalikult esinduslik ja võrdlemiseks sobiv pildimaterjal.

Seos töövooga

Allikate koondamine loob aluse kogu hilisemale digitaalsele analüüsile. Ilma piisava hulgata ei ole võimalik mustrite variatiivsust statistiliselt kirjeldada ega masinõppemudeleid hinnata. Selles etapis tekib arusaam sellest, millised triibumustrid on üksteisega üldse võrreldavad ja millises ulatuses võib Eesti seelikuid kõrvutada callimanco traditsiooniga. Kõik järgnevad töövoo sammud sõltuvad sellest, et visuaalne allikakorpus oleks põhjalikult ja läbipaistvalt koondatud.

Märksõnad: Teisendus, Eeltöötlus

Eesmärk

Selle tööetapi eesmärk on ette valmistada muuseumifotodest ühtne ja võrreldav pildikorpus edasiseks analüüsiks. Kuna fotod on tehtud väga erinevates tingimustes (valgus, perspektiiv, mõõtkava), peame ühtse võrdlusbaasi loomiseks neid töötlema. Iga triibu lõikame välja standardses mõõtkavas (Eesti puhul 10 ja 20 cm, callimanco puhul 9 ja 21 cm) ning vajadusel korrigeerime pildinurka, sest isegi väike kaldenurk võib masinõppes anda eksitavaid tulemusi. Sorteerime kõik triibud suuruste ja päritolu järgi kaustadesse — eraldi Eesti ja Inglise materjal ning eraldi mõõtkavad u 10 cm ja u 20 cm. Pilditöötlus toimub käsitsi programmiga GIMP, pildid salvestatakse esialgu Google Drive’i ja Eesti Rahva Muuseumi OneDrive’i.

Seos töövooga

Ühtne pilditöötlus on masinõppe jaoks kriitiline. CNN-mudelid on tundlikud visuaalse müra suhtes ja võivad muidu õppida vale signaali (varjud, valgus, foto kvaliteet), mitte mustrilist loogikat. Selle etapi tulemusel saame masinõppevalmis, standardiseeritud pildikogu, millega saab usaldusväärselt tuvastada triibumustrite struktuurseid sarnasusi ja erinevusi

Märksõnad: Teisendus, Eeltöötlus

Eesmärk

Selle etapi eesmärk on vähendada pildimaterjalis esinevat visuaalset müra ning taandada kangamuster analüüsiks sobivale kujule. Rakendatakse meetodeid, mis rõhutavad triibumustrite põhistruktuuri, nagu värvipindade ühtlustamine, heleduse normaliseerimine ning mustri taandamine ühe- või mitmemõõtmeliseks signaaliks.
Lisaks eristatakse mustri olulised ja ebaolulised elemendid, et edasine analüüs keskenduks triipude rütmile, piiridele ja laiuste suhtele, mitte juhuslikele pilditehnilistele erisustele.

Seos töövooga

See samm loob eelduse kõigi järgnevate analüütiliste etappide jaoks. Ilma mustri taandamise ja müra vähendamiseta võivad nii värvi-, rütmi- kui ka sügavõppemeetodid reageerida ebaolulistele visuaalsetele signaalidele. Mustri eeltöötlus aitab tagada, et arvutuslik analüüs käsitleb kangast kui mustrit, mitte kui fotot.

Märksõnad: Annoteerimine, Identifitseerimine, Visuaalne analüüs

Eesmärk

Enne arvutuslike analüüsimeetodite rakendamist määratleme uurijapoolselt, millised visuaalsed mustritunnused on võrdluses sisuliselt olulised. Keskendume triibumustrite rütmile, värvigruppide jaotusele, triipude laiuste suhtele ning mustri piiride kujunemisele.
Selleks kasutatakse eri kaaludega visuaalseid võrdlusi, piiratud hulgal käsitsi märgendatud näiteid ning vahepealsete tulemuste tõlgendamist.
Märgistamine ei toimi siin eraldiseisva õpetusandmestikuna, vaid kontrollmehhanismina, mis aitab hinnata, kas süsteem „vaatab õiget asja“ või kaldub kõrvale ebaoluliste pilditehniliste tunnuste poole.

Seos töövooga

See samm seob inimliku mustritaju ja arvutusliku analüüsi. Ilma sellise kontrollita ei ole võimalik hinnata, kas edasised värvi-, rütmi- ja sügavõppemeetodid annavad sisukaid tulemusi. Samm loob aluse järgmisele analüüsietapile.

Märksõnad: Analüüsimine, Kujutuvastus, Masinõpe

Eesmärk

Selles etapis arvutatakse kangaste visuaalsed tunnused mitmel tasandil. Analüüs hõlmab värvipalettide jaotust ja osakaale, triibusegmentide laiuseid ja rütmilist järjestust ning mustri piiride struktuuri. Neid tunnuseid käsitletakse nii iseseisvalt kui ka omavahelises seoses.
Paralleelselt rakendatakse eelõpetatud konvolutsioonilisi närvivõrke (CNN), et kirjeldada mustrite üldist sügavvisuaalset sarnasust ja võrrelda seda teiste, selgemini tõlgendatavate tunnustega.
Erinevad tunnused kirjeldavad mustrit eri vaatenurkadest ning võimaldavad hinnata, kas sarnasus tuleneb värvikasutusest, rütmist, struktuurist või nende kombinatsioonist.

Seos töövooga

Mitmetasandiline tunnuste analüüs võimaldab vältida ühe meetodi domineerimist ning loob aluse paindlikuks ja tõlgendatavaks mustrivõrdluseks.

Märksõnad: Analüüsimine, Uurimine, Visuaalne analüüs

Eesmärk

Analüüsime eri arvutuslike meetodite väljundeid nii kvantitatiivsete mõõdikute kui visuaalsete võrdluste abil. Uurime korduvuste sagedusi, struktuuriliste sarnasuste jaotusi ning mustrite grupeerumist. Selgitame, millised triibud on Eesti ja Inglismaa vahel kõige lähedasemad ja millised seelikud moodustavad omaette visuaalse rühma.

Seos töövooga

See etapp loob silla masinõppe tehnilise väljundi ja kultuuriloolise uurimuse vahel. Analüüs annab esimesed tõendid selle kohta, kas tuvastatud mustrid võivad viidata callimanco eeskujule või hoopis iseseisvale Eesti traditsioonile. Samuti aitab see hinnata mudeli tugevaid ja nõrku kohti.

Märksõnad: Tõlgendamine, Kontekstualiseerimine

Eesmärk

Seome mudeli leitud mustrid etnograafilise, ajaloolise ja kunstiajaloolise materjaliga. Analüüsime, kuidas triibud rühmituvad piirkondade, ajastute või tehniliste tunnuste järgi ning millistes aspektides Eesti muster kattub callimanco traditsiooniga või erineb sellest.

Seos töövooga

Tõlgendus näitab, kas tuleb kaasata uusi võrdlusmaterjale (nt Rootsi, Läti või Saksa kangad), täpsustada mudeli parameetreid või vaadata mõnda seelikut uuesti üle. See etapp loob aluse teadusartiklitele ja doktoritöö järeldustele.

Märksõnad: Levitamine, Avaldamine

Eesmärk

Kui uurimistulemused on huvitavad ja piisavalt tugevad, vormistame need publikatsioonideks, konverentsiesinemisteks või visualiseeritud andmeväljaanneteks. Samuti kirjeldame metoodikat, mis aitab teistel uurijatel sarnast lähenemist rakendada. Lisaks paneme enda kasutatud andmed üles selleks valitud repositooriumisse.

Seos töövooga

Avalikustamine lõpetab töötsükli, kuid loob aluse uutele uurimistele. Tagasiside abil saame täiendada nii mudelit kui ka kultuuriloolist tõlgendust ning tugevdame digihumanitaaria ja rahvarõivauuringute vahelist koostööd.