Töövoog võimaldab analüüsida eri kategooriate mainimissagedusi pika ajavahemiku jooksul või tihedate andmetega, et teha nähtavaks sarnasused ja tõstatuvad mustrid. Andmed koondatakse maatriksiteks, mille põhjal luuakse kuumkaarte (heatmap’e), mis võimaldavad esitada suuri andmehulkasid visuaalselt selgelt ja võrreldavalt. Neid visuaale saab lugeda nii ajas kui ka kategooriate lõikes, mis teeb võimalikuks eri perioodide ja teemade kõrvutamise ning ühendab intuitiivse kvalitatiivse visuaalse analüüsi kvantitatiivsete meetoditega. Seejuures rakendatakse matemaatilisi teisendusi (nt normaliseerimine ja logaritmitransformatsioon), mis aitavad esile tuua suhteid eri vaatepunktidest ja juhul kui andmete väärtused on väga erinevad. Täiendavat vaatenurka pakuvad teised andmeteaduslikud meetodid, nagu ajaseeriate vektoriseerimine ja klasterdamine.
Näites uurisime sõna „Ukraina” mainimissagedust 28 erinevas keeles 15 aasta jooksul Twitteri (nüüd X) andmestikus, mis põhineb avalikust APIst pärit andmetel. Eesmärk oli mõista, kuidas ja millal Ukrainale osutatud tähelepanu eri keeltes kasvanus või vähenes.
- Authors:
- Mark Mets (Tallinna Ülikool, Eesti Kirjandusmuuseum)
- Maximilian Schich (Tallinna Ülikool)
- Peter S. Dodds (Vermonti Ülikool, USA)
- Licence: CC-BY
- Date/version: 18.12.2025
- Keywords (content): vektoranalüüs, teisendused, visualiseerimine, interdistsiplinaarsus, Ukraina, sotsiaalmeedia, Twitter, tähelepanu
- Keywords (Tadirah): Data Visualization, Sequence alignment, Distance measurement, Principal component analysis, Cluster analysis, Data mining
