Nedlukningen har ændret stemningen og tonen i danske corona-tweets

Tweets om corona har generelt en mere negativ stemning end andre tweets. Efter Statsministeren annoncerede nedlukningen, blev stemningen på Twitter angående corona mere positiv. Siden annonceringen taler Twitter-Danmark mindre om frygt og mere om (mis)tillid. Men tillid og mistillid til hvem og til hvad - og hvorfor?

^{Udarbejdet af: Emilie Gregersen, Kristoffer Glavind, Morten Axel Pedersen, Sofie Astrupgaard, Thyge Enggaard & Tobias Gårdhus}

Introduktion

Vores første opslag kortlagde hvilke emner, der optog Twitter-Danmark i forbindelse med corona-pandemien. Dette opslag består af fire dele, der ligger i forlængelse heraf:

Stemningen i danske corona-tweets: En kvantitativ analyse af den overordnede tone i danske tweets op til og efter at regeringen annoncerede den delvise nedlukning af Danmark.
Tonen i danske corona-tweets: En analyse af hvordan følelser og attituder sprogligt repræsenteres på Twitter og udvikler sig i samme periode. Denne består af tre dele:
1. En kvantitativ analyse af tonen i corona tweets baseret på en ordbogs-model importeret fra National Research Council Canada (NRC).
2. En kvalitativ analyse af de tweets, der omhandler tillid.
3. En kvali-kvantitativ justering af analysen i 2.a. i lyset af 2.b
Udvikling i tonen for særlige emner: Opdaterede emne-klynger fra “Corona-diskussioner i det danske Twitter-landskab” på baggrund af nye data. Dette indgår i afsnit 2.a. herover.
Konklusion og næste opslag: Som del af afsnit 1 og 2 redegør vi for forskellige teorier, der kan pege i retning af hvorfor vores analyser ser ud som de gør. Her samler vi op, og skitserer en retning for videre analyse

1. Stemningen i danske corona-tweets blev mindre negativ efter nedlukningen - men hvad betyder det?

Figur 1 viser udviklingen i stemningen for alle danske tweets, der indeholder ord forbundet med corona^[1], og for nogle af de tweets, der ikke indeholder sådanne ord^[2]. Den røde, stiplede linje markerer d. 11. marts, hvor nedlukningen af store dele af Danmark blev annonceret. Den gule, stiplede linje markerer annonceringen af den delvise genåbning d. 30. april.

Figur 1 - Gennemsnitlig sentiment-score per dag over perioden

Figuren viser, at tweets, der omhandler corona i gennemsnit blev mere positivt ladede i forbindelse med annonceringen af nedlukningen. Derimod har stemningen i de tweets i vores datasæt, som ikke direkte nævner corona-relaterede ord, været nogenlunde konstant i hele perioden^[3].

Vores undersøgelse af stemningen i disse tweets er lavet ved brug af en sentiment-analyse. Denne metode, der ofte anvendes til kvantitative tekstanalyser, bygger på en liste af ord (‘ordbog’), som har fået tildelt en score fra -5 for det mest negative (fx “kraftedme”) til +5 for det mest positive (fx “hurra”). Afsnit 1.1. beskriver denne metoden og dens antagelser i flere detaljer, samt de forskellige fordele og ulemper, som er forbundet hermed.

Ændringen i stemningen, som Figur 1 antyder, baserer sig på et gennemsnit over scoren for alle tweets, og kan derfor både stamme fra en faldende brug af negativt ladede ord og fra en stigende brug af positivt ladede ord. Figuren viser en gennemsnitlig ændring i sentiment på ~0,45. Det svarer til en ekstra “tak” i hver fjerde til femte tweet efter annonceringen af nedlukningen, eller tilsvarende at “ødelagt” optræder en gang mindre i hver fjerde til femte tweet^[4]. Afsnit 1.2. viser 40 ord, der på forskellig vis bidrager til ændringen.

I fortolkningen af denne ændring, er det vigtigt at holde sig for øje, at meningsdannere, politikere og journalister er overrepræsenterede på det danske Twitter, som således ikke er repræsentativ for den brede befolkning. Vores sentiment-analyse kan give en idé om den overordnede stemning i opslagene på dette sociale medie, som formuleret af meningsdannere, beslutningstagere og nyhedsformidlere, samt den del af befolkningen, der er aktive på denne platform, og som derved er med til at forme den offentlige opinion.

Et andet væsentligt forhold, er hvorvidt ændringen i stemning skyldes at forskellige Twitter brugere var aktive før og efter annonceringen af nedlukningen. Ved kun at analysere ~900 brugere, der er aktive over hele perioden, finder vi, at selv for denne gruppe, er stemningen i deres tweets blevet mindre negativ. Afsnit 1.3. udfolder denne validering.

En sentiment-analyse har den fordel, at store tekstmængder kan behandles på én gang, og pege på mulige mønstre. Stigningen i positivt-ladede ord på det danske Twitter i forbindelse med corona-krisen er et godt eksempel. Imidlertid kan en sådan analyse ikke forklare hvorfor eller i hvilke sammenhænge brugen af bestemte ord har ændret sig - ej heller hvorvidt og i hvilken forstand ændringen i stemningen reflekterer brugernes egne følelser og tanker. Hvorfor har Twitter-Danmark benyttet sig af færre negativt-ladede ord efter nedlukningen? En spindoktor vil måske forklare det som et udtryk for opbakning til regeringens håndtering af krisen - men sådanne nuancer og årsager kan denne analyse ikke sige noget om.

I slutningen af denne analyse nævner vi en række samfundsvidenskabelige forklarings- og fortolkningsmodeller, der ville kunne besvare disse spørgsmål. Centrale blandt disse er:

Nedlukningen kan have mindsket folks trusselsopfattelse, idet de oplever at have adgang til redskaber til at håndtere corona-pandemien og genetablere en hverdag.
Med tiltagende og kommunikationen omkring nedlukningen lykkedes det regeringen og myndighederne at foranledige et sceneskifte for den offentlige debat i landet.
Nedlukningen kan have mindsket dissonansen mellem folks handlinger og deres opfattelse af verden (fx at man kan blive smittet eller smitte ved at gå på arbejde).

1.1. Kvantitative stemnings-analyser af tweets

1.1.1. Sentiment-analyser og AFINN-modellen

Ifølge litteraturen på området har sentiment-analyser til formål at identificere og kvantificere den overordnede “stemning” (“sentiment”) eller “holdning” (“opinion”) i en tekst^[5]. Metoden består grundlæggende i en opdeling af en tekst som værende hhv. ‘positiv/for’ eller ‘negativ/imod’. Kvantitative sentiment-analyser er typisk ordbogs-baserede, dvs. de sammenligner en given tekst (fx et tweet) med en liste af ord, der er klassificeret som enten positivt eller negativt ladede. Nogle ordbøger er udviklet over længere tid og på tværs af forskellige kontekster, andre er tilpasset eller udviklet specifikt til en given undersøgelse.

I forhold til sentiment-analyser af danske tekster, har lektor Finn Årup Nielsen fra DTU Compute udviklet den såkaldte afinn-model, der er en ordbogs-baseret metode til at kvantificere stemningen i store tekstmængder. Afinn-modellen tildeler en ladning (‘positiv’ eller ‘negativ’) til hvert ord der indgår i denne ordbog, som desuden er gradueret på en skala fra fx -5 (mest ‘negativ’) til +5 (mest ‘positiv’). Sentiment-scoren for et enkelt tweet er givet som summen af sentiment-scoren for hvert ord, der indgår i tweetet^[6].

Figur 2 er en liste af udvalgte eksempler på ord samt antallet af ord for hver score i afinn-modellen^[7]. Her er det værd at bemærke to ting. For det første har langt de fleste ord en lav til moderat ladning (knap 80 pct af ordene har en score mellem -2 og 2. For det andet er der langt flere negativt ladede ord en positivt ladede ord. Cirka to-tredjedele af ordene er negativt ladede, hvilket betyder, at der er omtrent dobbelt så mange negativt ladede ord, som positivt ladede ord.

Score	Eksempler på ord	Antal ord i denne kategori
5 (mest positiv	“hurra”, “betagende”, “superb”	4
4	“Eminent”, “mesterværk”, “wow”	52
3	“bedste”, “glædelig”, “uimodståelig”	260
2	“ambitiøse”, “tak”, “velfortjent”	710
1	“accepteret”, “begår”, “fortjent”	208
-1	“affald”, “begravelser”, “stoppe”	308
-2	“frygt”, “smitte”, “voldsom”	1554
-3	“angst”, “tåbelig”, “voldelig”	409
-4	“fuck”, “lort”, “tortur”	37
-5 (mest negativ)	“kraftedme”, “møgso”, “son-of-a-bitch”	9

Figur 2 - Eksempler på ord og deres ladning fra afinn-ordbogen

1.1.2. Begrænsninger ved sentiment-analyser

Sentiment-analyser er en effektiv måde at kategorisere stemningen i store mængder tekst, men metoden indeholder en række begrænsninger samt nogle potentielt problematiske antagelser, som kalder på varsomhed og skepsis. Særligt kan man fremhæve følgende:

Ord kan ikke nødvendigvis inddeles i ‘positive’ ‘neutrale’, og ‘negative’. ‘Krise’ er et eksempel på et ord, hvis ladning er svær at afgøre i den nuværende situation - er det ‘negativt’ eller ‘neutralt’?
Selv for ord, der i én kontekst synes at udtrykke noget ‘positivt’ eller ‘negativt’ [fx “en række virksomheder har udnyttet krisen til at forbedre deres produkter.”], kan denne forståelse ændres, når samme ord bruges i en ny kontekst [fx “en række virksomheder har udnyttet krisen ved at snyde sig til midler fra hjælpepakkerne.”]. Slang og udvikling af ord betydning på tværs af generationer kan også bidrage til ambivalens; ordet ‘sygt’ er eksempelvis ofte et positivt ladet ord for unge mennesker.
En tekst samlede udtryk kan ikke nødvendigvis opsummeres som en sum af enkelte, udvalgte ord. Ironi og sarkasme kan eksempelvis ændre komplet på forståelsen af teksten.
Enhver konkret udvikling af en ordbog indeholder en række valg af hvilke ord der indgår, og hvilke der ikke gør. Nogle ordbøger er udelukkende baseret på menneskelige vurderinger; andre benytter sig af en såkaldt superviseret tilgang, hvor en computer trænes til at generaliserer en menneskelig vurdering. I begge tilfælde kan der opstår ‘fejl’. På listen over positive ord, bliver brugt relativt mindre (se afsnit1.2.), indgår fx ordet ‘grand’, som vi ikke vurderer til at være ‘positivt’ (og måske slet ikke et dansk ord).
Størrelsen på ordbogen (hvor mange ord er medtaget) kan påvirke sentiment-scoren; jo flere ord, der er medtaget, des større kan sentiment-scoren blive. Dette er særligt en udfordring for mindre ordbøger, hvilket er en af grundene til, at vi i disse analyser har benyttet os af eksisterende ordbøger, frem for at udvikle vores egne.

1.2. Hvilke ændringer i ordbrug er med til at drive udviklingen?

For bedre at forstå, hvad der driver den gennemsnitlige udvikling i stemningen (+0.43), har vi kortlagt hvilke ord i afinn-ordbogen, der bliver brugt mere og mindre. Overordnet set kan ændringen opdeles i fire dele:

Negativt ladede ord, som bruges relativt mindre, øger den gennemsnitlige score med 0.65.
Positivt ladede ord, som bruger relativt mere, øger den gennemsnitlige score med 0.43.
Negativt ladede ord, som bruges relativt mere, mindsker den gennemsnitlige score med 0.52.
Positivt ladede ord, som bruges relativt mindre, mindsker den gennemsnitlige score med 0.13.

Figur 3 viser de ti ord, der indenfor hver af de fire kategorier bidrager mest til den samlede udvikling i gennemsnitligt sentiment jævnfør afinn-modellen. Overordnet kan vi sige at:

De negativt ladede ord skifter fra at omhandle ‘aflysning’, ‘smitte’, og ‘frygt’, til at omhandle ‘krise’ og ‘død’.
De positivt ladede ord skifter fra at omhandle ‘anbefalinger’, ‘oplyser’ og ‘positiv’ til at omhandle ‘fantastisk’, ‘støtte og ‘glad.

Negativt ladede ord, der bruges relativt mere	Negativt ladede ord, der bruges relativt mindre	Positivt ladede ord, der bruges relativt mere	Positivt ladede ord, der bruges relativt mindre
krisen	aflyse	bedre	grand^[8]
corona-krisen	aflyser	fantastisk	anbefalinger
døde	aflyst	støtte	sjov
dødsfald	ramt	glad	oplyser
krise	smitte	når	anbefaler
død	frygt	hjælpe	positiv
corona-krise	smittede	god	anbefaling
svært	panik	hjælp	roligt
udsatte	influenza	tak	vækst
kriser	smittet	godt	forbedre

Figur 3 - Top 10 ord indenfor hver kategori, listet efter bidrag til ændring i gennemsnitlig sentiment

1.3. Skyldes udviklingen, at det ikke er de samme brugere, der har været aktive på Twitter før og efter nedlukningen?

I fortolkningen af indeværende resultater, er det væsentligt at holde sig for øje, om ændringen i stemningen udelukkende eller primært skyldes en ændring i hvilke brugere, der er aktive, eller hvorvidt stemningen rent faktisk forandres i tweets fra de samme brugere. Man kunne således forestille sig, at brugere, der generelt benytter flere negativt ladede ord, er blevet mindre aktive efter annonceringen af nedlukningen. Det kan også være at brugere, der generelt benytter flere positivt ladede ord, blev mere aktive.

For at undersøge dette, viser Figur 4 udviklingen i gennemsnitligt sentiment for 924 brugere, der har været aktive i vores datasæt mindst to gange i hver af de følgende perioder: 24/2-11/3, 12/3-30/3, 31/3-14/4 og 15/4-28/4. Som det fremgår af Figur 4, sker der også for denne gruppe et skifte efter annonceringen af nedlukningen. Udviklingen for denne gruppe af Twitter-brugere er endda helt på niveau med udviklingen for hele Twitter (~0.45).

Figur 4 - Ændring i gennemsnitlig sentiment for brugere, der er aktive over hele perioden

At analysens resultater inden for individer stemmer godt overens med de overordnede resultater, tyder på, at udviklingen i Figur 1 ikke kun skyldes at andre Twitter brugere er aktive efter annonceringen af nedlukningen, men at stemningen også ændrer sig i enkelte brugeres tweets.

1.4. Fire mulige forklaringer på ændringen i stemningen

Sentiment-analyser giver ikke indsigt i hvorfor stemningen i danske corona-tweets har ændret sig. Metodens usikkerheder og manglende nuancer betyder endvidere, at man skal være varsom med at fortolke resultaterne alt for entydigt. Herunder følger fem mulige forklaringer, der alle bygger på etablerede samfundsvidenskabelige teorier:

Ny politisk agenda: Ud fra et standard politologisk perspektiv, med fokus på strategisk politisk kommunikation og mediehåndtering, er det med nedlukningen muligvis lykkes regeringen at bevæge og forskyde samtalen på Twitter i en - for dem - mere fordelagtig retning. Mere defensivt udtrykt kan man sige, at nedlukningen muligvis udgjorde en reaktion fra politikerne, der (med en mindre forsinkelse end det var tilfældet i fx UK) bragte regeringens budskab tilbage i overensstemmelse med den offentlige stemning på Twitter.
Sceneskifte i den offentlige debat: Med inspiration fra klassiske sociologiske teorier kan det argumenteres, at nedlukningen markerede et sceneskifte for den offentlige samtale. Mere specifikt opstod en scene (på Twitter og andre medier), der i højere grad var defineret omkring emner og retorikker som “samfundssind” og “solidaritet”, alt imens det hidtidige fokus på corona som en ukendt og udefrakommende fare gled mere i baggrunden. Den stærkt begrænsede offentlige debat og politiske uenighed om statens håndtering af corona-krisen (særligt i perioden lige efter nedlukningen) kunne tyde på, at der skete et sådan sceneskifte.
Øget håndteringsevne: Folks oplevelse af farer ændret og reduceres typisk, hvis de oplever at have adgang til redskaber og strategier til at håndtere disse og etablere en hverdag med faste rutiner. De mange planer og procedurer indført i forbindelse med nedlukningen, kan i denne optik have forandret folks opfattelse og fornemmelse af en generel og allestedsnærværende trusselsopfattelse til en mere konkret og dermed påvirkelig ‘risikoopfattelse’. Analytiske tilgange, der fokuserer på “risikoaversion” (at folk typisk vil foretrække en fastlagt hverdag, selv hvis den indebærer reduktion af deres frihed, frem for usikkerheden om hvorvidt samfundet fx er lukket ned eller ej) eller “frihedens tyranni” (det, at folk typisk bliver mindre glade, hvis de selv skal vælge, og dette særligt i situationer, hvor disse valg er svære at foretage) spiller muligvis også en rolle i denne sammenhæng.
Mindre kognitiv dissonans: Mennesker har det typisk svært, hvis de oplever en alt for stor forskel mellem deres egen hverdag og samfundets tilstand generelt (for eksempel oplevelsen af at gå på arbejde, samtidig med, at der hersker en almen opfattelse af corona som en fare, der kræver en akut ændring i folks vaner). Ved at bringe folks specifikke handlinger i større overensstemmelse med den generelle opfattelse, kan nedlukningen have bidraget til at mindske dissonansen, hvilket kan have udtrykt sig i stemningen på Twitter.

2. Twitter-Danmark taler mere om tillid - men udtrykkes der tillid eller mistillid, og til hvem?

Ved at dele ord op i positivt ladede, neutrale eller negativt ladede, er der mange sproglige nuancer, som går tabt. For bedre at forstå, hvordan Twitter-Danmark taler om corona, har vi derfor også undersøgt tonen i de corona-relaterede tweets.

Figur 5 viser udviklingen i andelen af corona-tweets, der indeholder ord, som kan knyttes til hvad vi samlet betegner som otte toner. Bemærk, at et tweet godt kan være knyttet til en tone, uden nødvendigvis selv at give udtryk for samme tone. Eksempelvis vil tweets, der udtrykker mistillid også indgå i tonen tillid, ligesom tweets, der udtrykker at man ikke er bange, også vil indgå i tonen frygt. Gennemsnittet for den første uge (24/02-01/03) er sat som indeks 100, hvilket betyder, at udviklingerne i kurverne skal afkodes relativt hertil.

Figur 5 - Udviklingen i andelen af tweets, der omhandler hver af de otte toner jævnfør NRC-modellen.

Figuren viser, at andelen af tweets, der bruger ord som omhandler tillid eller mistillid stiger mest, mens andelen af tweets, der bruger ord omhandlende frygt falder relativt til gennemsnittet over den første uge^[9]. De resterende seks toner følges i højere grad ad og stiger omtrent halvt så meget som tillid. For alle otte toner, gælder det at udviklingen i mindre grad synes at udspille sig lige omkring annonceringen af nedlukningen, end det var tilfældet i forbindelse med vores stemnings-analyse ovenfor.

Figur 5 baserer sig på en oversat udgave af en model udviklet af National Research Council Canada (NRC)^[10]. Ligesom sentiment-analysen, består denne model i en ordbogs-baseret inddeling af alle tweets i henhold til en række kategorier for såkaldt elementære følelser. Årsagen til, at vi her ikke betegner disse som “følelser” men som “affekter” og “attituder” er, at en kvantitativ tekst ikke kan sige noget om i hvilken grad disse afspejler brugeres følelsesliv. Snarere bør de betragtes som aspekter af den måde sproget bruges på. I afsnit 2.1 beskriver hvad vi forstår ved sproglige toner og giver en introduktion til NRC-modellen.

Der kan være betydelig usikkerhed og støj forbundet med ordbogs-analyser af toner som indeværende. Denne usikkerhed øges ved det faktum, at vi her har valgt at bruge en ordbog som er maskinoversat fra engelsk. For nærmere at undersøge og validere NRC-modellens brugbarhed i en dansk corona-kontekst, har vi håndkodet ~500 tweets fra vores datasæt, der ifølge den oversatte NRC-ordbog omhandler tillid. For omkring 65% af de ~500 tweets, angav den kvalitative kodning, at de ikke gav udtryk for hverken tillid eller mistillid. Afsnit 2.2. beskriver vores kodning og uddyber resultaterne heraf, herunder hvordan den klassificerede (mis)tillid for de resterende ~35% fordeler sig på forskellige aktører.

Derpå lavede vi en kvalitativ analyse af de 100 mest brugte ord for hver tone. Formålet hermed var at vurdere, hvilke af ordene fra den maskinoversatte ordbog, der rent faktisk var passende at associere med de respektive toner i en dansk-sproglig corona-kontekst. Dette efterlod os med mellem 14 og 24 ord for hver af de otte toner. Baseret på denne kvalitativt justerede ordbog kørte vi den kvantitative tone-analyse igen. Resultatet var, at de overordnede tendenser fra den første kørsel gik igen. Efter nedlukningen stiger (mis)tillid mest, mens frygt falder mest. Fem af de seks andre toner stiger i nogenlunde samme tempo. Der er dog også forskelle, særligt hvad angår “afsky”, som i den justerede model falder. I afsnit 2.3. gennemgår vi denne justering af NRC-ordbogen og viser de opdaterede resultater.

Hvorfor sker denne ændring i tonen? I afsnit 2.4. udfolder vi følgende mulige fortolkninger:

Corona-krisen tydeliggør elementer fra vores hverdagsliv som vi ellers tager for givet. Tillid til andre mennesker, og til regeringen, myndigheder og medier kan være eksempler herpå.
Det at tweete kan fremmane en ønskværdig virkelighed, der endnu ikke eksisterer, fx oplevelsen af, at være social forbundne men samtidig bibeholde fysisk afstand.
Tillid kan blive et væsentligt emne, når forskellige aktører forsøger at positionere særlige interesser i forhold til hvad der prioriteres i krisehåndteringen.
Efterhånden som nedlukningen bliver hverdag, kan oplevelsen af fare forbundet hermed aftage og blive erstattet med justerede risikoopfattelser og nye eller velkendte rutiner.

2.1. Kvantitative analyser af toner

2.1.1. Kvantificering af sprogligt udtrykte affekter og attituder

Vores analyse tager udgangspunkt i NRC Emotion Lexicon, som er udviklet af Saif M. Mohammad and Peter D. Turney fra National Research Council Canada. Ordbogen er baseret på kvalitative kodninger af ~9.000 udvalgte engelske ord^[11]. Den danske ordbog er en simpel oversættelse af de engelske ord via Google Translate. Denne oversættelse introducerer en del yderligere usikkerhed og støj, som vi undersøger nærmere i afsnit 2.3.

Vi har for hver dag optalt andelen af tweets, der indeholder mindst ét af de ordene i NRC-ordbogen. I lyset af diverse usikkerheder forbundet med sådanne optællinger, har vi gjort to ting. Vi har udjævnet kurverne via et såkaldt ‘gaussian filter’^[12], for at fokusere på den overordnede udvikling. Herudover har vi indekseret udviklingerne, for at fokusere på udviklingen indenfor hver af de otte toner.

NRC-modellen fokuserer på seks såkaldte basale følelser - vrede, afsky, frygt, glæde, tristhed og overraskelse^[13]. Dette er en ofte anvendt tilgang i kvantitative tekstanalyser, som vi her kalder affekter. Hertil inkluderer NRC-ordbogen desuden forventning og tillid^[14], som vi her vælger at betegne som attituder. Som samlebetegnelse for de seks affekter og de to attituder anvender vi betegnelsen tone. Vi ønsker hermed at tydeliggøre, at vi undersøger affekter og attituder i sprogbrugen på Twitter, hvis præcise forbindelse til de enkelte brugeres følelser og tanker vi derfor ikke kender.

2.1.2. Begrænsninger ved denne type undersøgelse

En række af de udfordringer og problematiske antagelser, som vi fremhævede i forhold til sentiment-analysen i afsnit 1.1.2., gør sig også gældende for indeværende slags analyse:

Ord kan ikke nødvendigvis inddeles i tydelige eller gensidigt udelukkende følelseskategorier. ‘Udbrud’ er et eksempel på et ord, hvis følelsesmæssige tilknytning er svær at afgøre i den nuværende situation - er det knyttet til en frygt eller til en overraskelse? Eller er det i denne specifikke kontekst blevet deskriptivt, ‘neutralt’? Således kan konteksten også her spille en stor rolle for vores forståelse af enkelte ord.
En tekst samlede udtryk kan ikke nødvendigvis opsummeres som en sum af enkelte, udvalgte ord; igen kan ironi og sarkasme ændre komplet på forståelsen af teksten.
Enhver konkret udvikling af en ordbog indeholder en række valg, der afgør hvilke ord der indgår, og hvilke, der ikke gør. Analysen i Figur 5 tager udgangspunkt i en allerede eksisterende ordbog. I afsnit 2.3. har vi gennemgået og sorteret i de indeholdte ord, hvilket mindsker dette forbehold, men vi kan fortsat både mangle relevante ord, samt have inkluderet ord, hvis brug i de enkelte tweets ikke retfærdiggør deres inklusion.

2.2. Kvalitativ validering af den kvantitative tone-analyse

Figur 5 indikerer, at flere tweets taler om tillid, men fortæller ikke i hvilken sammenhæng dette sker. Er disse tweets udtryk for tillid eller mistillid (fx ‘Jeg har (ikke) tillid til sundhedsvæsenet’)? Er det deskriptive beskrivelser af andres tillid (fx i en overskrift på en nyhedsartikel som ‘Tilliden til aktiemarkedet daler’)? Og hvor meget af de identificerede tweets er ‘støj’, dvs. tweets, der bruger et ord fra NRC-ordbogens tillids-kategori, uden at de pågældende tweets synes at have noget med tillid at gøre?

For bedre at kunne besvare spørgsmål som disse, har vi håndkodet 10 tweets per dag for perioden 24/02-14/04^[15] (510 tweets i alt), der jf. NRC-ordbogen skulle omhandle tillid, med henblik på at:

Få et indtryk af hvor stor grad af misklassificering den direkte implementering af NRC-ordbogen indebærer.
Få et indblik i hvor meget udtryk for hhv. tillid og mistillid fylder.
Få en indikation af hvordan tillid og mistillid fordeler sig mellem en række centrale aktører.

Hver af de 510 tweets blev kodet af to personer. På baggrund af antropologiske og sociologiske teorier om tillid^[16], identificerede vi før kodningen en række aktører og institutioner, som tillid eller mistillid rettes imod^[17]. Efter vi havde kodet ca. 20% af stikprøven, tilpassede vi denne model. For hver tweet angav de to personer, hvorvidt det udtrykte tillid (1) eller mistillid (-1) mod en given aktør. Vi har aggregeret de to kodninger ved at adskille tillid fra mistillid og herefter taget et gennemsnit. De steder, hvor kun én af de to personer har angivet enten tillid eller mistillid, har vurderingen således kun vægtet med 50%.

Samlet fandt vi, at ~65% af de 510 kvantitativt-identificerede tweets ifølge den kvalitativt baserede klassificering slet ikke omhandlede hverken tillid eller mistillid. Før der drages konklusioner heraf, skal det fremhæves, at kvalitativ kodning ej heller udgør det ‘rigtige’ eller ‘endelige’ svar - for eksempel vurderede hvert par kodere mellem 20% og 40% af deres tildelte tweets forskelligt. Såfremt vi udførte en mere omfattende kvalitativ kodning, med en endnu mere stringent og eksplicit procedure for hvordan vi håndterede forskellige grænsetilfælde, er det sandsynligt at dette tal ville kunne bringes ned, men selv her, ville der indgå en lang række komplekse afvejninger ift. hvad der ‘tæller’ med som ‘tillid’ eller ‘mistillid’. Den store forskel mellem den kvantitative og kvalitative tilgang understreger dog, at man skal tilgå kvantitative ordbogsbaserede metoder, der ikke er udviklet eller tilpasset til den konkrete undersøgelses genstand eller kontekst med betydelige forbehold.

Blandt de ‘godkendte’ tweets, fandt vi, at ~90 var behæftet med tillidsfuld tone, imens ~125 udtrykte mistillid. Tillid fyldte mere end mistillid hvad angår udsagn om videnskab (givetvis forstærket af, at mange af disse var tweets, der udtrykte tillid til tal og eksperter) og sundhedsvæsenet. For alle de andre kategorier fyldte mistillid mest, herunder i forhold til regeringen og politikere mere generelt, til medier, samt til internationale institutioner som EU, WHO og FN. Denne mistillid kan være et udtryk for, at vi i vores identifikation af mistillidsbehæftede tweets også inkluderede alle dem, der stillede kritiske spørgsmålstegn ved de respektive aktører og institutioners bevæggrunde og handlinger.

2.3. En kvalitativt justeret tone-analyse

2.3.1. Kvalitativ justering af NRC-ordbogen

Givet indsigterne fra afsnit 2.2., samt for at forstå hvilke ord, der driver vores resultater, udvalgte vi for hver af de otte toner de 100 mest forekommende ord i datasættet^[18]. Fire personer gennemgik derpå disse, med henblik på at vurdere hvorvidt hvert af ordene rimeligvis kan associeres med den pågældende tone, givet konteksten af den danske Corona-krise. Vi beholdte kun de ord, hvor mindst tre ud af fire var enige om at inkludere dem.

Dette efterlod os med følgende ordbøger, hvor ordene er listet efter hvor ofte de bliver brugt^[19]:

Tillid (17 ord): 'hjælpe', 'hjælper', 'støtte', 'redde', 'respekt', 'sikker', 'tvivl', 'samarbejde', 'enige', 'tro', 'troede', 'tillid', 'ros', 'stolt', 'fremragende', 'dygtige', 'anbefale'
Glæde (14 ord): 'godt', 'positiv', 'glad', 'super', 'ro', 'elsker', 'sjovt', 'ros', 'positivt', 'stolt', 'glæde', 'fremragende', 'fællesskab', 'varme'
Forventning (24 ord): 'håber', 'risiko', 'mulighed', 'endelig', 'tør', 'venter', 'spændende', 'vente', 'plan', 'tro', 'forsøg', 'ske', 'forventer', 'bede', 'forberedt', 'efterfølgende', 'forberede', 'foreløbig', 'forventes', 'bekymrende', 'løfte', 'lykkes', 'overraskende', 'sandsynlighed'
Overraskelse (14 ord): 'større', 'pludselig', 'vild', 'utrolig', 'overraskende', 'held', 'overrasket', 'gave', 'heldig', 'forvirring', 'chok', 'tilfældigt', 'uforudsigelig', 'forudse'
Vrede (20 ord): 'slå', 'kritik', 'helvede', 'trussel', 'vold', 'straffe', 'voldsom', 'lort', 'idioter', 'kritisere', 'råbe', 'raser', 'ødelægge', 'tvinge', 'uenige', 'amok', 'sur', 'ødelagt', 'had', 'true'
Bedrøvelse (24 ord): 'hårdt', 'desværre', 'mangler', 'alene', 'værre', 'dårlig', 'isolation', 'mangel', 'bekymret', 'alvor', 'dårligt', 'trist', 'isolere', 'miste', 'tab', 'angst', 'negativ', 'ofre', 'nød', 'tom', 'forlade', 'konkurs', 'ked', 'beklager'
Afsky (14 ord): 'hoste', 'falsk', 'dum', 'stjæle', 'idiot', 'nyse', 'misbrug', 'irriterende', 'tyveri', 'skadelig', 'mærkelig', 'grådighed', 'gift', 'forfærdeligt'
Frygt (24 ord): 'karantæne', 'undgå', 'risiko', 'frygt', 'bange', 'værre', 'tvivl', 'problem', 'panik', 'mangel', 'frygter', 'farlig', 'bekymret', 'alvor', 'skræmmende', 'fare', 'mistanke', 'farligt', 'trussel', 'skade', 'bekymrende', 'katastrofe', 'kaos', 'usikkerhed'

2.3.2. En sammenligning af tone-analysen før og efter de kvalitative justeringer

Figur 6 sammenligner den oprindelige, oversatte NRC-ordbog med den af os kvalitativt justerede udgave. Givet forskellen i de to ordbøgers størrelser, og usikkerheden forbundet med valget af hvilke ord, der inkluderes i dem, vælger vi her kun at fokusere på forskelle og ligheder i de overordnede tendenser, og ikke på en direkte sammenligning af niveauerne for udviklingen, eller på konkrete udsving undervejs^[20].

Som det fremgår, er graden af ændringerne i tonerne markant større for den opdaterede ordbog end for den oprindelige, hvilket kan tyde på, at den oprindelige NRC-ordbog har indeholdt en lang række mere generiske ord, hvis brug ikke ændrer sig over perioden.

Ikke desto mindre er den overordnede tendens for begge grafer tydelig: Andelen af tweets, der omhandler (mis)tillid stiger mest, mens andelen af tweets, der omhandler frygt, falder mest. Bedrøvelse, forventning, glæde, vrede og overraskelse stiger i nogenlunde samme størrelsesorden. Afsky udviser som den eneste tone en markant anderledes udvikling i den kvalitativt justerede analyse, idet den fra starten af april bevæger sig under niveauet for den første uge.

Figur 6 - Sammenligning af den oprindelige NRC-model (til venstre) og den opdaterede NRC-model (til højre).	Figur 6 - Sammenligning af den oprindelige NRC-model (øverst) og den opdaterede NRC-model (nederst).

Specifikt for tonen tillid, var vi i forbindelse med håndkodningen af de 100 mest forekommende ord særligt i tvivl hvad angår “hjælpe”, “hjælper”, “redde”, “støtte”, “ros”, og “stolt”. Fjerner man disse, er tonen tillid fortsat den, der vokser mest, omend den så falder til et niveau, der ligger meget tættere på glæde og forventning. Dette understreger igen at det langt fra er entydigt at definere et begreb som ‘tillid’, herunder hvornår det udtrykkes i en tekst.

2.4. Fire mulige forklaringer på udviklingen i tonen på Twitter

Sammenholdt med den sentiment-analyse vi præsenterede tidligere, har den tone-analyse vi nu har udført en række fordele. Inddelingen af toner i otte kategorier kan indfange og adskille flere nuancer i vores danske corona-tweets, ligesom vores kvalitative kodning af en stikprøve fra de tweets, der var indeholdt i attitude-kategorien tillid, og vores derpå følgende justering af NRC-ordbøgerne, giver dybere indsigt i denne models resultater og validitet

Som vi så med stemnings-analysen, giver ovenstående tone-analyse dog stadig ikke nogen egentlig forståelse af hvorfor Twitter-Danmarks tone ændrede sig på denne måde efter nedlukningen. På samme måde som vi gjorde i forbindelse med sentiment-analysen, følger her fire mulige fortolkninger, der igen bygger på etableret samfundsvidenskabelig teori:

Interessekampe: Blandt politologer og andre samfundsforskere, er der bred enighed om at tillid repræsenterer en afgørende ressource i forbindelse med pludselige begivenheder, hvor beslutninger med vidtrækkende samfundsmæssige konsekvenser skal træffes med kort varsel og under begrænset adgang til velbekræftet information. I sådanne situationer kan uenigheder om den rigtige handlemåde bliver et tiltagende emne, der bl.a. præges af forskellige aktørers forsøg på at positionere særlige interesser (fx hjælpepakker til særlige sektorer eller arbejdsmarkedsgrupper og politiske modstanderes udfordring af regeringens krisehåndtering).
Kriser gør tingene mere eksplicitte: Ud fra en fænomenologisk inspireret ramme^[21], kan det argumenteres, at en krise som corona-pandemien tydeliggør elementer af folks hverdag, som de ellers tager for givet. Hvis man eksempelvis lever et liv præget af tillid til medborgere, myndigheder og politikere, kan en krise fungere som en slags lakmuspapir, der gør denne usynlige og usagte tillid tydelig - men som potentielt også giver anledning til at stille spørgsmål herved og etablere nye forventninger til hinanden. Konkret kan det forhold, at tonen på Twitter i stigende grad udtrykte tillid og mistillid i forbindelse med nedlukningen i denne optik skyldes, at det først for alvor var her, at der blev stillet strenge krav til social distancering og således først for alvor her, at vores ellers ofte implicitte tillid til hinanden som borgere og til samfundets institutioner og myndigheder blev sat på prøve, og gjort til genstand for et stadigt mere følelsesladet og håbefuldt sprog.
Tweeting som performativ eller ’magisk’ praksis: Antropologisk forskere har fremført, at mennesker, der befinder sig i situationer, der opleves som helt eller delvist udenfor deres kontrol og forstand, kan bruge ritualer og fortællinger til at fremmane en hverdag, der (endnu) ikke eksisterer^[22]. Snarere end at beskrive en reel oplevelse af glæde og taknemmelighed, kunne tweets med disse toner således afspejle et mere eller mindre bevidst forsøg på performe disse følelser. At ‘være sammen hver for sig’ kunne være et eksempel på en oplevelse af fællesskab, der i højere grad fremmanes end beskrives ved at tweete herom.
Normalisering af nedlukningen: I forlængelse af de ovenstående fortolkninger, kan det hævdes, at efterhånden som nedlukningen er gået fra at udgøre en undtagelsestilstand til delvist at blive en ny hverdag, så er den oplevede frygt faldet tilsvarende. Hvad der før var oplevet som ”farligt ”og ”ukendt” bliver i højere grad erfaret som kendte risici, der kan håndteres ved hjælp af risiko-mitigerende adfærdsændringer såsom f.eks. manglende brug af håndtryk. Således kan folk på den ene side slække på deres handlinger i henhold til deres opfattelser af risici som uønskelig, hvilket typisk daler over tid under kriser, og på den anden side udvikle rutiner, der gør, at de kan agere mere effektivt, selvom den samme grad af risikoopfattelse består. Bemærk her også, at katastrofe-forskere har vist, at graden af tillid til staten er afgørende for, hvilke borgere der har højest risiko-opfattelse og dermed er bedst forberedte^[23]. Disse delvist modsatrettede faktorer og dynamikker vil tilsammen kunne forklare, at både tillid og mistilid stiger i vores undersøgelse, mens frygt og usikkerhed falder.

3. Tonen på Twitter ændrer sig særligt indenfor sundhedsdebatten

Vi vil afslutningsvis illustrere, hvordan den kvantitative emne-kortlægning fra vores første opslag også kan benyttes i forsøget på at gøre tone-analysen i indeværende opslag mere forståelig. Udvikler tonerne sig særligt i forhold til bestemte emner, der optager Twitter Danmark?

Afsnit 3.2. viser de syv kombinationer af emne og tone, der særligt har udviklet sig siden uge 10. Generelt udvikler tonerne sig meget inden for sundhedsemnet, hvor fire af de otte toner er steget eller faldet med mindst 50% over perioden.

Før vi viser resultaterne af denne analyse, gennemgår afsnit 3.1. hvordan vores analyser fra det første opslag ser ud på baggrund af vores opdaterede datasæt. Emne-klyngerne er overordnet set de sammen, men aktiviteten inden for hver klynge har været aftagende.

Afslutningsvist giver afsnit 3.3. tre mulige forklaringer på, hvorfor sammenspillet mellem emne og tone ser ud som det gør.

3.1. Opdatering af opslag #1: Twitter-Danmarks corona-emner er fortsat de samme, men de fylder mindre

Vores første opslag var en kortlægning af hvilke emner-klynger, der tweetes om i relation til corona i Danmark. Udover en gennemgang af emne-klyngernes udvikling, indeholder opslaget også en beskrivelse af vores oprindelige datasæt, samt metoden bag kortlægningen af emne-klynger. Kort fortalt identificerede vi emne-klyngerne, ved at analysere hvilke hashtags, der var indeholdt i samme tweets. Siden da har vi opdateret vores datasæt, så det nu dækker perioden fra og med 24/02-2020 til og med 28/04-2020 (~141.663 tweets i alt). Figur 7 viser en opdateret udgave af vores co-hashtag netværk over denne periode. Klik her for at komme til en interaktiv udgave af netværket, hvor du nemmere kan udforske klyngerne og de enkelte hashtags placering.

Figur 7 - Opdateret hashtag-netværk

Selvom de emne-klynger, der bliver identificeret i det opdaterede netværk overordnet er de samme som i vores første opslag, har en række mindre forskydninger fundet sted:

DIGI er ikke længere en selvstændig emne-klynge.
Der er kommet en ny, lille og ubetydelig emne-klynge til, som består af tre hashtags (JOB).

Figur 8 viser den samlede aktivitet for hver af emne-klyngerne baseret på det opdaterede datasæt.

Figur 8 - Overordnet aktivitet i de forskellige emne-klynger

Figur 8 minder om den tilsvarende grad fra vores første opslag, på trods af små ændringer i kurvernes udsving. Disse ændringer skyldes, at et eller flere hashtags kan have bevæget sig fra en klynge til en anden, som en konsekvens af det opdaterede data, hvorfor aktiviteten derfor kan være forskudt. To forhold er yderligere særligt bemærkelsesværdige:

Der er et generelt fald i antallet af tweets omhandlende vores emne-klyngerne.
Dette fald er endnu mere markant for REAK-klyngen, der især i de sidste to uger ligger forholdsvist lavt i forhold til de tidligere uger.

Årsagen til faldet i den generelle aktivitet kan findes i tre mulige forklaringer:

at Twitter-Danmark tweeter mindre om corona.
at der er sket ændringer i Twitter-Danmarks corona-sprogbrug, således at krisen ikke italesættes lige så eksplicit længere, og derfor i lavere grad fanges af vores søgeord.

REAK-klyngen samler en række hashtags, der udtrykker Twitter-Danmarks reaktion på corona-pandemien. Én forklaring på den emne-klynges fald, kan således være at vi i takt med at corona-krisens begyndelse kommer mere på afstand, ikke har samme behov for at eksplicitere vores reaktioner gennem de tilknyttede hashtags via Twitter.

3.2. Sammenhæng mellem corona toner og emne-klynger

Med henblik på at dykke dybere ned i tone-analysen, har vi sammenkørt den justerede NRC-ordbog med emne-klyngerne fra ovenstående afsnit. Sammenkoblingen med klyngerne kan fortælle os, om nogle af udviklingerne i de otte toner er særligt forbundet med bestemte emner. Der er ~7.000 tweets, der bruger mindst ét hashtag fra en af emne-klyngerne, og mindst ét ord fra en af de opdaterede NRC-ordlister.

For at reducere antallet af de 72 mulige emne-tone kombinationer, har vi i det følgende begrænset os til de kombinationer af emne-klynge og tone, der opfylder følgende tre kriterier:

Der er mindst 200 tweets over hele perioden, som både indeholder hashtags, der tilhører emne-klyngen og ord, der er knyttet til tonen jævnfør den justerede NRC-ordbog.
Der er mindst 10 tweets i uge 10 (2-8/3), som både indeholder hashtags, der tilhører emne-klyngen og ord, der er knyttet til tonen. Vi tager her udgangspunkt i uge 10, idet uge 9 har meget få observationer.
Andelen tweets, som både indeholder hashtags, der tilhører emne-klyngen og ord, der er knyttet til tonen, er steget eller faldet med mindst 50% i løbet af perioden. Andelen er her regnet ud fra antallet af tweets i den pågældende emne-klynge.

Figur 9 viser udviklingen for de syv kombinationer af emne-klynge og tone, der opfylder disse kriterier. Som det fremgår af figuren, er det kun de tre største emne-klynger (SUND, ØKOPOL, REAK), der indgår efter disse begrænsninger, mens fem af de otte toner (tillid, forventning, glæde, bedrøvelse og frygt) er til stede.

Figur 9 - Udviklingen i den ugentlige frekvens udvalgte overlap ml. affekt-kategorierne og hashtag-klyngerne.

Som det fremgår af Figur 9, stiger tillid, bedrøvelse og forventning særligt i relation til SUND, mens glæde stiger særligt i relation til ØKOPOL, omend alle med markante udsving. Frygt falder særligt i relation til SUND, ØKOPOL og REAK, og er således et udtryk for en bredere tendens.

For SUND kan vi følge udviklingen i fire toner, som her ser ud til at udspille sig i forlængelse af hinanden. Tillid stiger hurtigt, og topper i uge 12 og 13, hvorefter tonen aftager (omend med en stigning igen i uge 16). Bedrøvelse topper herefter kortvarigt i uge 14, hvorefter forventning kortvarigt topper i uge 16. I uge 16 når frygt også sit højeste niveau siden uge 11.

3.3. Tre mulige forklaringer på emne-tone dynamikkerne

Sammenkoblingen af tone- og emne-analyserne giver et mere nuanceret indblik i begge analyser. Som det gjaldt for både stemnings- og tone-analysen, viser denne analyse dog ikke noget om, hvorfor netop disse kombinationer af emner og toner ændres i særlig grad. Tre mulige forklaringer (i forlængelse af foregående eksempler) kunne være:

Emne-specifikke toner: Når folk poster et tweet, skal dette ikke ses som et vakuum, eller en én til én repræsentation af deres virkelighed, men nærmere som en tekst indlejret i en større kontekst. Således kan forskellige toner være knyttet til forskellige emner gennem samfundsdiskurser, både produceret af medierne, af politikere og af offentligheden generelt, hvilket kan være hvad vores analyse opfanger.
Faser i Twitter-Danmarks krise-reaktion: Udviklingen for SUND kan måske indikere forskellige faser i Twitter-Danmarks reaktion på nedlukningen. Den tidlige stigning i tonen tillid kan muligvis indikere en første fase, hvor Twitter-Danmark er særligt optaget af at diskutere og etablere de sociale rammer for nedlukningen (hold afstand, bliv hjemme etc.). Denne fase aftager muligvis, i takt med at de sociale krise-normer etableres. Herefter begynder sygdommen for alvor at sprede sig, og i takt med at dødstallet stiger, tager tonen bedrøvelse til^[24]. Denne fase aftager muligvis i takt med at sygdommen aftager. Slutteligt er det muligvis en tiltagende debat om genåbningen, der får tonerne forventning og frygt til at stige, i forlængelse af hvilket debatten om sociale krise-normer muligvis også blusser op på ny.
Twitter-reaktioner på særlige begivenheder: Som vores REAK-klynge understreger, er en stor del af aktiviteten på Twitter reaktioner på specifikke begivenheder, der i høj grad udspiller sig udenfor platformen. I lyset af dette, kan det tænkes at de enkelte emne-tone kombinationer udspiller sig omkring særlige typer af konkrete begivenheder:
- Tillid i SUND kan eksempelvis være særligt knyttet til nye udspil fra sundhedsmyndighederne og regeringen.
- Bedrøvelse i SUND kan eksempelvis være særligt knyttet til antallet af indlagte og døde.
- Forventning og frygt i SUND kan eksempelvis være særligt knyttet til debatten om kapacitet i sundhedsvæsenet, strategien for hvordan vi tester, eller debatten om hvor sikkert det er at genåbne samfundet.
- Glæde i ØKOPOL kan eksempelvis være særligt knyttet til annonceringen af forskellige hjælpepakker.

4. Konklusion og næste opslag

Dette opslag har analyseret stemningen og tonen i danske tweets om corona-krisen. Vi startede med at en undersøge stemningen på Twitter, som viste sig at være blevet mere positiv efter nedlukningen Givet sentiment-analysen grove opdeling af tekst-data i hhv. positiv, neutral eller negativ, igangsætte vi derpå en mere nuanceret kvantitative analyse af sprogbrugen på Twitter, hvor vi overordnet set fandt at tonen i corona-tweets efter nedlukningen udtrykte mere mis/tillid, og mindre frygt. For at teste gyldigheden af disse kvantitativt kreerede resultater, foretog vi derpå en kvalitativ kodning af en stikprøve af tweets, som ifølge vores ordbogsbaserede tone-analyse skulle omhandle tillid. Her fandt vi en betydelig diskrepans imellem de to metoder, og vi foretog derfor en opdatering af vores tone-ordbog og -analyse. Udkommet var dog, at tendensen i udviklingen af tonen på Twitter overordnet var den samme. Tillid, samt mistillid, fylder mere og frygt mindre, efter nedlukningen.

I forlængelse af stemning- som toneanalysen skitese vi en række mulige forklaringer og fortolkninger baseret på etablerede samfundsvidenskabelige teorier. Dette efterlod os med to overordnede betragtninger og indsigter, hvoraf den ene primært omhandler hvad man kan betegne som makro-niveau, mens den anden orienterer sig mere mod et mikro-niveau.

For det første peger vores undersøgelse på, at regeringen og myndighedernes håndtering af og kommunikation om nedlukningen kan have haft væsentlig indflydelse på måden, hvormed sprogbrugen på Twitter har udviklet sig. Et mønster kunne således være, at corona-krisen på Twitter omtales som en slags eksamen i social sammenhængskraft, i den forstand at hvert enkelt borgers adfærd bliver afgørende for samfundets evne til at håndtere og løse krisen. Dette kan også forklare, hvorfor spørgsmålet om både tillid og mistillid overfor diverse institutioner og aktører bliver mere fremtrædende på Twitter Danmark efter nedlukningen.

For det andet indikerer vores undersøgelse, at Twitter muligvis udgør et slags handlingsrum for de enkelte brugere af dette sociale medie, hvor krisen i mangel af andre muligheder håndteres ved at tweete om den, og dermed gøres mere konkret og mindre farlig. Brugen af ord som ‘glæde’, og ‘hjælp’ kan være forsøg på fremmane glæde og fællesskab, i en situation, hvor folk i høj grad har tabt kontrol og adgang til ’normale’ måder at være sammen på.

For at afprøve disse mulige forklaringer nærmer, ville fremtidige analyser kunne gå i forskellige retninger. Ved brug af kontekst-følsomme metoder for kvantitative tekstanalyse, ville vi bedre kunne fange, hvilke ord, der optræder sammen i de enkelte tweets og på tværs af dem. En kortlægning af de forskellige aktører og institutioner på Twitter ville kunne bidrage til en forståelse af, hvordan stemninger og toner bevæger sig mellem beslutningstagere, meningsdannere og borgere. En fortsættelse og udvidelse af vores kvalitative klassifikation og kodning af tweets med udgangspunkt i samfundsvidenskabelige teorier, ville kunne kortlægge mere præcist, hvordan ord som ‘glæde og ‘hjælp’ benyttes. Endelig vil etnografiske metoder kunne give indblik i de enkelte Twitter-brugeres og andre borgeres følelser, tanker og opfattelser. Det er netop sidstnævnte tilgang og tema, som vil danne udgangspunkt for vores kommende og sidste opslag om corona-krisen i Danmark.

Noter & referencer
[1] ‘Covid’ er tweets, der indeholder mindst ét af følgende ord: ‘corona’, ‘COVID’, ‘virus’, ‘epidemi’ og ‘pandemi’. Dette inkluderer også ord, der indeholder disse (fx ‘COVID-19’).
[2] ‘Ikke-covid’ er tweets, der indeholder et af vores 147 brede corona-søgeord, men ikke indeholder følgende direkte relaterede ord (eller ord, hvor et af følgende ord indgår som en del): 'corona', 'covid', 'virus', 'pandemi', 'epidemi', 'brydkurven', 'lockdowndk', ‘flattenthecurve', 'lockdown', 'denmarklockdown', 'smitte', 'smittekæde', 'smittekæden', 'lege', 'legeaftaler', 'legeaftale', 'udbrud', 'udbruddet', 'test', 'tests', 'teste', 'karantæne' , 'udsatte' , 'sårbare', 'restriktioner' , 'skolelukning', 'hjemmearbejde', 'kontaktforbud', 'udgangsforbud', 'risikogruppe', 'samfundssind', 'hackthepandemic', 'dksocial', 'blivhjemme', 'bliv hjemme', 'holdafstand','hold afstand', 'paspåhinanden', 'pas på hinanden', 'sammenhverforsig', 'sammen hver for sig','sammenmodcorona', 'sammen mod corona', 'TAKdk', 'coronakrise', 'krisetid', 'hamstring', 'hamstre', 'hamstrer'. Denne gruppe af tweets kan således godt omhandle corona, men formodentlig i mindre grad end covid-gruppen.
[3] Figur 1 bygger på afinn-modellen (se afsnit 1.1.). Vi har også afprøvet den nyere sentida2-model, som viser samme gennemsnitlige udvikling. Se Lauridsen, G., Dalsgaard, J., & Svendsen, L. (2019). SENTIDA: A New Tool for Sentiment Analysis in Danish. Journal of Language Works - Sprogvidenskabeligt Studentertidsskrift, 4(1), 38-53
[4] Tak er scoret +2, ødelagt er score -2 i afinn-modellen.
[5] Se fx G. Ignatow & R. Mihalcea, An Introduction to Text Mining, Sage Publications (2017)
[6] Således kan et tweet også have et neutralt sentiment, såfremt der ikke indgår nogle ord fra ordbogen, eller såfremt der både indgår negativt og positivt ladede ord, hvis score ved opsummering udligner hinanden.
[7] For en komplet liste med ord og score for Afinn modellen på dansk, se her: https://github.com/fnielsen/afinn/blob/master/afinn/data/AFINN-da-32.txt
[8] Ordet grand er et mindre brugt ord, der i vores datasæt primært benyttes i sammenhængen med at ‘melodi grand prix’ blev aflyst forud for annonceringen af nedlukningen. Det er også et godt eksempel på den usikkerhed, der er forbundet med ordbogsmetoder som denne.
[9] Frygt falder direkte efter den første uge, hvorefter kategorien ser ud til at finde et mere stabilt leje.
[10] Jf. NRC-modellen indeholder ~95.000 tweets (~80%), som omhandler én af de otte kategorier. Denne andel afhænger dog i høj grad af hvilke og hvor mange ord, man inkluderer i sin ordbog, og er således mest relevant at holde sig for øje ift. størrelserne på de enkelte analysekategorier, der her varierer mellem ~20.000 (afsky) og ~55.000 (tillid).
[11] Vurderingerne er foretaget via Amazons platform Mechanical Turk, hvor hvert af ordbogens ~9.000 ord er vurderet af ~4.5 person i gennemsnit. Se Crowdsourcing a Word–Emotion Association Lexicon for en mere fyldestgørende beskrivelse af udviklingen af ordbogen.
[12] Vi har anvendt SciPys modul hertil, med sigma = 2.
[13] Se fx P. Ekman, An argument for basic emotions, Cognition and Emotion (1992).
[14] Se fx R. Plutchik, The psychology and biology of emotion, New York: Harper Collins (1994).
[15] Den kvalitative kodning blev foretaget før vi høstede tweets fra perioden 15/4-28/4, hvorfor disse ikke indgår i indeværende del af vores analyse.
[16] Se f.eks. Braithwaite, V. M. Levi, K. S. Cook, R. Hardin, M. Levi. 1998.Trust and Governance. New York: Russell Sage Foundation; Carey, M. 2017. Mistrust: an Ethnographic Theory. Chicago: Hau Books.
[17] De pågældende aktører/instutitioner var ‘Medmennesker/borgere i DK’, ‘Myndigheder og institutioner’, ‘Søren Brostrøm’, ‘Sundhedsvæsenet (inkl. SSI og personale)’, ‘Kåre Mølbak’, ‘Regeringen’, ‘Mette Frederiksen’, ‘Magnus Heunicke’, ‘Andre politikere i DK’, ‘Kongehuset’, ‘Medier’, ‘Videnskaben’, ‘Private virksomheder’, ‘EU/FN/WHO’, ‘Infrastrukturer (digitale og analoge)’, ‘Markedet’, ‘Ikke klassificerbar’ samt ‘Misklassificeret’. Det var også muligt at angive og specificere ‘Andet objekt’.
[18] De 100 mest forekommende ord over perioden 24/02-14/04. Vi har først indsamlet Twitter-data for perioden 15/4-28/4 herefter.
[19] Der er ~35.000 tweets (~30%), som bruger mindst ét ord fra en af de otte opdaterede ordlister. De otte opdaterede NRC-kategorier indeholder mellem ~2.000 tweets (overraskelse) og ~9.500 tweets (frygt).
[20] Af denne grund har vi ikke ensartet de to y-akser, hvorfor man ikke direkte visuelt kan sammenligne niveauet for udviklingerne i de to grafer.
[21] For eksempel, Zigon, Jarrett. 2007. Moral Breakdown and the Ethical Demand: A Theoretical Framework for an Anthropology of Moralities. Anthropological Theory 7 (2)
[22] For eksempel Steffen, V, S. Jöhncke & K. M. Raahauge (red.). 2015. Between Magic and Rationality. København: Museum Tusculanum Press
[23] Wachinger, Gisela et al. “The risk perception paradox--implications for governance and communication of natural hazards.” Risk analysis : an official publication of the Society for Risk Analysis 33 6 (2013): 1049-65.
[24] Uge 14 er jævnfør Sundhedsstyrelsen den uge, hvor flest danskere er døde i relation til corona.

CORONAKRISEN Copenhagen Center for Social Data Science (SODAS)