Sotsiaalse Analüüsi Meetodite ja Metodoloogia õpibaas

Standardiseeritud kontentanalüüs

Veronika Kalmus
2015

Standardiseeritud kontentanalüüs on vanimaid, tuntumaid ja enim kasutatavaid sotsiaalteadusliku tekstianalüüsi meetodeid. Metodoloogiliste rakendusviiside ja analüüsitehnikate suure variatiivsuse tõttu võib seda pidada pigem uurimisstrateegiaks kui konkreetseks meetodiks. Standardiseeritud kontentanalüüs kujutab endast teatavat silda kvantitatiivsete ja kvalitatiivsete meetodite vahel. Võib öelda, et standardiseeritud kontentanalüüsi abil „tõlgitakse“ mistahes eesmärgil loodud tekstid (nt meedia- või õppemeediatekstid, reklaamid, ametlikud dokumendid, uuritavate omalooming, sh sotsiaalmeedias) sotsioloogia, psühholoogia või mõne muu teaduse keelde, kvantitatiivsete näitajate keelde (vrd Lamser, 1969 Timak, 1971: 88 kaudu). Sageli kasutatakse standardiseeritud kontentanalüüsi abimeetodina ankeetküsitluse lahtiste küsimuste vastuste kodeerimiseks.

Üks tuntumaid selle meetodi loojaid ja kasutajaid Bernard Berelson (1954: 489) annab kontentanalüüsi kohta järgmise definitsiooni: „Kontentanalüüs on uurimistehnika kommunikatsiooni eksplitsiitse sisu objektiivseks, süstemaatiliseks ja kvantitatiivseks kirjeldamiseks.“ Eksplitsiitse sisu kirjeldamine tähendab seda, et analüüsitakse ainult teksti sõnaselgelt väljendatud, manifestset sisu, mitte aga ridade vahel olevat või mõistaantavat. Objektiivne kirjeldamine tähendab seda, et kontentanalüüs viiakse läbi sõnaselgelt formuleeritud reeglite kohaselt, kusjuures eri uurijad peavad samu reegleid ja sama materjali kasutades jõudma samasugustele tulemustele. Kodeerijate otsustusi käsitletakse teadusliku vaatluse tulemustena. Süstemaatilisus tähendab seda, et analüüsitav sisu peab olema valitud selgelt sõnastatud ja järjekindlalt rakendatud reeglite alusel, kusjuures igal analüüsitaval objektil ehk tekstil peavad olema võrdsed võimalused valimisse sattuda. Igat valimisse sattunud teksti tuleb kirjeldada kõikide analüüsikategooriate abil. Süstemaatilisuse nõue peab tagama selle, et uurija ei valiks tekstimassiivist välja üksnes neid tekste, mis tema hüpoteese kinnitavad. Kvantitatiivsus annab võimaluse teksti sisu numbriliste väärtustega mõõta.

Kontentanalüüsi tulemiks on märkide või märkide rühma ehk teksti omaduste esinemissagedused. Kuna tegemist on töö- ja ajamahuka meetodiga, on kontentanalüüsi kasutamine põhjendatud ainult juhul, kui püstitatud uurimisküsimustele soovitakse saada numbrilisi vastuseid. Meetodi kasutamise eelduseks on võimalus püstitada olemasolevatele teooriatele ja/või varasematele uurimustele toetudes täpseid uurimisküsimusi ja hüpoteese ning nendest lähtudes operatsionaliseerida teksti huvipakkuvad tunnused analüüsikategooriatena enne analüüsi läbiviimist. Standardiseeritud kontentanalüüsis kasutatakse seega valdavalt deduktiivset lähenemist.

Standardiseeritud kontentanalüüsil on võrreldes teiste tekstianalüüsi meetoditega mitu eelist. Kuna kontentanalüüsi tulemusel määratakse huvipakkuvate teksti omaduste absoluutne ja suhteline esinemissagedus, võimaldab meetod erinevaid tekstikogumeid (nt meediakanaleid) täpsetel alustel võrrelda. Kontentanalüüsi tulemused on küllaltki kergesti kontrollitavad, ühtlasi on võimalik määrata kodeerimise reliaablust ehk usaldusväärsust. Kontentanalüüs võimaldab tänu konkreetsetele ja täpsetele juhistele tööjaotust uurijate vahel, mis omakorda loob eelduse võrdlemisi suurte tekstihulkade kodeerimiseks, võimaldamaks hilisemat kvantitatiivset andmetöötlust ja analüüsitulemuste üldistamist tekstide valimilt nende üldkogumile ja teooriatele.

Kujundlikumalt võib öelda, et kontentanalüüs annab tulemuseks tekstimassiivide aerofoto ehk üldplaani – ülevaate tekstiliste nähtuste esinemisest ja muutumisest makrotasandil.

Standardiseeritud kontentanalüüsi kui sotsiaalteadusliku meetodi valikul tuleb arvestada sellega, et tekstianalüüsi standardiseerituse ja usaldusväärsuse kasvades kahaneb analüüsi sisukus ja sügavus: uurijad võivad jõuda objektiivsete, kuid triviaalsete tulemusteni. Standardiseeritud ja seetõttu kodeerija vaatevinklist jäikade analüüsikategooriate ja skaalade kasutamine võib viia uuritavate tekstiliste nähtuste lihtsustamise ja fragmenteerimiseni ning algupärastest tekstidest kaugenemiseni. Rõhu asetamine standardiseerimisele ja kvantifitseerimisele vähendab analüüsi täpsust ja tundlikkust. Suurtes valimites jäävad uurija tähelepanuta harva esinevad, kuid unikaalsed ja potentsiaalselt mõjusad tekstinähtused. Standardiseeritud kontentanalüüs ei võimalda analüüsida varjatud tähendusi, „ridade vahele peidetut“, ega niisuguseid tekste, millest erinevad inimesed tõenäoliselt väga erinevalt aru saavad (nt kujundlikke või väga keerulisi tekste), seega ei aita meetod otseselt välja selgitada keerulisi, konnotatiivseid ja ideoloogilisi tähendusi.

Arvestada tuleb ka sellega, et standardiseeritud kontentanalüüs ei tarvitse olla maksimaalselt objektiivne ainuüksi põhjusel, et suurte tekstihulkade läbitöötamisel võivad kodeerijad teha kodeerimisotsustusi kiirustades ja esmamuljele tuginedes.

Kontentanalüüsi tulemused võivad osutuda triviaalseks ka siis, kui ei tooda esile seost uuritavate tekstide sisu ning nende institutsionaalse, ühiskondliku ja kultuurilise konteksti vahel. Sellest kaalutlusest lähtuvalt on Klaus Krippendorff (1980) määratlenud kontentanalüüsi olemuse ja eesmärgi järgmiselt: „Kontentanalüüs on uurimistehnika andmete põhjal konteksti kohta täpsete ja põhjendatud järelduste tegemiseks.“ Enamikul juhtudel pole kontentanalüüsi läbiviija jaoks niivõrd oluline teatud tunnuste kaudu tekste kirjeldada, kuivõrd teha paljude tekstide analüüsimisel saadud tulemuste põhjal järeldusi tekstiväliste nähtuste kohta (Timak, 1971) – tekstide autorite või ühiskonna kui n-ö kollektiivse autori kohta.

Sotsiaalteadusliku meetodina arenes kontentanalüüs eriti intensiivselt vahetult enne ja pärast Teist maailmasõda, mil lähenemist kasutati suuresti propagandamaterjalide uurimiseks. Tuntumateks teadlasteks sellel etapil olid H.D. Lasswell, W. Leites, B. Berelson, I. de Sola Pool jt. Tolle aja uurimustes asetati pearõhk meetodi teaduslikkusele, empiiriliste indikaatorite väljaarendamisele, üldistuste tegemisele objekti kirjeldamiseks ja teoorialoomeks ning tulemuste kvantitatiivsusele. Harold D. Lasswelli nimega seondub väärtussümbolite analüüs. Lasswell käsitles (massi)kommunikatsiooni väärtussümbolite kui ideoloogilise maailmakäsitluse aluste levitamise vahendina. Ühiskonna muutudes teiseneb ka väärtussümbolite tähtsus, aktuaalsus ja mõju. Lasswell püüdis ühendada kommunikatsiooni empiirilise uurimise makrosotsioloogilise tasandiga, näitamaks, kuidas ühiskond funktsioneerib. Selleks koostas ta ühiskonnas käibelolevate väärtuste sõnastiku ja klassifikatsiooni. Väärtussümbolite esinemissagedus avalikes tekstides on Lasswelli järgi tõlgendatav vastava kategooria väärtuste mõju ja tähtsusena selles ühiskonnas sel perioodil.

Hilisemates uurimustes kaldus rõhuasetus materjali kvantitatiivselt kirjeldamiselt hüpoteeside kontrollile ja kaugemaleulatuvatele teoreetilistele arendustele (nt A. L. George’i, O. R. Holsti, E. S. Schneidmani ja S. G. Walkeri töödes). George Gerbneril on suuri teeneid sisuanalüüsi kriitilise – ühiskonnanähtusi ja tekste ideoloogiate ja väärtuste mõju aspektist vaatleva – suuna arendamisel (1964). Ta käsitles teksti sümbolilise ja mitmetasandilisena, omistades vastuvõtjatele suurema tõlgendava rolli, mistõttu sisuanalüüs pidi tema käsitluses arvestama nii denotatiivse kui ka konnotatiivse tasandiga. Gerbneri nimega seondub ka kultuuriindikaatorite analüüs (1969). Gerbneri väitel kaasneb avalike sõnumite tootmise sotsiaalses baasis ja majanduslikes eesmärkides toimuvate muutustega „kultuurirevolutsioon“ – varem või hiljem muutub ühine sümboliline keskkond, mis annab inimtegevusele avaliku tähenduse ja suunitluse. Tekib vajadus ühiskonnas ja sümbolilises keskkonnas toimuvate muutuste näitajate – teoreetiliste kultuuriindikaatorite – väljaarendamiseks, mis kommunikatsiooni sisu analüüsimiseks operatsionaliseerituna aitaksid mõõta muutuste iseloomu ja tempot. Gerbnerilt (1969) pärineb ka neli kontentanalüüsi põhiküsimust ja analüütilist mõõdet, mida tänaseni kasutatakse (vt tabel 1).

Tabel 1. Avalike sõnumisüsteemide analüüsi küsimused ja mõisted (allikas: Gerbner 1969: 130)

Küsimused

Definitsioonid

Analüütilised mõõtmed ja mõisted

Küsimuste lühiseletused

1. MIS ON?

Avalikud eeldused olemasolu kohta

Tähelepanu jaotamine, sagedus

Millele (või mis laadi nähtustele) tõmbab see sõnumisüsteem kogukonna tähelepanu? NÄIDE

2. MIS ON OLULINE?

Prioriteetide kontekst

Rõhuasetus (järjestus, rõhutamise, esiletõstmise tunnused)

Millisesse konteksti või tähtsuse järjekorda on need nähtused asetatud? NÄIDE

3. MIS ON ÕIGE-VALE, HEA-HALB JNE?

Vaatenurk, tundmustega seotud omadused

Suunitluse tunnused

Millises valguses või mis vaatenurgast neid nähtusi esitatakse? NÄIDE

4. MIS ON MILLEGA SEOTUD?

Lähedus- või loogilised seosed

Struktuur (rühmitamine, põhjuslikkus)

Millises omavaheliste seoste struktuuris neid nähtusi esitatakse? NÄIDE

Kontentanalüüs koosneb kolmest põhietapist, milleks on:

 1. ettevalmistused – uurimisprogrammi koostamine (sh uurimiseesmärkide püstitamine, analüüsitava materjali valimine); kodeerimisjuhendi koostamine ehk analüüsiühikute ja analüüsikategooriate määratlemine; proovikodeerimine;
 2. tekstide kodeerimine;
 3. andmete analüüs ja interpreteerimine institutsioonilises, kultuurilises ja ühiskondlikus kontekstis.

Kõige vastutusrikkam on ettevalmistav etapp, mis jaguneb mitmeks põhjalikku läbimõtlemist ja teoreetilist eeltööd nõudvaks tegevuseks.

Uurimisprogrammi koostamine

Programmi koostamine algab uurimisprobleemi ja -eesmärkide püstitamisest ning uurimisküsimuste ja hüpoteeside sõnastamisest. Kontentanalüüsi uurimisküsimused on sageli suunatud võrdlustele. Tüüpilised uurimisküsimused puudutavad nt järgmist.

 • Kõneaine ehk agenda kujundamist: Mis on meediasisu prioriteedid? Mida/keda, kui sageli, kui suurelt, kui silmapaistvalt, missuguses järjekorras esitatakse?
 • Kallutatust: Kas ja millisel määral esineb väljaannetes või kanalites kallutatust? Kui sageli, kui silmapaistvalt kajastatakse eri väljaannetes või kanalites teatud tegelasi, missuguseid hinnanguid neile antakse?
 • Muutusi: Missugused on ajalised või ajaloolised muutused esitamisviisides?

Kontentanalüüsi uurimisküsimustele peab saama sisuanalüüsi võimaluste piires vastata, need ei saa puudutada tekstiväliseid nähtusi ega protsesse. Näiteks saame kontentanalüüsi abil teha kindlaks meedia suhtumise erinevatel põhjustel ja viisidel tagasi astunud ministritesse, kuid küsimusele meedia mõjust ministrite tagasiastumisele ei saa kontentanalüüsi abil vastata (vt näide 1; siin ja edaspidi on korrektsed näited esitatud tavalises, halvad näited aga punases kirjas):

Lisaks peavad uurimisküsimused ja hüpoteesid olema selgelt sõnastatud, nendes sisalduvad mõisted peavad olema määratletavad ja analüüsikategooriatena operatsionaliseeritavad. Hüpoteesid ei tohi olla triviaalsed (nagu näites 2) – need peavad paiknema teadusliku teadmise ja mitteteadmise piiril, st ei tohi olla vastuolus varem kindlaks tehtud faktidega ega väita seda, mida niigi teame. Kontentanalüüsi hüpoteesile ei tule kasuks ka liigne jäikus ja absolutiseeritus (nagu näites 3); pigem võiks hüpotees olla suunatud võrdleva trendi esitamisele (nagu näites 4).

Uurimisprogrammi koostamise käigus piiritletakse ka tekstide üldkogum ning pannakse paika valimi moodustamise põhimõtted. Uuritavate tekstide üldkogumist valitakse kodeerimiseks väiksem arv tekste, mille analüüsimisel saadud tulemused saab laiendada üldkogumile. Näiteks võivad üldkogumi moodustada kõik eestikeelsed valimisreklaamid, mis ilmusid üleriigilises trükimeedias enne 2011. aasta parlamendivalimisi.

Kontentanalüüsi valim moodustatakse sageli mitmeastmelise valiku teel: tavaliselt määratletakse esmalt uuritavate tekstide ilmumise või loomise ajavahemik (nt kaks nädalat enne parlamendivalimisi), seejärel meediakanalid või muud väljaanded või tekstikogumid (nt Postimees ja Eesti Päevaleht), ning seejärel konkreetsed tekstid. Kolmandas etapis on võimalik kasutada kõikset valimit (võttes valimisse kõik eelmistel etappidel määratud ajaperioodil ja väljaannetes ilmunud valimisreklaamid) või juhuvalimi moodustamise printsiipe (valides nt igas teises lehenumbris ilmunud valimisreklaamid).

Näiteks uurimuses „Soorollid õppekirjanduses“ (vt Kalmus, Mikk ja Richards, 2002a) kasutati mitmeastmelist valimi moodustamist järgmiselt.

Valimi moodustamisel võidakse lähtuda ka sisulistest ja/või formaalsetest tunnustest. Näide

Online-tekstide (nt ajalehtede võrguväljaannete) uurimisel on üldjuhul otstarbekas kasutada esmalt märksõnapõhist otsingumootorit, mille abil saadud valimit tuleb kontrollida, vajadusel otsingusõnu lisada ning lõpuks valida otsingumootoriga leitud artiklite hulgast sisulise selektsiooni teel uurimiseesmärkidele vastavad (välistades mitteteemakohased artiklid; vt näide 5. Vajadusel võib valimi suuruse vähendamiseks lisaks kasutada juhuvalimi moodustamise printsiipe (valides teemakohastest artiklitest iga n-nda).

Meediatekstide kontentanalüüsis kasutatakse valimi moodustamisel sageli Stevensoni meetodit ehk konstrueeritud nädalat, võttes valimisse huvipakkuva perioodi 1. nädala esmaspäeval, 2. nädala teisipäeval, 3. nädala kolmapäeval jne ilmunud väljaannete teemakohased artiklid. See meetod sobib uudisvoogude uurimiseks pikematel ajavahemikel, tasakaalustamaks ootamatute sündmuste mõju meediakajastusele ja säilitamaks uudisvoo järjepidevust.

Tüüpilisteks probleemideks kontentanalüüsi üldkogumi ja valimi määratlemisel üliõpilastöödes on nende puudulik kirjeldamine ja põhjendamine (mõnikord on üldkogum jäetud koguni määratlemata). Juhuvalimi põhimõtete kasutamisel tuleb ka neid selgelt kirjeldada (näiteks iga n-nda teksti valikul ehk „sammumisel“ tuleb määratleda n ja koht tekstide üldkogumis, kust „sammumist“ alustati). Näites 6 pole määratletud üldkogumit; ka juhuvalimi põhimõtteid pole kirjeldatud.

Kodeerimisjuhendi koostamine

5.2.1. Analüüsiühikute määratlemine

Kontentanalüüsis on analüüsiühik võrreldav „indiviidiga” ankeetküsitluses [viide ankeedi peatükile]. Võimalik on kasutada erinevat liiki ühikuid – vajadusel isegi ühes ja samas uurimuses.

Kontekstilised ühikud on suuremad tekstiosad – laused, ühte teemat puudutavad lauseterühmad, lõigud, artiklid jne. Kontekstiühiku põhjal otsustatakse tunnuste iseloomu üle; teisisõnu, see on tekstiosa, mis tuleb kodeerimise käigus läbi lugeda, määratlemaks nt seda, kas teatud tegelast käsitletakse positiivses või negatiivses valguses.

Loendamis- ehk fikseerimisühik on väikseim osa tekstist, millel on analüüsi jaoks tähendus, st mille esinemist analüüsitavas tekstis loendatakse või määratakse või mille kohta tehakse muud liiki kodeerimisotsustused. Loendamisühikuks võib olla sõna, sümbol, teema, tegevus, tegelane, institutsiooni nimetus või mõni muu maining – sõnaühend, millega tekstis iseloomustatakse mõnd uurijale huvipakkuvat objekti.

Väga sageli kasutatakse füüsilisi ehk „loomulikke“ ühikuid (nt artikkel, reklaam, pilt jne), ruumiühikuid (nt lehekülg) või ajaühikuid (nt telesaate minut).

Näide.

Analüüsiühik tuleb alati määratleda, seda ei saa pidada enesestmõistetavaks. Analüüsiühik peaks olema uurimuse eesmärkidest lähtuv tekstiühik, milles esinevaid nähtusi soovitakse tuvastada või mõõta. Näites 7 [avaneb hüpikaknas] on ekslikult loendamisühikuna määratletud „sõna“, ehkki analüüsi eesmärgist tulenevalt peaks selleks olema „pealkiri“.

Kategooriate loomine

Peamise osa kontentanalüüsi kodeerimisjuhendist moodustab analüüsikategooriate loetelu. Kategooriate loomisel lähtutakse sellest, milliste tunnuste esinemist või puudumist tekstis tahetakse kontrollida, teisisõnu: analüüsikategooriad peavad olema otseselt seotud uurimisküsimuste ja hüpoteesidega. Enamasti kujutavad analüüsikategooriad endast uurimisküsimustes ja hüpoteesides sisalduvaid mõisteid operatsionaliseeritud kujul. Näiteks vastamaks kontentanalüüsi abil küsimusele „Missuguste teemade ja probleemidega seoses kujutatakse Eesti päevalehtedes Venemaa presidenti Vladimir Putinit?“ vajame analüüsikategooriaid „teema“, „probleem“ ja „tegelane“.

Mõnikord on otstarbekas koostada uurimisküsimuste, hüpoteeside ja kategooriate vastavuse plokkskeem veendumaks, et kõikidele uurimisküsimustele vastamiseks ja hüpoteeside kontrollimiseks oleks olemas kategooriad ning vastupidi – et asjatult ei loodaks kategooriaid, mille abil pole võimalik vastata ühelegi uurimisküsimusele (vt joonis 1). Plokkskeemi kasutamine võib aidata suurendada kontentanalüüsi valiidsust.

Leidub ka tüüpilisi meediatekstide kontentanalüüsi põhikategooriaid, mida kasutatakse paljudes uurimustes – tüüpkategooriaid vajadusel uurimismaterjalile kohandades ehk alamkategooriate loendit muutes ja täiendades. Bernard Berelson (1954) on esitanud ühe mõeldava kategooriate liigituse.

1. „Mida öeldakse“ kategooriad

(1) Teema – millest tekstis räägitakse

(2) Autori orientatsioon – kas autor on käsitletava suhtes positiivselt (poolt), negatiivselt (vastu) või neutraalselt häälestatud

(3) Standardsed vastandite paarid – mis on autori orientatsiooni aluseks, millele autor oma hinnangutes tugineb? Näiteks: jõud versus nõrkus, moraalsus
versus ebamoraalsus

(4) Väärtused – need on tihedas seoses eelmise kategooriaga. Mis on tegelaste eesmärgid, milline nende väärtusorientatsioon?

(5) Meetodid – milliseid vahendeid kasutatakse eesmärkide saavutamiseks?

(6) Tegelased – kellest tekstis räägitakse?

(7) Tegelaste karakteristikud, iseloomujooned

(8) Autoriteet – isik või grupp, kelle nimel midagi teatatakse

(9) Allikas – teate päritolu (kohalik, riiklik või rahvusvaheline)

(10) „Märklaud“ – teksti võimalik adressaat

2. „Kuidas öeldakse“ kategooriad

(1) Kommunikatsiooni tüüp – mis liiki materjaliga on tegemist (kommentaar, uudis, meelelahutuslik lugu jne)

(2) Teate vorm:

a) fakti teatav (Õpilane õpib)
b) eelistusest teatav (Õpilane peaks rohkem õppima)
c) identifitseeriv (Ma olen õpilane)

(3) Intensiivsus – teksti emotsiooni tugevus

(4) Kujundid, mõjutusvahendid – teksti retooriline või „propagandistlik“ iseloom

Põhikategooriad jagunevad hierarhiliselt alamkategooriateks, mille olemust kodeerimisjuhendis vajadusel täpsustatakse ja kirjeldatakse, hõlbustamaks ja ühtlustamaks kodeerijate tööd. Näiteks esitab Katrin Oja magistritöö „Ajude äravool avaliku arutelu objektina“ (2005) kontentanalüüsi kodeerimisjuhend (lk-d 116–135) põhjaliku alamkategooriate seletuse.

Pakume siinkohal väikese valiku erinevate tekstide kontentanalüüsi jaoks loodud eestikeelsetest kodeerimisjuhenditest:

Kodeerimisjuhendi koostamiseks võib kasutada nn ekspertmeetodit. Näiteks teemakategooria väljatöötamiseks tutvub rühm inimesi analüüsiks valitud tekstidega ja otsustab, milliseid teemasid see hõlmab. Rühma ühine otsus täpsustatakse– määratakse, milliste märksõnade, tüüpväljendite vms järgi on võimalik üht või teist teemat ära tunda (Timak, 1971).

Kodeerimisjuhendi koostamise rusikareeglid

 1. Kategooriad olgu üksteisest loogiliselt või kontseptuaalselt sõltumatud, st pole otstarbekas koostada sisult lähedasi või osaliselt kattuvaid kategooriaid. Ka alamkategooriad peavad olema üksteisest tähenduslikult selgelt eristuvad. Näites 8 on tegemist kategooriate „Lehekülje kood“ ja „Temaatiline lehekülg“ osalise kattuvusega – otstarbekam oleks luua eraldi kategooriad lehekülje ja rubriigi kohta. Lisaks kattuvad näites 8 alamkategooriad „Tagumine sisekülg“ ja „Tagumine siseleht“.

 2. Alamkategooriad olgu ühe ja sama ühise nimetaja ehk kategooria väärtusklassid, st olemuslikult erinevatesse kategooriatesse kuuluvaid nähtusi ei saa paigutada ühe kategooria alla, vaid tuleb luua eraldi kategooriad. Näites 9 on ekslikult paigutatud ühe kategooria (verbi esinemine pealkirjas) alla täiesti erinevad grammatilised nähtused; korrektne oleks luua erinevad kategooriad verbi aktiivsuse versus passiivsuse ning ajavormide kodeerimiseks.

 3. Andmed tasub alati kodeerida pisut detailsemalt, kui on kavas analüüsi käigus kasutada, st alamkategooriaid olgu pigem rohkem kui vähem. Hilisema analüüsi käigus on alati võimalik ülearuseid alamkategooriaid üksteisega liita, kuid liiga robustselt kodeeritud andmed ei võimalda detailset analüüsi, milleks uurijal võib hiljem vajadus tekkida. See reegel kehtib eriti teemakategooria puhul – sageli on see kategooria peensusteni välja arendatud, koosnedes mitme tasandi alamkategooriatest ja hõlmates kodeerimisjuhendis mitut lehekülge; vt nt Annisti magistritöö (1997) kodeerimisjuhenditNäites 10 on tegemist ilmselgelt liiga robustse teemakategooriaga.

 4. Alamkategooriad peavad ammendama kõik võimalikud sisuvariandid; ettenägematute variantide jaoks tuleb lisada alamkategooria „muu“ ehk nn prügikast, millesse langevad tekstilised nähtused, mis sisuliste alamkategooriate alla ei sobitu. Näites 9 pole ammendavuse nõue täidetud – lisaks lihtminevikule ja olevikule esineb pealkirjades kindlasti ka teisi ajavorme. Näites 10 pole ammendatud kaugeltki kõik ajalehtede teemavaldkonnad; lisaks puudub „prügikast“, mis teemakategooria puhul on igal juhul vajalik.

 5. Alamkategooriad peavad olema üksteist välistavad – iga loendamisühik saab korraga kuuluda ainult ühte alamkategooriasse. Näites 11 on see nõue täidetud.

 6. Kategooriaid tuleks nii kodeerimise kui ka hilisema analüüsi hõlbustamiseks standardiseerida nii palju kui võimalik, st luua selged alamkategooriad. Näites 12 on ebaotstarbekalt jäetud alamkategooriateks jagamata väga hästi standardiseeritav elukoha kategooria.

 7. Kategooriad peavad olema kodeerijatele üheselt mõistetavad ega tohi sisaldada subjektiivseid, kontekstualiseerimata või määratlemata hinnanguid. Näites 13 on tegemist kodeerijate subjektiivsest hinnangust sõltuvate hinnangutega informatsiooni piisavusele. Korrektsem oleks mõõta artiklites sisalduvat infot lavastuste üksikasjade (nt lavakujundus, kostüümid, näitlejate töö jne) kohta.

Valiidsus ja reliaablus kontentanalüüsis

Sarnaselt teiste standardiseeritud sotsiaalteaduslike meetoditega on ka kontentanalüüsi puhul võimalik hinnata selle kvaliteeti – nii valiidsust kui ka reliaablust. Valiidsus tähendab mõõtmise vastavust uurimuse eesmärkidele – kuivõrd me mõõdame seda, mida tahame teada saada? Eristatakse seesmist ja välist valiidsust. Neist esimene kujutab endast vastust küsimusele, kas teoreetilised mõisted, uurimisküsimused ja indikaatorid (kontentanalüüsi puhul analüüsikategooriad) on omavahel vastavuses. Seesmist valiidsust on võimalik hinnata analüütilise mõttetöö abil; seda hõlbustab praktiliselt ja visuaalselt kategooriate plokkskeemi visandamine.

Väline valiidsus kujutab endast vastust küsimusele, kas valim on üldkogumi suhtes esinduslik.

Reliaablus tähendab mõõtmise usaldusväärsust, mõõtmisinstrumendi (kontentanalüüsi puhul kodeerimisjuhendi) töökindlust. Kontentanalüüsis eristatakse kaht usaldusväärsuse mõistet: 1) stabiilsus (ingl intra-coder reliability), mis mõõdab seda, kuivõrd üks kodeerija jõuab samade tulemusteni, kui ta rakendab kodeerimisjuhendit samadele tekstidele teatud ajalise intervalliga, ja (2) reliaablus (ingl inter-coder reliability), mis mõõdab seda, kuivõrd erinevad kodeerijad jõuavad ühesuguste tulemusteni, kui nad rakendavad kodeerimisjuhendit samadele tekstidele. Mõlemal juhul väljendatakse kodeerimise usaldusväärsuse määra üldjuhul protsentides, st arvutatakse kokkulangenud kodeerimisotsustuste suhtarv (%) kõikidest kodeerimisotsustustest (vt ka alateemat Proovikodeerimine).

Proovikodeerimine

Kodeerimisjuhendi testimiseks, reliaabluse määramiseks ja kodeerijate töö ühtlustamiseks on ülimalt soovitatav teostada enne kogu uuritava tekstihulga kodeerimist proovikodeerimine. Selleks moodustatakse proovivalim – väike osa (10%, suuremate valimite puhul vähem) tekstide koguvalimist. Otstarbekas on võtta proovivalimisse tekste, mis erinevad nii pikkuse kui ka keerukuse poolest, esindades kõiki koguvalimi peamisi tekstitüüpe (nt ajaleheartiklite puhul lühiuudiseid, laiendatud uudiseid, arvamus- ja olemuslugusid jne).

Kodeerimise stabiilsuse määramiseks kodeerib uurija proovivalimi tekstid ning kordab seda tegevust mõne aja (mõne nädala kuni kuu) möödudes. Kodeerijatevahelise reliaabluse hindamiseks kodeerivad kõik uurimuses osalevad kodeerijad üheaegselt ja üksteisest sõltumatult proovivalimi tekste. Seejärel võrreldakse vastavalt eri ajahetkedel või eri kodeerijate saadud kodeerimistulemusi ning fikseeritakse iga kategooria ja iga loendamisühiku puhul kokkulangenud ja lahknenud kodeerimisotsustused. Näide Järgnevalt summeeritakse kokkulangevuse määrad kodeerimistabeli (vt nt tabel 2) ridades (ühikute kaupa), veergudes (kategooriate kaupa) ja kogu tabeli ulatuses. Summaarne kokkulangevus jagatakse tehtud kodeerimisotsustuste koguarvuga ning väljendatakse saadud suhtarv protsentides.

Näide

Ideaaljuhul peaks reliaabluse määr olema üle 90%. Kui see on oluliselt madalam, tuleb kodeerimisjuhendit täiustada, täpsustades ja selgitades proovikodeerimisel problemaatilisteks osutunud kategooriaid.

Proovikodeerimisel hinnatakse ka alamkategooriasse „muu“ ehk „prügikasti” langevate loendamisühikute suhtarvu igas kategoorias. Kui „prügikasti“ satub rohkem kui 10% ühikuid kategooria lõikes, ei ole välja töötatud piisaval arvul sisulisi alamkategooriaid ning kodeerimisjuhendit tuleb selles osas täiustada.

Lõpliku reliaabluse määra mõõtmiseks korratakse proovikodeerimist pärast juhendi täiustamist uue proovivalimi peal.

Kui kodeerimisjuhend osutub proovikodeerimisel töökindlaks, võib asuda koguvalimi tekstide kodeerimisele. Suurema uurimisrühma puhul on võimalik rakendada tööjaotust, jagades tekstid kodeerijate vahel. Keerukamate tekstide puhul on soovitatav, et kõiki tekste kodeeriks kaks uurijat, kes peaks lahknevused läbi arutama ja jõudma konsensuslikele otsustustele.

Kodeerimisel kantakse analüüsiühikutele vastavad kodeerimisjuhendi koodarvud kodeerimistabelisse, milleks võib olla nt MS Exceli või SPSSi tööleht. Tabel 2 esindab väljavõtet uurimuses „Soorollid õppekirjanduses“ (Mikk, 2002) kasutatud õpikutekstide kodeerimistabelist.

Koguvalimi tekstide kodeerimisele järgneb andmete analüüs, tõlgendamine, üldistamine ja kontekstualiseerimine ning konteksti kohta järelduste tegemine. Andmetöötluseks kasutatakse tavaliselt MS Excelit või SPSSi. Tulemused esitatakse töö põhiosas selgelt struktureeritud kujul (teemade või uurimisküsimuste alusel liigendatuna), põhjalikult kommenteeritud graafikute ja/või tabelitena. Lisas esitatakse kodeerimisjuhend, vajadusel ka suuremad tabelid. Standardiseeritud kontentanalüüsi tulemuste esitamise eeskujulikku näidet pakuvad Katrin Oja magistritöö (2005) põhiosa (lk-d 36–59) ning lisad 1 ja 5.

Kontentanalüüsi tulemuste tõlgendamisel tehakse enamasti järeldusi tekstiväliste, kontekstuaalsete nähtuste kohta, vaadeldes kommunikatsiooni sisu kui sotsiaalse tegelikkuse peeglit, oluliste protsesside ja suhtumiste kajastajat (Timak, 1971), aga ka sotsiaalse tegelikkuse konstrueerijat. Juba Gerbner (1964) väitis, et meediaanalüütiku ülesandeks on otsida süsteemi kommunikatsiooni faktide ja vormide tagant, käsitledes sisu kui sotsiaalsete suhete ja institutsionaalse dünaamika väljendajat ning kui sotsiaalsete mustrite kujundajat. Näiteks võib eeldada, et mida rohkem esineb teatud sümboleid, rolle, sotsiaalsete rühmade esindajaid, väärtusi jne avalikes tekstides või sõnumisüsteemides, seda olulisemaks, väärtustatumaks, enesestmõistetavaks neid fenomene ühiskonnas peetakse. Avalikes tekstides domineerivad sisumustrid ühelt poolt peegeldavad ühiskonna väärtussüsteemi, ent teiselt poolt loovad seda, pannes paika prioriteetide süsteemi ja aidates seda säilitada või muuta.

Kontentanalüüsi tulemused võivad aidata iseloomustada diskursiivset korda – ühiskondlik-poliitilist korda, vaadatuna läbi diskursiivse ehk keelelis-kommunikatiivse prisma. Just suuremahulised kontentanalüüsil põhinevad uurimused võimaldavad tuua esile kommunikatiivsed regulaarsused, milles ilmnevad avaliku tekstiloome tavad, reeglid ja normid – arusaamad ja kokkulepped selle kohta, mida, kui palju ja mil viisil on sünnis, oluline ja mõistlik verbaalsete ja/või visuaalsete vahendite abil avalikes sõnumisüsteemides kujutada.

Annist, A. (1997). „Teise“ konstrueerimine: noorte kujutamine Eesti meedias „Postimehe“ näitel. Magistritöö. Tartu Ülikool, sotsioloogia osakond.

Berelson, B. (1954). Content Analysis. G. Lindzey (Toim), Handbook of Social Psychology. Vol. 1: Theory and Method (lk 488–522). Cambridge: Addison-Wesley Publishing Company, Inc.

Gerbner, G. (1964). On Content Analysis and Critical Research in Mass Communication. L. A. Dexter ja D. M. White (toim), People, Society, and Mass Communications (lk 476–500). Glencoe, IL: The Free Press. Kasutatud 07.09.2014 http://www.asc.upenn.edu/gerbner/asset.aspx?assetid=318.

Gerbner, G. (1969). Toward „Cultural Indicators“: The Analysis of Mass Mediated Public Message Systems. Audio-Visual Communication Review, 17(2), 137–148. Kasutatud 07.09.2014 http://www.asc.upenn.edu/gerbner/asset.aspx?assetid=360.

Kalmus, V., Mikk, J., Richards, J. (2002a). Kodeerimisjuhend soorollide analüüsimiseks õpikutekstides. J. Mikk (toim), Soorollid õppekirjanduses (lk 258–269). Tartu: Tartu Ülikooli Pedagoogika osakonna väljaanne nr 12.

Kalmus, V., Mikk, J., Richards, J. (2002b). Kodeerimisjuhend soorollide analüüsimiseks õpikute illustratsioonidel ja fotodel. J. Mikk (toim), Soorollid õppekirjanduses (lk 270–281). Tartu: Tartu Ülikooli Pedagoogika osakonna väljaanne nr 12.

Krippendorff, K. (1980). Content Analysis: An Introduction to its Methodology. London: Sage.

Mikk, J. (toim). (2002). Soorollid õppekirjanduses. Tartu: Tartu Ülikooli Pedagoogika osakonna väljaanne nr 12.

Oja, K. (2005). Ajude äravool avaliku arutelu objektina. Magistritöö. Tartu Ülikool, ajakirjanduse ja kommunikatsiooni osakond. Kasutatud 07.09.2014 http://dspace.utlib.ee/dspace/handle/10062/742.

Tigasson, K.-R. (2003). Valimisreklaami muutumine televisioonis 1992–2002. Magistritöö. Tartu Ülikool, ajakirjanduse ja kommunikatsiooni osakond. Kasutatud 07.09.2014 http://dspace.utlib.ee/dspace/handle/10062/38799.

Timak, R. (1971). Sisuanalüüsi meetodist ja selle rakendamisest. Fakt, sõna, pilt VI (lk-d 86–115). Tartu: TRÜ.

Krippendorff, K. (2013). Content Analysis: An Introduction to Its Methodology. Los Angeles: Sage.

Peatükk „Content Analysis“ raamatus S. Titscher, M. Meyer, R. Wodak ja E. Vetter (2000) Methods of Text and Discourse Analysis (lk 55–73), London: Sage – annab hea ülevaate nii standardiseeritud kui kvalitatiivsest sisuanalüüsist.

Märksõnad

Analüüsikategooria – standardiseeritud kontentanalüüsis tunnus, mille esinemist või puudumist uuritavates tekstides süstemaatiliselt kontrollitakse; analüüsikategooriate ja alamkategooriate loend moodustab põhiosa kontentanalüüsi kodeerimisjuhendist.

Analüüsiühik – standardiseeritud kontentanalüüsis osa tekstist, mille esinemist analüüsitavates tekstides loendatakse või määratakse või mille kohta tehakse muud liiki kodeerimisotsustused; on võrreldav „indiviidiga” ankeetküsitluses.

Deduktiivne analüüs – ka deduktiivne lähenemine – teooriast ja/või varasematest uurimustest lähtuv analüüs, mida iseloomustab konkreetsete uurimisküsimuste (ja/või hüpoteeside) olemasolu ning analüüsikategooriate loomine enne analüüsi põhiosa läbiviimist.

Denotatiivne – enamasti sõnaühendis denotatiivne tähendus või denotatiivne tasand – otse- ehk sõnaraamatutähenduslik.

Diskursiivne kord – ka kujul diskursuse kord või diskursikord – diskursuste kogum institutsioonis või ühiskonnas; ühiskondlik-poliitiline kord, vaadatuna läbi diskursiivse ehk keelelis-kommunikatiivse prisma.

Konnotatiivne enamasti sõnaühendis konnotatiivne tähendus või konnotatiivne tasand – kaas- või lisatähenduslik; konnotatsioon – tundmuslik lisatähendus, mille keeletarvitajad seovad sõna, väljendi või kujutisega oma kogemuste ja väärtushinnangute alusel.

Kontentanalüüs – ka standardiseeritud või kvantitatiivne kontent- ehk sisuanalüüs – uurimistehnika kommunikatsiooni/tekstide eksplitsiitse sisu objektiivseks, süstemaatiliseks ja kvantitatiivseks kirjeldamiseks.

Manifestne sisu – teksti eksplitsiitsed, otseselt väljaöeldud osad (nt teemad, argumendid, tegelased, tegevused jne), mida edastatakse eelkõige verbaalsete väljendusvahendite abil.

Reliaablus – mõõtmise usaldusväärsus, mõõtmisinstrumendi (kodeerimisjuhendi, skaala vm) töökindlus.

Valiidsus – mõõtmise vastavus uurimuse eesmärkidele; hinnang sellele, kuivõrd mõõdetakse seda, mida tahetakse teada saada.