Analyse av forskjeller i gjennomsnitt

Når utfallene er kontinuerlige, f.eks. målt på en visuell analog skala (VAS), kan du beregne gjennomsnitt og standardavvik. Det er en beskrivelse av sentraltendens og spredning for utfallet blant personene som deltok i den aktuelle studien. I tabell 3 viser vi resultatene fra en studie som har sett på effekten av p-piller (tiltaksgruppe) , sammenlignet med placebopiller (kontrollgruppe) mot menstruasjonssmerter. Gjennomsnitt (M) og standardavvik (SD) for alle målepunktene både før og etter behandlingsstart (pre- og posttest) for henholdsvis tiltaks- og kontrollgruppen, er presentert.

Tabell 3: Gjennomsnitt, standardavvik, 95 % KI og p-verdi for smerteskår

 P-piller
tiltaksgruppe
Placebo
kontrollgruppe
95 %
KI
p-verdi
MenstruasjonssmerterMSDMSD  
Pretest11,1511,85-0,53
Posttest (3 måneder)3,13,25,84,50,88 til 4530,004

I tabell 3 er det gjennomsnittene på posttestene som sammenlignes (her 3,1 og 5,8 for variabelen menstruasjonssmerter). I massasjestudien presenteres gjennomsnittsforskjellen sammen med konfidensintervall og p-verdi (tabell 4). For å kunne vurdere om endring er klinisk relevant, er det viktig å vite bredden på måleskalaen og ha et forhold til hva som er en viktig endring for pasienten. Hvis konfidensintervallet krysser 0 (gjelder kontinuerlige variabler) betyr det at det ikke er sikkert at det er forskjell i utgangspopulasjonen.

Tabell 4: Forskjell i gjennomsnitt og 95 % KI

SymptombelastningGjennomsnittsforskjell95 % KIp-verdi
4 uker-2,1-4,0 til -0,030,0006
26 uker -4,4 til 0,630,14

I denne studien er gjennomsnittsforskjellen for symptombelastning ved fire uker mellom de som fikk massasje og de som fikk informasjon 2,1 poeng i favør av massasjegruppen. Utfallet er målt på en 0 til 10 poengs skala, og jo lavere skår desto bedre. 95 % KI i fire uker går fra minus 4 til minus 0,03 poeng. Det betyr at denne forskjellen kan overføres til utgangspopulasjonen. Ved oppfølging etter både 10 og 26 uker krysser konfidensintervallet 0. Da kan vi ikke si at forskjellen gjelder i utgangspopulasjonen.

I eksemplene over har vi valgt å vise til studier som sammenligner forskjeller i gjennomsnitt mellom en tiltaksgruppe og en kontrollgruppe. Det er viktig å være klar over at statiske analyser basert på gjennomsnittsforskjeller, kan gi feilaktige resultater hvis måleresultatene ikke er normalfordelte. I slike tilfeller kan det være aktuelt å benytte seg av andre statistiske metoder som for eksempel ikke-parametriske analyser og transformasjoner. Det finnes også statistiske metoder for å analysere data fra ikke-kontrollerte studier, for eksempel før-etter-studier, men det er viktig å være klar over at resultater fra ukontrollerte studier er utsatt for påvirkning fra systematisk feilkilder.

Eva Denison, Kunnskapssenteret, gir en  innføring i hvordan analysere tall. Eva underviser i statistikk og kunnskapsbasert praksis for helsepersonell. I tillegg skriver hun kunnskapsoppsummeringer m.m. og har skrevet bruksanvisninger for ulike statistikkprogram.

Vær oppmerksom på feil to steder i videoen:

  • Ved 4 min, 30 sek står det «Gjennomsnittsforskjellen mellom gruppene er 30 mmHg», mens det sies at den er 35 mmHg. Det korrekte er 30 mmHg.
  • Ved 6 min, 11 sek står det «Risiko i eksperimentgruppen (Pille A): 18/46 = 0,28 = 28 %», mens det sies at det var 18 av 64 som fikk hjerteinfarkt. Det korrekte er 18/64 = 0,28 = 28 %.
(http://www.helsebiblioteket.no/kunnskapsbasert-praksis/kritisk-vurdering/analysere-tall-2)