Uha, det er længe siden jeg sidst har gjort sådan noget. Hvordan
beregner jeg et gennemsnit?
Jeg har f.eks. følgende eksperimentelt fundne koordinatsæt:
(8.299, 2.706) [1]
(8.293, 2.701) [2]
(8.281, 2.735) [3]
(8.320, 2.666) [4]
(8.298, 2.711) [5]
(8.303, 2.670) [6]
(8.289, 2.708) [7]
(8.293, 2.708) [8]
(8.299, 2.718) [9]
der egentlig alle burde være ens. Det er naturligvis nemt at beregne et
almindeligt gennemsnit og komme frem til koordinatsættet (8.297, 2.703).
Målingernes afvigelse fra den korrekte værdi skyldes naturligvis i høj grad
måleunøjagtigheden, for det kan naturligvis ikke forventes, at jeg altid
måler den korrekte værdi. Derfor foretages en række målinger, og den
korrekte værdi bestemmes så som gennemsnittet af disse målinger.
Men eftersom koordinatsættene jo er fundet eksperimentelt, kan der ved
forsøget ud over almindelig måleunøjagtigheder have været forskellige
påvirkninger, der har medført, at målingen er afveget væsentligt fra den
korrekte værdi. Ovenfor er førstekoordinaten for koordinatsæt [3] og [4]
f.eks. ret langt fra de øvrige, og andenkoordinaten for koordinatsæt [3],
[4] og [6] er også ret langt fra de øvrige. Der er derfor en sandsynlighed
for, at der for netop disse koordinatsæt har været en påvirkning, der har
givet en fejlbehæftet måling.
Sådanne koordinatsæt vil jeg naturligvis gerne forkaste med det samme, så
de ikke tages med i betragtning, når jeg bestemmer gennemsnittet. Eftersom
disse koordinatsæt ligger "langt fra" den korrekte værdi, så påvirker de
også gennemsnittet kraftigt, og det vil jeg gerne undgå. Gennemsnittet
skulle naturligvis gerne være så tæt på den korrekte værdi som muligt.
Hvordan identificerer jeg de koordinatsæt, hvor der er en stor
sandsynlighed for, at målingen er fejlbehæftet?
Og hvor mange koordinatsæt kan jeg tillade mig at forkaste? Kan jeg med de
ovenfor nævnte ni koordinatsæt tillade mig at forkaste de tre, så
gennemsnittet kun beregnes på baggrund af 2/3 af de målte koordinatsæt?
Eller bør jeg foretage yderligere målinger, så f.eks. kun 1/5 eller mindre
af koordinatsættene forkastes?
Lad mig bare indrømme, at statistik aldrig har været min stærke side. Det
er derfor, jeg spørger her :)
--
Uffe Holst
|