Kandu.dk - Statistikspørgsmål vedr. sammenhæng mellem variable.


/ Forside / Karriere / Uddannelse / Højere uddannelser / Nyhedsindlæg

Glemt dit kodeord?

Brugernavn*

Kodeord *

Husk mig

Brugerservice

Kom godt i gang

Bliv medlem

Seneste indlæg

Find en bruger

Stil et spørgsmål

Skriv et tip

Fortæl en ven

Pointsystemet

Kontakt Kandu.dk

Emnevisning

Kategorier

Alfabetisk

Karriere

Interesser

Teknologi

Reklame

Top 10 brugere

Højere uddannelser

#	Navn	Point
1	Nordsted1	1588
2	erling_l	1224
3	ans	1150
4	dova	895
5	gert_h	800
6	molokyle	661
7	berpox	610
8	creamygirl	610
9	3773	570
10	jomfruane	570

Statistikspørgsmål vedr. sammenhæng mellem~
Fra : Kim Eichen

Dato : 14-10-04 22:26

Hej gruppe

Jeg vil gerne undersøge sammenhænge mellem nogle udvalgte variable.
Data består af et spørgeskema med med 62 spørgsmål (faktorer), som
respondenterne rater på en skala fra ingen betydning til stor betydning
fordelt over 5 svarmuligheder.
Spørgeskemaet er blevet besvaret af 100 respondenter.
Jeg har så fået at vide fra flere sider at en chi-i-anden testen anvendes
til dette formål.
Problemet jeg er stødt på er at den forventede værdi til hvert felt skal
være mindst 5 hvis testen skal være gyldig og når jeg gennemfører en
chi-i.anden test med 2 variable med 5 svarmuligheder hver vil der være 5*5 =
25 felter, som skal have en forventet værdi på mindst 5. Da der kun er 100
respondenter vil det være umuligt at opfylde kravet om en forventet værdi på
5 i hvert felt.

Mit spørgsmål er så: hvordan kan jeg med de data jeg har til rådighed teste
sammenhængen mellem variablerne?

Derudover er jeg meget interesseret i at vide om I kender et tilgængeligt
program, der for alle 62 faktorer kan teste alle potentieller sammenhænge og
opstille dem i en tabel, hvor der for hver sammenhæng kan aflæses en værdi,
der angiver i hvilken grad faktorne er afhængige (I må i givet fald også
meget gerne fortælle mig hvilken værdi, der afgører at de er afhængige).

Mvh Kim Eichen

---
Outgoing mail is certified Virus Free.
Checked by AVG anti-virus system (http://www.grisoft.com).
Version: 6.0.772 / Virus Database: 519 - Release Date: 01-10-2004

Kim Eichen (15-10-2004)

Kommentar
Fra : Kim Eichen

Dato : 15-10-04 11:20

"Kim Eichen" <eichen@tiscali.dk> skrev i en meddelelse
news:416eeef4$0$77014$14726298@news.sunsite.dk...
> Hej gruppe
>
> Jeg vil gerne undersøge sammenhænge mellem nogle udvalgte variable.
> Data består af et spørgeskema med med 62 spørgsmål (faktorer), som
> respondenterne rater på en skala fra ingen betydning til stor betydning
> fordelt over 5 svarmuligheder.
> Spørgeskemaet er blevet besvaret af 100 respondenter.
> Jeg har så fået at vide fra flere sider at en chi-i-anden testen anvendes
> til dette formål.
> Problemet jeg er stødt på er at den forventede værdi til hvert felt skal
> være mindst 5 hvis testen skal være gyldig og når jeg gennemfører en
> chi-i.anden test med 2 variable med 5 svarmuligheder hver vil der være 5*5
> = 25 felter, som skal have en forventet værdi på mindst 5. Da der kun er
> 100 respondenter vil det være umuligt at opfylde kravet om en forventet
> værdi på 5 i hvert felt.
>
> Mit spørgsmål er så: hvordan kan jeg med de data jeg har til rådighed
> teste sammenhængen mellem variablerne?

Jeg opdagede så at jeg jo kunne foretage en Pearson korrelationstest og
denne giver umiddelbart nogle ganske fornuftige resultater.

Vores svarkategori er som jeg har forstået datatyperne ordinal (ingen
betydning, lille betydning, nogen betydning, stor betydning og meget stor
betydning).
Jeg har læst at hvis Pearsons korrelationstest skal anvendes skal datatypen
være skala, men er dette en ufravigelig betingelse eller kan jeg godt
tillade mig at anvende den alligevel?

Derudover vil jeg høre om I kan hjælpe mig med nogle tommelfingerregler for
tolkningen af værdierne. jeg kan se den maksimale værdi er 1, som optræder
når en faktor sammenlignes med sig selv, så det er ikke overraskende.
Der er nogle af faktorerne, der er angivet med en eller to stjerner afhængig
af om de er signifikante på 0,05 eller 0,01 niveau.
Imidlertid er der også negative værdier, hvordan skal de tolkes?

Yderligere er der også angivet en signifikansværdi, hvor det primære, som
jeg har forstået det, er hvordan værdien i forhold til henholdsvis 0,05 og
0,01

Det jeg så også er i tvivl om er om jeg skal bruge Pearson
korrelationsværdien eller signifikansværdien, for de hænger ikke helt sammen
idet der er nogle sæt af faktorer hvor Pearson værdien er højere i det ene
resultat, men signifikansværdien er lavere (mere signifikant, tættere på 0)
i det andet. Jeg troede at værdierne så at sige fulgtes ad.

Vil en korrekt formulering af et resultat hvor korrelationen er signifikant
på 0,05 niveau være: Testen af korrelationen mellem faktor 1 og 2 giver et
resultat på 0,258 og et signifikansniveau på 0,02. Der vil derfor være en
høj grad af korrelation (er der forskel på korrelation og sammenhæng?)
mellem de to faktorer?

Mvh Kim Eichen

Carsten Troelsgaard (16-10-2004)

Kommentar
Fra : Carsten Troelsgaard

Dato : 16-10-04 12:12

Jeg er bestemt ikke nogen statistik-haj, men jeg læste denne sci-square tutorial og er ret sikker
på, at jeg kan gennemføre og tolke dine data ud fra fremgangsmåden der er beskrevet her:

http://www.georgetown.edu/faculty/ballc/webtools/web_chi_tut.html

Du må hellere læse den selv, men jeg har kommenteret ud fra det der står i den.

"Kim Eichen" <eichen@tiscali.dk> skrev i en meddelelse
news:416fa43f$0$77009$14726298@news.sunsite.dk...
>
> "Kim Eichen" <eichen@tiscali.dk> skrev i en meddelelse
> news:416eeef4$0$77014$14726298@news.sunsite.dk...
> > Hej gruppe
> >
> > Jeg vil gerne undersøge sammenhænge mellem nogle udvalgte variable.
> > Data består af et spørgeskema med med 62 spørgsmål (faktorer), som
> > respondenterne rater på en skala fra ingen betydning til stor betydning
> > fordelt over 5 svarmuligheder.
> > Spørgeskemaet er blevet besvaret af 100 respondenter.
> > Jeg har så fået at vide fra flere sider at en chi-i-anden testen anvendes
> > til dette formål.
> > Problemet jeg er stødt på er at den forventede værdi til hvert felt skal
> > være mindst 5 hvis testen skal være gyldig og når jeg gennemfører en
> > chi-i.anden test med 2 variable med 5 svarmuligheder hver vil der være 5*5
> > = 25 felter, som skal have en forventet værdi på mindst 5.

Jeg forstår det sådan, at hver svarkategori bør have en værdi over 5, så hvis du sammenligner to
faktorer får du 2*5 felter.

> Da der kun er
> > 100 respondenter vil det være umuligt at opfylde kravet om en forventet
> > værdi på 5 i hvert felt.
> >
> > Mit spørgsmål er så: hvordan kan jeg med de data jeg har til rådighed
> > teste sammenhængen mellem variablerne?
>
> Jeg opdagede så at jeg jo kunne foretage en Pearson korrelationstest og
> denne giver umiddelbart nogle ganske fornuftige resultater.
>
> Vores svarkategori er som jeg har forstået datatyperne ordinal (ingen
> betydning, lille betydning, nogen betydning, stor betydning og meget stor
> betydning).
> Jeg har læst at hvis Pearsons korrelationstest skal anvendes skal datatypen
> være skala, men er dette en ufravigelig betingelse eller kan jeg godt
> tillade mig at anvende den alligevel?

Som problematikken er sat op i tutorialen tror jeg ikke at det betyder noget for din beregning.

> Derudover vil jeg høre om I kan hjælpe mig med nogle tommelfingerregler for
> tolkningen af værdierne. jeg kan se den maksimale værdi er 1, som optræder
> når en faktor sammenlignes med sig selv, så det er ikke overraskende.

Korrelationen (sammenhængen) mellem to faktorer kan angives med en værdi der bliver 'bedre og bedre'
jo nærmere den når 1.

> Der er nogle af faktorerne, der er angivet med en eller to stjerner afhængig
> af om de er signifikante på 0,05 eller 0,01 niveau.

Du skal beregne en værdi, sci square, for en valgt matrix (faktorer*kategorier). Værdien skal
sammenlignes med en tabelværdi for samme matrix sci-square. Tabelværdierne er (formodentlig)
forskellige alt efter det konfidens-niveau du har valgt.

> Imidlertid er der også negative værdier, hvordan skal de tolkes?

?

> Yderligere er der også angivet en signifikansværdi, hvor det primære, som
> jeg har forstået det, er hvordan værdien i forhold til henholdsvis 0,05 og
> 0,01

Ikke forstået. Jeg vil forstå anvisningerne til signifikansniveau sådan, at du tester faktorer med
samme signifikansniveau sammen. Du kan så bruge korrelationskoeficienten for at teste sammenhængen
mellem faktorerne på det pågældende konfidensniveau.

Hvis du laver en grafisk fremstilling af dine resultater kan du umiddelbart få et indtryk af hvilke
faktorer der følges ad - dvs at du bruger visuel inspektion i stedet for den numerisk analyse hvor
du får angivet en sammenhæng som en korrelationsquotient.

> Det jeg så også er i tvivl om er om jeg skal bruge Pearson
> korrelationsværdien eller signifikansværdien, for de hænger ikke helt sammen
> idet der er nogle sæt af faktorer hvor Pearson værdien er højere i det ene
> resultat, men signifikansværdien er lavere (mere signifikant, tættere på 0)
> i det andet. Jeg troede at værdierne så at sige fulgtes ad.

Du vælger konfidensniveauet. Hvis det er 'lavt' får du måske en dårligere korrelationsværdi end hvis
du har valgt et 'højere' konfidensniveau. Gåseøjnene fordi højt og lavt vist bruges modsat.

> Vil en korrekt formulering af et resultat hvor korrelationen er signifikant
> på 0,05 niveau være: Testen af korrelationen mellem faktor 1 og 2 giver et
> resultat på 0,258 og et signifikansniveau på 0,02.

Ja

> Der vil derfor være en
> høj grad af korrelation (er der forskel på korrelation og sammenhæng?)
> mellem de to faktorer?

Nej, 0,258 svarer til at 25,8% af svarene kan forklares som en sammenhæng mellem de to faktorer
(underforstået at 74,2% stammer fra andre faktorer) - så det er jo egentlig ikke ret meget.

Jeg er sikker på at du vil være afklaret, når du har læst manualen. Den er ret konkret.

Carsten

Martin Larsen (16-10-2004)

Kommentar
Fra : Martin Larsen

Dato : 16-10-04 12:43

"Carsten Troelsgaard" <carsten.troelsgaard@mail.dk> skrev i en meddelelse news:417101eb$0$203$edfadb0f@dread14.news.tele.dk...
>
> Jeg er bestemt ikke nogen statistik-haj, men jeg læste denne sci-square tutorial og er ret sikker

Du mener chi^2, opkaldt efter det græske bogstav der
ligner et krøllet X.

Mvh
Martin

Martin Jørgensen (16-10-2004)

Kommentar
Fra : Martin Jørgensen

Dato : 16-10-04 16:06

Carsten Troelsgaard wrote:

> Jeg er bestemt ikke nogen statistik-haj, men jeg læste denne sci-square tutorial og er ret sikker
> på, at jeg kan gennemføre og tolke dine data ud fra fremgangsmåden der er beskrevet her:
>
> http://www.georgetown.edu/faculty/ballc/webtools/web_chi_tut.html
-snip-

Ja, der findes vist et par tests der anvender chi^2. Jeg tror mere at
spørgeren ledte efter et program der kunne sammenholde alle 62 faktorer
mere eller mindre på én gang. En måde er selvfølgeligt vha. dit link at
opstille et Excel-ark og importere resultaterne... Der skal nok en del
arbejde til og man skal have statistisk overblik og forstå hvad man laver...

En anden måde er at google efter freeware/shareware
statistik-programmer, fordi jeg kender ikke så meget andet end
Statgraphics, som vist kræver licens.

mvh.
Martin Jørgensen

--
---------------------------------------------------------------------------
Home of Martin Jørgensen - http://www.martinjoergensen.dk

Kim Eichen (16-10-2004)

Kommentar
Fra : Kim Eichen

Dato : 16-10-04 23:01

"Martin Jørgensen" <unoder.spam@spam.jay.net> wrote in message
news:417138bc$0$287$edfadb0f@dread12.news.tele.dk...
> Carsten Troelsgaard wrote:
>
>> Jeg er bestemt ikke nogen statistik-haj, men jeg læste denne sci-square
>> tutorial og er ret sikker
>> på, at jeg kan gennemføre og tolke dine data ud fra fremgangsmåden der er
>> beskrevet her:
>>
>> http://www.georgetown.edu/faculty/ballc/webtools/web_chi_tut.html
> -snip-
>
> Ja, der findes vist et par tests der anvender chi^2. Jeg tror mere at
> spørgeren ledte efter et program der kunne sammenholde alle 62 faktorer
> mere eller mindre på én gang. En måde er selvfølgeligt vha. dit link at
> opstille et Excel-ark og importere resultaterne... Der skal nok en del
> arbejde til og man skal have statistisk overblik og forstå hvad man
> laver...

Ok, jeg prøver lige at ridse formålene og situationen op.

Vi (jeg skriver sammen med en anden) har et spørgeskema med 62 spørgsmål
vedrørende hvilke faktorer (ikke faktorer ud fra en statistisk definition),
der bidrager til succes i SPI-projekter (software process improvement
projekter). Respondenten skal have deltaget i et SPI-projekt og tage
udgangspunkt for besvarelsen i dette projekt.På skemaet skal udfylde hvilket
rolle (sponsor/ejer, projektleder, konsulent, bruger af SPI,
projektmedarbejder, andet) respondenten har haft i det pågældente projekt.
Jeg har fået besvarelser fra 100 respondenter.

Fomålet er dels at afgøre hvilke faktorer, der bidrager mest til succes i et
SPI-projekt og herunder at afgøre om respondentens rolle i projektet har
betydning for besvarelsen.
Vi forestiller os at vi eventuelt kan eliminere nogle af faktorerne ved
hjælp af en korrelationstest, så vi kan eliminere en af faktorerne i de sæt
af faktorer, der har en korrelationsværdi på mindst ca. 0,7.
Vi vil også gerne kunne skære mindre relevante fraktorer fra og til dette
formål foreslog vores vejleder (som går ind for meget enkle løsninger) at vi
skulle vælge et gennemsnit og
kun medtage de faktorer fra foreningsmængden af en liste med alle
besvarelserne og de enkelte rollers (dvs. en gruppe bestående af alle med
den pågældende rolle) besvarelser, der har en gennemsnitsværdi på mindst 4.
Denne metode er vi dog ikke meget for, for hvis gennemsnittet eksempelvis er
sat til 4, så virker det meget hårdt at skulle skære en faktor med en
gennemsnitsværdi på 3,99, men medtage en faktor med en gennemsnitsværdi på
4,00, især i betragtning af at der er mange usikkerheder forbundet med
besvarelserne.

Derudover skal der skabes et overblik over et SPI-projekt i form af en
grafisk model hvor de enkelte roller er anført med hvilke faktorer, der er
relateret til den enkelte rolle og hvilke faktorer der er relationer mellem
roller. De faktorer, der er angivet til den enkelte rolle vil vi også gerne
vægte, så der oprettes et antal lister sorteret efter betydning.

Det der ønskes foretaget i forhold til datamaterialet er dels at afgøre om
der er så stor forskel på de enkelte roller besvarelser at materialet skal
deles op i roller eller om forskellen er så ubetydelig at det ikke giver
mening at splitte det op og derfor arbejde med datametaerialet samlet
(sidsnævnte vil være at foretrække, da det gør det noget nemmere at arbejde
med materialet og vi slipper for en masse problemer med at nogle af rollerne
består af meget få respondenter).
Den metode, som vi senest har fået at vide at vi kan bruge, men det er vi så
også lidt usikre på pt, er at foretage en One-Way-ANOVA test af
besvarelserne opdelt efter roller og se for hvor mange af sprøgsmålenes
(faktorernes) vedkommende, der er signifikant forskel mellem grupperne. Det
var der for 3 spørgsmåls vedkommende og det vi så havde indtryk at at vi
kunne tolke det som var at når 3 ud af 62 spørgsmål afveg signifikant, så
svarede det netop til de 5% i et 95% konfidensinterval og dette skulle så
betyde at der ikke er signifikant forskel mellem rollerne. Denne løsning tog
vi for gode varer, nok især fordi det passede os fint at kunne afgøre at
besvarelserne ikke skulle opdeles i roller, men nu er vi i tvivl om hvorvidt
denne metoder er anvendelig og yderliger er det problematisk at ingen af os
er i standt til at forklare One-Way-Anova tilfredstillende gundet vores
manglende statistikkundskaber Sur

Faktorerne skal som nævnt ovenstående splittes op i forholdt til hvilken
rolle faktoren har betydning for et i SPI-projekt. Den opdeling af
faktorerne i forhold til roller, som vi selv umiddelbart finder mest logisk
vil vi om muligt gerne kunne understøtte med besvarelserne.

Yderligere skal det nævnes at ingen af os desværre har nævneværdig erfaring
med statistik, så de metoder, der anvendes skal helst være meget simple, så
vi også kan forklare deres virkemåde. Om vi skal kunne bevise dem er jeg
desværre ikke klar over, men jeg håber på at det er nok at vi kan forklare
dem.

Det skal også tilføjes at de metoder vi anvender helst skal være ret simple,
da ingen af os har nævneværdig erfaring med statistiske beregninger og da
dette ikke er en statistikopgave får vi heller ikke særlig meget kredit for
snørklede statistiske beregninger, men har vi dem med skal vi være
fuldstændig klar over deres virkemåde.
Det var oprindelig heller ikke planen at deciderede statistiske beregninger
skulle inddrages, men en så hård reducering ved hjælp af gennemsnit som
vejlederen foreslog kunne vi som sagt ikke forlige os med.

Undskyld at posten blev så lang.
Hvis visninger af datamaterialet vil hjælpe på forståelsen af mine måske
uklare formuleringer, så sig til, så lægger jeg nogle udskrifter op på min
server.
Mvh Kim Eichen

---
Outgoing mail is certified Virus Free.
Checked by AVG anti-virus system (http://www.grisoft.com).
Version: 6.0.772 / Virus Database: 519 - Release Date: 02-10-2004

Carsten Troelsgaard (17-10-2004)

Kommentar
Fra : Carsten Troelsgaard

Dato : 17-10-04 11:16

"Kim Eichen" <eichen@worldonline.dk> skrev i en meddelelse
news:BSgcd.58350$Vf.2771159@news000.worldonline.dk...
>
> "Martin Jørgensen" <unoder.spam@spam.jay.net> wrote in message
> news:417138bc$0$287$edfadb0f@dread12.news.tele.dk...
> > Carsten Troelsgaard wrote:
> >
> >> Jeg er bestemt ikke nogen statistik-haj, men jeg læste denne sci-square
> >> tutorial og er ret sikker
> >> på, at jeg kan gennemføre og tolke dine data ud fra fremgangsmåden der er
> >> beskrevet her:
> >>
> >> http://www.georgetown.edu/faculty/ballc/webtools/web_chi_tut.html
> > -snip-
> >
> > Ja, der findes vist et par tests der anvender chi^2. Jeg tror mere at
> > spørgeren ledte efter et program der kunne sammenholde alle 62 faktorer
> > mere eller mindre på én gang. En måde er selvfølgeligt vha. dit link at
> > opstille et Excel-ark og importere resultaterne... Der skal nok en del
> > arbejde til og man skal have statistisk overblik og forstå hvad man
> > laver...
>
> Ok, jeg prøver lige at ridse formålene og situationen op.
>
> Vi (jeg skriver sammen med en anden) har et spørgeskema med 62 spørgsmål
> vedrørende hvilke faktorer (ikke faktorer ud fra en statistisk definition),
> der bidrager til succes i SPI-projekter (software process improvement
> projekter). Respondenten skal have deltaget i et SPI-projekt og tage
> udgangspunkt for besvarelsen i dette projekt.På skemaet skal udfylde hvilket
> rolle (sponsor/ejer, projektleder, konsulent, bruger af SPI,
> projektmedarbejder, andet) respondenten har haft i det pågældente projekt.
> Jeg har fået besvarelser fra 100 respondenter.
>
> Fomålet er dels at afgøre hvilke faktorer, der bidrager mest til succes i et
> SPI-projekt og herunder at afgøre om respondentens rolle i projektet har
> betydning for besvarelsen.

Ah, det er her 5*5 matrixen kommer ind i billedet.
I kommer vel til at udføre forskellige tests alt efter hvilket specifikke problem i fokuserer på.

> Vi forestiller os at vi eventuelt kan eliminere nogle af faktorerne ved
> hjælp af en korrelationstest, så vi kan eliminere en af faktorerne i de sæt
> af faktorer, der har en korrelationsværdi på mindst ca. 0,7.

.... korrelation er sammenhæng, - forskel i sammenhæng fortæller, ikke overraskende, at grupperne er
forskellige. Men vil det være det rigtige grundlag at frasortere faktoren på?

> Vi vil også gerne kunne skære mindre relevante fraktorer fra

det mener du ikke som du skriver det? Men det er vel rygraden i jeres arbejde, at finde de faktorer
der påvirker et SPI-projekt mindst/mest favorabelt.

> og til dette
> formål foreslog vores vejleder (som går ind for meget enkle løsninger) at vi
> skulle vælge et gennemsnit og
> kun medtage de faktorer fra foreningsmængden af en liste med alle
> besvarelserne og de enkelte rollers (dvs. en gruppe bestående af alle med
> den pågældende rolle) besvarelser, der har en gennemsnitsværdi på mindst 4.

Vedkommende har da en pointe!

> Denne metode er vi dog ikke meget for, for hvis gennemsnittet eksempelvis er
> sat til 4, så virker det meget hårdt at skulle skære en faktor med en
> gennemsnitsværdi på 3,99, men medtage en faktor med en gennemsnitsværdi på
> 4,00, især i betragtning af at der er mange usikkerheder forbundet med
> besvarelserne.

Det er ikke et metode-problem, det er jeres personlige problem med at tage en konsekvens/sætte en
grænse.

> Derudover skal der skabes et overblik over et SPI-projekt i form af en
> grafisk model hvor de enkelte roller er anført med hvilke faktorer, der er
> relateret til den enkelte rolle og hvilke faktorer der er relationer mellem
> roller. De faktorer, der er angivet til den enkelte rolle vil vi også gerne
> vægte, så der oprettes et antal lister sorteret efter betydning.

Det lyder lidt indviklet, men kan vel pindes ud i enkle fremstillinger af de del-spørgsmål i
fokuserer på.

> Det der ønskes foretaget i forhold til datamaterialet er dels at afgøre om
> der er så stor forskel på de enkelte roller besvarelser at materialet skal
> deles op i roller eller om forskellen er så ubetydelig at det ikke giver
> mening at splitte det op og derfor arbejde med datametaerialet samlet
> (sidsnævnte vil være at foretrække, da det gør det noget nemmere at arbejde
> med materialet og vi slipper for en masse problemer med at nogle af rollerne
> består af meget få respondenter).

Det er måske uprofessionelt at sige, at i kan gennemføre beregningerne på trods af for få
respondenter, og understrege denne specifikke svaghed i analysen. Usikkerheden vil formodentlig kun
have gennemslagskraft i den pågældende gruppe.

> Den metode, som vi senest har fået at vide at vi kan bruge, men det er vi så
> også lidt usikre på pt, er at foretage en One-Way-ANOVA test af
> besvarelserne opdelt efter roller og se for hvor mange af sprøgsmålenes
> (faktorernes) vedkommende, der er signifikant forskel mellem grupperne. Det
> var der for 3 spørgsmåls vedkommende og det vi så havde indtryk at at vi
> kunne tolke det som var at når 3 ud af 62 spørgsmål afveg signifikant, så
> svarede det netop til de 5% i et 95% konfidensinterval og dette skulle så
> betyde at der ikke er signifikant forskel mellem rollerne.

Det lyder fornuftigt.

> Denne løsning tog
> vi for gode varer, nok især fordi det passede os fint at kunne afgøre at
> besvarelserne ikke skulle opdeles i roller, men nu er vi i tvivl om hvorvidt
> denne metoder er anvendelig og yderliger er det problematisk at ingen af os
> er i standt til at forklare One-Way-Anova tilfredstillende gundet vores
> manglende statistikkundskaber Sur

Det er også grunden til, at jeg ikke burde besvare din mail.
Hvis I laver grafiske fremstillinger kan i vurdere jeres numeriske rationale med det umiddelbare
indtryk.

Hvis i laver et gennemsnit (pr gruppe) for de forskellige faktorer og sammenligner, enten numerisk
eller visuelt, på tværs af grupperne, så kan i danne jer et indtryk af hvordan gruppernes
besvarelser ligger i forhold til hinanden. Hvis der er signifikant forskel mellem grupperne har i
vel reelt .. et 'politisk' problem.

> Faktorerne skal som nævnt ovenstående splittes op i forholdt til hvilken
> rolle faktoren har betydning for et i SPI-projekt.

Det er da væsentligt, men det har du ikke nævnt før - rolle? mener du hvordan faktoreren scorer?

> Den opdeling af
> faktorerne i forhold til roller, som vi selv umiddelbart finder mest logisk
> vil vi om muligt gerne kunne understøtte med besvarelserne.

Det virker nogle gange som om du blander 'logisk', tilfredsheds-score, og betydning sammen - eller
også har du undladt at fortælle at faktorernes betydning er vægtet forskelligt.

> Yderligere skal det nævnes at ingen af os desværre har nævneværdig erfaring
> med statistik, så de metoder, der anvendes skal helst være meget simple, så
> vi også kan forklare deres virkemåde. Om vi skal kunne bevise dem er jeg
> desværre ikke klar over, men jeg håber på at det er nok at vi kan forklare
> dem.

Tja, det er jo jeres livs chance for at benytte hardcore statistik i en 'real life' situation.

> Det skal også tilføjes at de metoder vi anvender helst skal være ret simple,
> da ingen af os har nævneværdig erfaring med statistiske beregninger og da
> dette ikke er en statistikopgave får vi heller ikke særlig meget kredit for
> snørklede statistiske beregninger, men har vi dem med skal vi være
> fuldstændig klar over deres virkemåde.
> Det var oprindelig heller ikke planen at deciderede statistiske beregninger
> skulle inddrages, men en så hård reducering ved hjælp af gennemsnit som
> vejlederen foreslog kunne vi som sagt ikke forlige os med.

Overvej om nu ikke 'hård' er jeres personlige problem. I kan have grunde til at skelne mellem,
hvilken indflydelse de forskellige gruppe-resultater skal have på de beslutninger i skal drage, men
det kan i 'vægte' jer ud af, hvis i gerne vil have tal på.

> Undskyld at posten blev så lang.
> Hvis visninger af datamaterialet vil hjælpe på forståelsen af mine måske
> uklare formuleringer, så sig til, så lægger jeg nogle udskrifter op på min
> server.

og husk lige - jeg er ikke nogen statistik-haj.

Carsten

Kim Eichen (17-10-2004)

Kommentar
Fra : Kim Eichen

Dato : 17-10-04 14:10

>> Den metode, som vi senest har fået at vide at vi kan bruge, men det er vi så
>> også lidt usikre på pt, er at foretage en One-Way-ANOVA test af
>> besvarelserne opdelt efter roller og se for hvor mange af sprøgsmålenes
>> (faktorernes) vedkommende, der er signifikant forskel mellem grupperne. Det
>> var der for 3 spørgsmåls vedkommende og det vi så havde indtryk at at vi
>> kunne tolke det som var at når 3 ud af 62 spørgsmål afveg signifikant, så
>> svarede det netop til de 5% i et 95% konfidensinterval og dette skulle så
>> betyde at der ikke er signifikant forskel mellem rollerne.
>
> Det lyder fornuftigt.

I forbindelse med ANOVA testen (variansanalysen) er jeg stødt ind i et problem.
Såvidt jeg har kunnet læse mig frem til er forudsætningerne for en
variansanalyse følgende:
- variablen der testes på (den afhængige) skal være metrisk,dvs. som minimum
intervalskaleret
- variansen i grupperne skal være ens, gør dog ikke så meget,hvis der er omtrent
lige mange observationer i hver gruppe

Det første krav mener jeg er opfyldt.
Det andet krav er mere problematisk fordi gruppernes fordeling er temmelig skæv:
sponsor/ejer : 9
projektleder: 31
konsulent: 9
bruger af SPI: 5
projektmedarbejder: 12
andet: 34

Det bekymrer os især at så stor en andel af respondenterne er projektledere og
at der desværre er så mange respondenter i rollen andet. Rollen andet dækker
primært over at respondenten har haft flere forskellige roller i projekter og
derved ikke har kunnet passe ind i en af de definerede roller.

Jeg ikke helt gennemskue hvordan jeg skal afgøre om variansen i grupperne er
ens. Når jeg i SPSS gennemfører en variansanalyse (ANOVA) kan jeg også få
foretaget en test af homogeniteten af varianser. Præcist hvordan denne skal
bruges er jeg dog lidt i tvivl om og er heller ikke begejstret for at skulle
kunne forklare atter en statistisk model, men denne model har til hvert
spørgsmål 4 felter:
Levene Statistic
df1
df2
Sig
Frihedsgraderne df1(antal svarmuligheder) og df2(antal respondenter, der har
besvaret spørgsmålet) er nemme at forklare, men Levene Statistic er jeg ret
blank overfor og tolkningen af Sig i denne test er jeg også usikker på.
Er det tilfældigvis så simpelt, så hvis Sig er inden for et eller andet interval
kan man konkludere at variansen i grupperne er ens?
Om variansen i grupperne er ens gør så ikke så meget hvis der er omtrent lige
mange observationer i hver gruppe, men det er jævnfør ovenstående absolut ikke
tilfældet.

Igen opsummeret:
Data:
62 spørgsmål
100 respondenter
6 roller

Formål (for denne del):
At afgøre om der er så signifikant forskel mellem rollerne at datamaterialet
skal opdeles i roller.

Carsten Troelsgaard (18-10-2004)

Kommentar
Fra : Carsten Troelsgaard

Dato : 18-10-04 12:59

"Kim Eichen" <eichen@tiscali.dk> skrev i en meddelelse
news:41726f21$0$77009$14726298@news.sunsite.dk...
> >> Den metode, som vi senest har fået at vide at vi kan bruge, men det er vi så
> >> også lidt usikre på pt, er at foretage en One-Way-ANOVA test af
> >> besvarelserne opdelt efter roller og se for hvor mange af sprøgsmålenes
> >> (faktorernes) vedkommende, der er signifikant forskel mellem grupperne. Det
> >> var der for 3 spørgsmåls vedkommende og det vi så havde indtryk at at vi
> >> kunne tolke det som var at når 3 ud af 62 spørgsmål afveg signifikant, så
> >> svarede det netop til de 5% i et 95% konfidensinterval og dette skulle så
> >> betyde at der ikke er signifikant forskel mellem rollerne.
> >
> > Det lyder fornuftigt.
>
> I forbindelse med ANOVA testen (variansanalysen) er jeg stødt ind i et problem.
> Såvidt jeg har kunnet læse mig frem til er forudsætningerne for en
> variansanalyse følgende:
> - variablen der testes på (den afhængige) skal være metrisk,dvs. som minimum
> intervalskaleret
> - variansen i grupperne skal være ens, gør dog ikke så meget,hvis der er omtrent
> lige mange observationer i hver gruppe
>
> Det første krav mener jeg er opfyldt.
> Det andet krav er mere problematisk fordi gruppernes fordeling er temmelig skæv:
> sponsor/ejer : 9
> projektleder: 31
> konsulent: 9
> bruger af SPI: 5
> projektmedarbejder: 12
> andet: 34
>
> Det bekymrer os især at så stor en andel af respondenterne er projektledere og
> at der desværre er så mange respondenter i rollen andet. Rollen andet dækker
> primært over at respondenten har haft flere forskellige roller i projekter og
> derved ikke har kunnet passe ind i en af de definerede roller.
>
> Jeg ikke helt gennemskue hvordan jeg skal afgøre om variansen i grupperne er
> ens.

Varians = 1/n*sum(værdi - gennemsnit)^2
Du tager besvarelserne gruppevis og finder deres gennemsnit

Jeg tror ikke at du kan arbejde med faktorerne under e´n hat, gruppevis... eller giver det mening at
gøre det ud over det du allerede kan se af det gruppevise gennemsnit for den enkelte faktor?

Problemet er at den gruppevis spredning på tværs af faktorerne kan have væsentlig forskellig
betydning og ikke giver mening sammenlignet på tværs. Jeg mener, i tillægger de forskellige faktorer
jeres egen vægt, eller hvad? (nu er der fare for at blande begreberne 'betydning' sammen, for det er
jo også det i prøver at måle).

Dette link giver et indtryk af, at ANOVA bruger for en kontinuert række 'faktorer', her
bladstørrelsen som har et meningsfuldt gennemsnit for et træ (gruppe)
http://www.physics.csbsju.edu/stats/anova.html

Jeg kan ikke vurdere om MANOVA er mere korrekt at bruge - det er et skridt imod en større
kompleksitet, og jeg vil ikke sætte mig ind i det, med mindre i bestemmer jer for at gå den vej.

> Når jeg i SPSS gennemfører en variansanalyse (ANOVA) kan jeg også få
> foretaget en test af homogeniteten af varianser. Præcist hvordan denne skal
> bruges er jeg dog lidt i tvivl om og er heller ikke begejstret for at skulle
> kunne forklare atter en statistisk model, men denne model har til hvert
> spørgsmål 4 felter:
> Levene Statistic
> df1
> df2
> Sig
> Frihedsgraderne df1(antal svarmuligheder) og df2(antal respondenter, der har
> besvaret spørgsmålet) er nemme at forklare, men Levene Statistic er jeg ret
> blank overfor og tolkningen af Sig i denne test er jeg også usikker på.

sig = signifikans

> Er det tilfældigvis så simpelt, så hvis Sig er inden for et eller andet interval
> kan man konkludere at variansen i grupperne er ens?

Det lyder rimeligt

> Om variansen i grupperne er ens gør så ikke så meget hvis der er omtrent lige
> mange observationer i hver gruppe, men det er jævnfør ovenstående absolut ikke
> tilfældet.

Ifølge

http://davidmlane.com/hyperstat/intro_ANOVA.html

ser det ud til at ANOVA tester for spredning omkring identiske middelværdier. Hvis det er tilfældet
at middelværdierne er ens hos jer, kan grupperne måske skelnes mellem spredningen af resultaterne -
selv om sådan en oplysning (spredningen), som jeg ser det, ikke kan bruges til noget. I en lille
sample er spredningen vel større, sådan relativt. Er der grund til at spredning som sådan skal
koncentreres gruppevist?

Carsten

Carsten Troelsgaard (18-10-2004)

Kommentar
Fra : Carsten Troelsgaard

Dato : 18-10-04 20:26

"Kim Eichen" <eichen@tiscali.dk> skrev i en meddelelse
news:41726f21$0$77009$14726298@news.sunsite.dk...

snip

Jeg ved ikke hvor god adgang du har til information, men dette link er ret omfattende på et rimelig
niveau:

http://www.statsoft.com/textbook/stanman.html#basic

Carsten

Kim Eichen (18-10-2004)

Kommentar
Fra : Kim Eichen

Dato : 18-10-04 20:55

"Carsten Troelsgaard" <carsten.troelsgaard@mail.dk> skrev i en meddelelse
news:417418a7$0$244$edfadb0f@dread12.news.tele.dk...
|
| "Kim Eichen" <eichen@tiscali.dk> skrev i en meddelelse
| news:41726f21$0$77009$14726298@news.sunsite.dk...
|
| snip
|
| Jeg ved ikke hvor god adgang du har til information, men dette link er ret
omfattende på et rimelig
| niveau:
|
| http://www.statsoft.com/textbook/stanman.html#basic

Tak, det ser faktisk rigtig fornuftigt ud.

Mvh Kim

Kim Eichen (17-10-2004)

Kommentar
Fra : Kim Eichen

Dato : 17-10-04 17:04

"Carsten Troelsgaard" <carsten.troelsgaard@mail.dk> skrev i en meddelelse
news:41724657$0$171$edfadb0f@dread11.news.tele.dk...
|
| "Kim Eichen" <eichen@worldonline.dk> skrev i en meddelelse
| news:BSgcd.58350$Vf.2771159@news000.worldonline.dk...
| >
| > "Martin Jørgensen" <unoder.spam@spam.jay.net> wrote in message
| > news:417138bc$0$287$edfadb0f@dread12.news.tele.dk...
| > > Carsten Troelsgaard wrote:
| > >
| > >> Jeg er bestemt ikke nogen statistik-haj, men jeg læste denne sci-square
| > >> tutorial og er ret sikker
| > >> på, at jeg kan gennemføre og tolke dine data ud fra fremgangsmåden der er
| > >> beskrevet her:
| > >>
| > >> http://www.georgetown.edu/faculty/ballc/webtools/web_chi_tut.html
| > > -snip-
| > >
| > > Ja, der findes vist et par tests der anvender chi^2. Jeg tror mere at
| > > spørgeren ledte efter et program der kunne sammenholde alle 62 faktorer
| > > mere eller mindre på én gang. En måde er selvfølgeligt vha. dit link at
| > > opstille et Excel-ark og importere resultaterne... Der skal nok en del
| > > arbejde til og man skal have statistisk overblik og forstå hvad man
| > > laver...
| >
| > Ok, jeg prøver lige at ridse formålene og situationen op.
| >
| > Vi (jeg skriver sammen med en anden) har et spørgeskema med 62 spørgsmål
| > vedrørende hvilke faktorer (ikke faktorer ud fra en statistisk definition),
| > der bidrager til succes i SPI-projekter (software process improvement
| > projekter). Respondenten skal have deltaget i et SPI-projekt og tage
| > udgangspunkt for besvarelsen i dette projekt.På skemaet skal udfylde hvilket
| > rolle (sponsor/ejer, projektleder, konsulent, bruger af SPI,
| > projektmedarbejder, andet) respondenten har haft i det pågældente projekt.
| > Jeg har fået besvarelser fra 100 respondenter.
| >
| > Fomålet er dels at afgøre hvilke faktorer, der bidrager mest til succes i et
| > SPI-projekt og herunder at afgøre om respondentens rolle i projektet har
| > betydning for besvarelsen.
|
| Ah, det er her 5*5 matrixen kommer ind i billedet.
| I kommer vel til at udføre forskellige tests alt efter hvilket specifikke
problem i fokuserer på.

Ja, men samtidig skal den statistiske del helst ikke være mere omfattende end
højst nødvendig, så så få og simple tests som muligt vil være at foretrække.
Igen det er ikke en statistikopgave, så det er begrænset hvor mange points vi
scorer på snørklede statistiske beregninger.
|
| > Vi forestiller os at vi eventuelt kan eliminere nogle af faktorerne ved
| > hjælp af en korrelationstest, så vi kan eliminere en af faktorerne i de sæt
| > af faktorer, der har en korrelationsværdi på mindst ca. 0,7.
|
| ... korrelation er sammenhæng, - forskel i sammenhæng fortæller, ikke
overraskende, at grupperne er
| forskellige. Men vil det være det rigtige grundlag at frasortere faktoren på?

Det var nu ikke helt det jeg mente. Det jeg mente var at hvis der er en stor
korrelationsgrad mellem to spørgsmål vil den ene af dem være overflødig i det
der er så tæt sammenhæng mellem dem at de betyder det det samme, eller i hvert
fald hvis man kender svaret til det ene spørgsmål, så kender man også svaret på
det andet spørgsmål. Derved kan man så undlade det ene af spørgsmålene (kan man
evt. om muligt omformulere spørgsmålet, så det dækker begge spørgsmål?). Der er
for mig at se betydelig forskel på om et spørgsmål udgår fordi et andet
spørgsmål dækker over det samme eller om spørgsmålet bliver sorteret fra ved
hjælp af en eller anden form for gennemsnit eller ligende.

Der er i vores tilfælde to formål med korrelationstesten
Det ene formål er at afgøre om der er nogen af spørgsmålene, der i virkeligheden
dækker over det samme hvormed et af spørgsmålene kan udelades fordi betydningen
bliver dækket af det andet spørgsmål.
Det andet formål bygger på en ide om at hvis der er en relativt høj grad af
korrelation mellem spørgsmålene i grupperne kunne det understøtte den fordeling
af spørgmålene i grupper som vi har foretaget ud fra hvad vi rent subjektivt
syntes gav bedst mening.
Jeg tror nu nok ikke så meget på denne metode, har i et bedre forslag til
hvordan man argumenterer for at spørgsmålene netop er fordelt mellem rollerne
som de er?

Jeg har lagt en model der viser rollerne her
www.ssc.ruc.dk/test/kim/konceptmodel.pdf
Bemærk rollerne er ikke helt de samme, som der opereres med i spørgeskemaet, men
det er ikke en fejl.

| > Vi vil også gerne kunne skære mindre relevante fraktorer fra
|
| det mener du ikke som du skriver det? Men det er vel rygraden i jeres arbejde,
at finde de faktorer
| der påvirker et SPI-projekt mindst/mest favorabelt.

Opgaven er at finde de faktorer, der påvirker SPI-projektet mest. Vi har masser
af faktorer, der ikke påvirker SPI-projektet i væsentlig grad. Vi har på et
tidspunkt været oppe på over 120 potentielle faktorer.

|
| > og til dette
| > formål foreslog vores vejleder (som går ind for meget enkle løsninger) at vi
| > skulle vælge et gennemsnit og
| > kun medtage de faktorer fra foreningsmængden af en liste med alle
| > besvarelserne og de enkelte rollers (dvs. en gruppe bestående af alle med
| > den pågældende rolle) besvarelser, der har en gennemsnitsværdi på mindst 4.
|
| Vedkommende har da en pointe!
|
| > Denne metode er vi dog ikke meget for, for hvis gennemsnittet eksempelvis er
| > sat til 4, så virker det meget hårdt at skulle skære en faktor med en
| > gennemsnitsværdi på 3,99, men medtage en faktor med en gennemsnitsværdi på
| > 4,00, især i betragtning af at der er mange usikkerheder forbundet med
| > besvarelserne.
|
| Det er ikke et metode-problem, det er jeres personlige problem med at tage en
konsekvens/sætte en
| grænse.

Det er rigtigt og hvis en sådan grænse betød at at antallet af faktorer blev
reduceret fra 62 til måske 15 virkelig væsentlige faktorer, så ville vi måske
overveje det nøjere, men netop grænsen på 4 er meget naturlig fordi 4 står for
stor betydning, så på den måde kan man sige at gennemsnittet skal være mindst
"stor betydning". Den næste hele grænse er 5 og det ville betyde at alle
faktorer blev elimineret.

| > Derudover skal der skabes et overblik over et SPI-projekt i form af en
| > grafisk model hvor de enkelte roller er anført med hvilke faktorer, der er
| > relateret til den enkelte rolle og hvilke faktorer der er relationer mellem
| > roller. De faktorer, der er angivet til den enkelte rolle vil vi også gerne
| > vægte, så der oprettes et antal lister sorteret efter betydning.
|
| Det lyder lidt indviklet, men kan vel pindes ud i enkle fremstillinger af de
del-spørgsmål i
| fokuserer på.

Jeg har lagt en model der viser rollerne her
www.ssc.ruc.dk/test/kim/konceptmodel.pdf
De lister der er til hver enkelt rolle vil vi også gerne sortere efter
betydning, måske det bare skal være efter gennemsnit?

|
| > Det der ønskes foretaget i forhold til datamaterialet er dels at afgøre om
| > der er så stor forskel på de enkelte roller besvarelser at materialet skal
| > deles op i roller eller om forskellen er så ubetydelig at det ikke giver
| > mening at splitte det op og derfor arbejde med datametaerialet samlet
| > (sidsnævnte vil være at foretrække, da det gør det noget nemmere at arbejde
| > med materialet og vi slipper for en masse problemer med at nogle af rollerne
| > består af meget få respondenter).
|
| Det er måske uprofessionelt at sige, at i kan gennemføre beregningerne på
trods af for få
| respondenter, og understrege denne specifikke svaghed i analysen. Usikkerheden
vil formodentlig kun
| have gennemslagskraft i den pågældende gruppe.

Jeg er ikke helt med.
Vi har ikke som sådan for få respondenter, men fordelingen af respondenter er
desværre temmelig skæv og det har vi desværre ikke haft mulighed for at ændre
på.
Hvis vi havde valgt ikke at beskæftige os med de forskellige rollers betydning,
men havde holdt os til at vurderer hvilke faktorer, der har størst betydning i
et SPI-projekt uden skelen til roller ville det ikke have været et problem.

|
| > Den metode, som vi senest har fået at vide at vi kan bruge, men det er vi så
| > også lidt usikre på pt, er at foretage en One-Way-ANOVA test af
| > besvarelserne opdelt efter roller og se for hvor mange af sprøgsmålenes
| > (faktorernes) vedkommende, der er signifikant forskel mellem grupperne. Det
| > var der for 3 spørgsmåls vedkommende og det vi så havde indtryk at at vi
| > kunne tolke det som var at når 3 ud af 62 spørgsmål afveg signifikant, så
| > svarede det netop til de 5% i et 95% konfidensinterval og dette skulle så
| > betyde at der ikke er signifikant forskel mellem rollerne.
|
| Det lyder fornuftigt.

Det er jeg glad for at høre, da det er meget betydningsfuldt for os om netop
denne metode er holdbar i vores situation.
|
| > Denne løsning tog
| > vi for gode varer, nok især fordi det passede os fint at kunne afgøre at
| > besvarelserne ikke skulle opdeles i roller, men nu er vi i tvivl om hvorvidt
| > denne metoder er anvendelig og yderliger er det problematisk at ingen af os
| > er i standt til at forklare One-Way-Anova tilfredstillende gundet vores
| > manglende statistikkundskaber Sur

|
| Det er også grunden til, at jeg ikke burde besvare din mail.

Jeg er nu glad for at du gør det Glad

| Hvis I laver grafiske fremstillinger kan i vurdere jeres numeriske rationale
med det umiddelbare
| indtryk.

Ja, problemet er dog at en grafisk fremstilling bliver meget uoverskuelig hvis
den skal indeholde alle spørgsmål.
Vi har prøvet, men det er svært på den baggrund at se mønstre i materialet.

|
| Hvis i laver et gennemsnit (pr gruppe) for de forskellige faktorer og
sammenligner, enten numerisk
| eller visuelt, på tværs af grupperne, så kan i danne jer et indtryk af hvordan
gruppernes
| besvarelser ligger i forhold til hinanden. Hvis der er signifikant forskel
mellem grupperne har i
| vel reelt .. et 'politisk' problem.

Det vi jævnfør ovenstående gjort, men det var ingen umiddelbare mønstre at
spore.

| > Faktorerne skal som nævnt ovenstående splittes op i forholdt til hvilken
| > rolle faktoren har betydning for et i SPI-projekt.
|
| Det er da væsentligt, men det har du ikke nævnt før - rolle? mener du hvordan
faktoreren scorer?

Med rolle mener jeg de roller der vises i denne model
www.ssc.ruc.dk/test/kim/konceptmodel.pdf

|
| > Den opdeling af
| > faktorerne i forhold til roller, som vi selv umiddelbart finder mest logisk
| > vil vi om muligt gerne kunne understøtte med besvarelserne.
|
| Det virker nogle gange som om du blander 'logisk', tilfredsheds-score, og
betydning sammen - eller
| også har du undladt at fortælle at faktorernes betydning er vægtet
forskelligt.

Jeg er ikke helt med, hvordan mener jeg at faktorernes betydning er vægtet
forskelligt?

| > Yderligere skal det nævnes at ingen af os desværre har nævneværdig erfaring
| > med statistik, så de metoder, der anvendes skal helst være meget simple, så
| > vi også kan forklare deres virkemåde. Om vi skal kunne bevise dem er jeg
| > desværre ikke klar over, men jeg håber på at det er nok at vi kan forklare
| > dem.
|
| Tja, det er jo jeres livs chance for at benytte hardcore statistik i en 'real
life' situation.

Ja, men som sagt, da det ikke er en statistikopgave er det begrænset hvor mange
point vi scorer på snørklede matematiske udregninger og vi kan nemt komme ud
hvor vi ikke kan bunde hvis vi ikke passer på.

| > Det skal også tilføjes at de metoder vi anvender helst skal være ret simple,
| > da ingen af os har nævneværdig erfaring med statistiske beregninger og da
| > dette ikke er en statistikopgave får vi heller ikke særlig meget kredit for
| > snørklede statistiske beregninger, men har vi dem med skal vi være
| > fuldstændig klar over deres virkemåde.
| > Det var oprindelig heller ikke planen at deciderede statistiske beregninger
| > skulle inddrages, men en så hård reducering ved hjælp af gennemsnit som
| > vejlederen foreslog kunne vi som sagt ikke forlige os med.
|
| Overvej om nu ikke 'hård' er jeres personlige problem. I kan have grunde til
at skelne mellem,
| hvilken indflydelse de forskellige gruppe-resultater skal have på de
beslutninger i skal drage, men
| det kan i 'vægte' jer ud af, hvis i gerne vil have tal på.

Vægte hvordan?

| > Undskyld at posten blev så lang.
| > Hvis visninger af datamaterialet vil hjælpe på forståelsen af mine måske
| > uklare formuleringer, så sig til, så lægger jeg nogle udskrifter op på min
| > server.
|
| og husk lige - jeg er ikke nogen statistik-haj.

Jeg er nu alligevel meget glad for dine konstruktive kommentarer Glad

Mvh Kim

Kim Eichen (19-10-2004)

Kommentar
Fra : Kim Eichen

Dato : 19-10-04 10:59

| Vi (jeg skriver sammen med en anden) har et spørgeskema med 62 spørgsmål
| vedrørende hvilke faktorer (ikke faktorer ud fra en statistisk definition),
| der bidrager til succes i SPI-projekter (software process improvement
| projekter). Respondenten skal have deltaget i et SPI-projekt og tage
| udgangspunkt for besvarelsen i dette projekt.På skemaet skal udfylde hvilket
| rolle (sponsor/ejer, projektleder, konsulent, bruger af SPI,
| projektmedarbejder, andet) respondenten har haft i det pågældente projekt.
| Jeg har fået besvarelser fra 100 respondenter.
|
| Fomålet er dels at afgøre hvilke faktorer, der bidrager mest til succes i et
| SPI-projekt og herunder at afgøre om respondentens rolle i projektet har
| betydning for besvarelsen.
| Vi forestiller os at vi eventuelt kan eliminere nogle af faktorerne ved
| hjælp af en korrelationstest, så vi kan eliminere en af faktorerne i de sæt
| af faktorer, der har en korrelationsværdi på mindst ca. 0,7.
| Vi vil også gerne kunne skære mindre relevante fraktorer fra og til dette
| formål foreslog vores vejleder (som går ind for meget enkle løsninger) at vi
| skulle vælge et gennemsnit og
| kun medtage de faktorer fra foreningsmængden af en liste med alle
| besvarelserne og de enkelte rollers (dvs. en gruppe bestående af alle med
| den pågældende rolle) besvarelser, der har en gennemsnitsværdi på mindst 4.
| Denne metode er vi dog ikke meget for, for hvis gennemsnittet eksempelvis er
| sat til 4, så virker det meget hårdt at skulle skære en faktor med en
| gennemsnitsværdi på 3,99, men medtage en faktor med en gennemsnitsværdi på
| 4,00, især i betragtning af at der er mange usikkerheder forbundet med
| besvarelserne.
|
| Derudover skal der skabes et overblik over et SPI-projekt i form af en
| grafisk model hvor de enkelte roller er anført med hvilke faktorer, der er
| relateret til den enkelte rolle og hvilke faktorer der er relationer mellem
| roller. De faktorer, der er angivet til den enkelte rolle vil vi også gerne
| vægte, så der oprettes et antal lister sorteret efter betydning.
|
| Det der ønskes foretaget i forhold til datamaterialet er dels at afgøre om
| der er så stor forskel på de enkelte roller besvarelser at materialet skal
| deles op i roller eller om forskellen er så ubetydelig at det ikke giver
| mening at splitte det op og derfor arbejde med datametaerialet samlet
| (sidsnævnte vil være at foretrække, da det gør det noget nemmere at arbejde
| med materialet og vi slipper for en masse problemer med at nogle af rollerne
| består af meget få respondenter).
| Den metode, som vi senest har fået at vide at vi kan bruge, men det er vi så
| også lidt usikre på pt, er at foretage en One-Way-ANOVA test af
| besvarelserne opdelt efter roller og se for hvor mange af sprøgsmålenes
| (faktorernes) vedkommende, der er signifikant forskel mellem grupperne. Det
| var der for 3 spørgsmåls vedkommende og det vi så havde indtryk at at vi
| kunne tolke det som var at når 3 ud af 62 spørgsmål afveg signifikant, så
| svarede det netop til de 5% i et 95% konfidensinterval og dette skulle så
| betyde at der ikke er signifikant forskel mellem rollerne. Denne løsning tog
| vi for gode varer, nok især fordi det passede os fint at kunne afgøre at
| besvarelserne ikke skulle opdeles i roller, men nu er vi i tvivl om hvorvidt
| denne metoder er anvendelig og yderliger er det problematisk at ingen af os
| er i standt til at forklare One-Way-Anova tilfredstillende gundet vores
| manglende statistikkundskaber Sur

|
| Faktorerne skal som nævnt ovenstående splittes op i forholdt til hvilken
| rolle faktoren har betydning for et i SPI-projekt. Den opdeling af
| faktorerne i forhold til roller, som vi selv umiddelbart finder mest logisk
| vil vi om muligt gerne kunne understøtte med besvarelserne.

Nu er jeg stødt på (endnu) et problem. variansanalysen, som viste at der var 3
ud af 62
faktoer, der afveg signifikant er blevet foretaget på et ikke helt korrekt
grundlag.
Der indgik som tidligere nævnt 6 roller, men den ene af disse roller en en
sammensat rolle (andet) og bør derfor ikke indgå i testen af om der er forskelle
mellem rollernes gennemsnit.
Når jeg gentager testen uden denne rolle øges antallet af spørgsmål hvor der er
signifikant afvigelse fra 3 til 8 dvs. fra 5% til 13%. Nu er jeg så i tvivl om
hvordan jeg skal tolket dette resultat, for der er 13% af spørgsmåle, der
angiver at der er signifikant forskel mellem rollerne, men er dette nok. Hvilke
tommefingerregler gælder for tolkning af dette.

Samtidig er der 9 ud af de 62 spørgsmål hvor homogenitetetstesten angiver at der
er signifikant forskel. Hvordan tolkes dette og hvad betyder det for
anvendeligheden af data i forhold til variansanalysen?

Mvh Kim

Carsten Troelsgaard (19-10-2004)

Kommentar
Fra : Carsten Troelsgaard

Dato : 19-10-04 15:03

"Kim Eichen" <eichen@tiscali.dk> skrev i en meddelelse
news:4174e558$0$77014$14726298@news.sunsite.dk...
> | Vi (jeg skriver sammen med en anden) har et spørgeskema med 62 spørgsmål
> | vedrørende hvilke faktorer (ikke faktorer ud fra en statistisk definition),
> | der bidrager til succes i SPI-projekter (software process improvement
> | projekter). Respondenten skal have deltaget i et SPI-projekt og tage
> | udgangspunkt for besvarelsen i dette projekt.På skemaet skal udfylde hvilket
> | rolle (sponsor/ejer, projektleder, konsulent, bruger af SPI,
> | projektmedarbejder, andet) respondenten har haft i det pågældente projekt.
> | Jeg har fået besvarelser fra 100 respondenter.
> |
> | Fomålet er dels at afgøre hvilke faktorer, der bidrager mest til succes i et
> | SPI-projekt og herunder at afgøre om respondentens rolle i projektet har
> | betydning for besvarelsen.
> | Vi forestiller os at vi eventuelt kan eliminere nogle af faktorerne ved
> | hjælp af en korrelationstest, så vi kan eliminere en af faktorerne i de sæt
> | af faktorer, der har en korrelationsværdi på mindst ca. 0,7.
> | Vi vil også gerne kunne skære mindre relevante fraktorer fra og til dette
> | formål foreslog vores vejleder (som går ind for meget enkle løsninger) at vi
> | skulle vælge et gennemsnit og
> | kun medtage de faktorer fra foreningsmængden af en liste med alle
> | besvarelserne og de enkelte rollers (dvs. en gruppe bestående af alle med
> | den pågældende rolle) besvarelser, der har en gennemsnitsværdi på mindst 4.
> | Denne metode er vi dog ikke meget for, for hvis gennemsnittet eksempelvis er
> | sat til 4, så virker det meget hårdt at skulle skære en faktor med en
> | gennemsnitsværdi på 3,99, men medtage en faktor med en gennemsnitsværdi på
> | 4,00, især i betragtning af at der er mange usikkerheder forbundet med
> | besvarelserne.
> |
> | Derudover skal der skabes et overblik over et SPI-projekt i form af en
> | grafisk model hvor de enkelte roller er anført med hvilke faktorer, der er
> | relateret til den enkelte rolle og hvilke faktorer der er relationer mellem
> | roller. De faktorer, der er angivet til den enkelte rolle vil vi også gerne
> | vægte, så der oprettes et antal lister sorteret efter betydning.
> |
> | Det der ønskes foretaget i forhold til datamaterialet er dels at afgøre om
> | der er så stor forskel på de enkelte roller besvarelser at materialet skal
> | deles op i roller eller om forskellen er så ubetydelig at det ikke giver
> | mening at splitte det op og derfor arbejde med datametaerialet samlet
> | (sidsnævnte vil være at foretrække, da det gør det noget nemmere at arbejde
> | med materialet og vi slipper for en masse problemer med at nogle af rollerne
> | består af meget få respondenter).
> | Den metode, som vi senest har fået at vide at vi kan bruge, men det er vi så
> | også lidt usikre på pt, er at foretage en One-Way-ANOVA test af
> | besvarelserne opdelt efter roller og se for hvor mange af sprøgsmålenes
> | (faktorernes) vedkommende, der er signifikant forskel mellem grupperne. Det
> | var der for 3 spørgsmåls vedkommende og det vi så havde indtryk at at vi
> | kunne tolke det som var at når 3 ud af 62 spørgsmål afveg signifikant, så
> | svarede det netop til de 5% i et 95% konfidensinterval og dette skulle så
> | betyde at der ikke er signifikant forskel mellem rollerne. Denne løsning tog
> | vi for gode varer, nok især fordi det passede os fint at kunne afgøre at
> | besvarelserne ikke skulle opdeles i roller, men nu er vi i tvivl om hvorvidt
> | denne metoder er anvendelig og yderliger er det problematisk at ingen af os
> | er i standt til at forklare One-Way-Anova tilfredstillende gundet vores
> | manglende statistikkundskaber Sur

> |
> | Faktorerne skal som nævnt ovenstående splittes op i forholdt til hvilken
> | rolle faktoren har betydning for et i SPI-projekt. Den opdeling af
> | faktorerne i forhold til roller, som vi selv umiddelbart finder mest logisk
> | vil vi om muligt gerne kunne understøtte med besvarelserne.
>
> Nu er jeg stødt på (endnu) et problem. variansanalysen, som viste at der var 3
> ud af 62
> faktoer, der afveg signifikant er blevet foretaget på et ikke helt korrekt
> grundlag.
> Der indgik som tidligere nævnt 6 roller, men den ene af disse roller en en
> sammensat rolle (andet) og bør derfor ikke indgå i testen af om der er forskelle
> mellem rollernes gennemsnit.
> Når jeg gentager testen uden denne rolle øges antallet af spørgsmål hvor der er
> signifikant afvigelse fra 3 til 8 dvs. fra 5% til 13%. Nu er jeg så i tvivl om
> hvordan jeg skal tolket dette resultat, for der er 13% af spørgsmåle, der
> angiver at der er signifikant forskel mellem rollerne, men er dette nok. Hvilke
> tommefingerregler gælder for tolkning af dette.

Er det ikke et resultat i sig selv?
Kan du lokalisere de pågældende spørgsmål? se næste
Hvis i kan, kan i fokusere på dem og ræsonere ud fra spørgsmålene, hvad forskellene mellem grupperne
er.
I kan også vælge at tage de pågældende spørgsmål ud og sådan få en rationale for at gennemføre en
samlet analyse af hele datamaterialet på de resterende spørgsmål.
Hvis jeres undersøgelse skal have konsekvenser kan det være, at resultatet giver jer en pegepind til
de isolerede spørgsmål i en fremtidig undersøgelse, som er specielt interesante at få afklaret.

> Samtidig er der 9 ud af de 62 spørgsmål hvor homogenitetetstesten angiver at der
> er signifikant forskel.

http://www.softflow.com/sf_www/fcb/KS_Chi.htm

fordelingen af scoren er måske ikke tilnærmelsesvist normalfordelt (var det ikke en forudsætning?)
Ifølge 'gruppetesten' er der visse spørgsmål som afspejler gruppe-tilhørsforhold - er det ikke
muligt at det er det der kommer til udtryk i, hvordan besvarelserne er fordelte (forskellig
histogram/ikke normalfordelt) i de spørgsmål hvor homogenitetstesten viser afvigelse? Hvis du kan
lokalisere de spørgsmål hvor der er afvigelse, så kryds-chek dem med spørgsmålene ovenfor.

Carsten

> Hvordan tolkes dette og hvad betyder det for
> anvendeligheden af data i forhold til variansanalysen?
>
> Mvh Kim
>
>

Kim Eichen (19-10-2004)

Kommentar
Fra : Kim Eichen

Dato : 19-10-04 20:45

"Kim Eichen" <eichen@tiscali.dk> skrev i en meddelelse
news:4174e558$0$77014$14726298@news.sunsite.dk...
|| Vi (jeg skriver sammen med en anden) har et spørgeskema med 62 spørgsmål
|| vedrørende hvilke faktorer (ikke faktorer ud fra en statistisk definition),
|| der bidrager til succes i SPI-projekter (software process improvement
|| projekter). Respondenten skal have deltaget i et SPI-projekt og tage
|| udgangspunkt for besvarelsen i dette projekt.På skemaet skal udfylde hvilket
|| rolle (sponsor/ejer, projektleder, konsulent, bruger af SPI,
|| projektmedarbejder, andet) respondenten har haft i det pågældente projekt.
|| Jeg har fået besvarelser fra 100 respondenter.
||
|| Fomålet er dels at afgøre hvilke faktorer, der bidrager mest til succes i et
|| SPI-projekt og herunder at afgøre om respondentens rolle i projektet har
|| betydning for besvarelsen.
|| Vi forestiller os at vi eventuelt kan eliminere nogle af faktorerne ved
|| hjælp af en korrelationstest, så vi kan eliminere en af faktorerne i de sæt
|| af faktorer, der har en korrelationsværdi på mindst ca. 0,7.
|| Vi vil også gerne kunne skære mindre relevante fraktorer fra og til dette
|| formål foreslog vores vejleder (som går ind for meget enkle løsninger) at vi
|| skulle vælge et gennemsnit og
|| kun medtage de faktorer fra foreningsmængden af en liste med alle
|| besvarelserne og de enkelte rollers (dvs. en gruppe bestående af alle med
|| den pågældende rolle) besvarelser, der har en gennemsnitsværdi på mindst 4.
|| Denne metode er vi dog ikke meget for, for hvis gennemsnittet eksempelvis er
|| sat til 4, så virker det meget hårdt at skulle skære en faktor med en
|| gennemsnitsværdi på 3,99, men medtage en faktor med en gennemsnitsværdi på
|| 4,00, især i betragtning af at der er mange usikkerheder forbundet med
|| besvarelserne.
||
|| Derudover skal der skabes et overblik over et SPI-projekt i form af en
|| grafisk model hvor de enkelte roller er anført med hvilke faktorer, der er
|| relateret til den enkelte rolle og hvilke faktorer der er relationer mellem
|| roller. De faktorer, der er angivet til den enkelte rolle vil vi også gerne
|| vægte, så der oprettes et antal lister sorteret efter betydning.
||
|| Det der ønskes foretaget i forhold til datamaterialet er dels at afgøre om
|| der er så stor forskel på de enkelte roller besvarelser at materialet skal
|| deles op i roller eller om forskellen er så ubetydelig at det ikke giver
|| mening at splitte det op og derfor arbejde med datametaerialet samlet
|| (sidsnævnte vil være at foretrække, da det gør det noget nemmere at arbejde
|| med materialet og vi slipper for en masse problemer med at nogle af rollerne
|| består af meget få respondenter).
|| Den metode, som vi senest har fået at vide at vi kan bruge, men det er vi så
|| også lidt usikre på pt, er at foretage en One-Way-ANOVA test af
|| besvarelserne opdelt efter roller og se for hvor mange af sprøgsmålenes
|| (faktorernes) vedkommende, der er signifikant forskel mellem grupperne. Det
|| var der for 3 spørgsmåls vedkommende og det vi så havde indtryk at at vi
|| kunne tolke det som var at når 3 ud af 62 spørgsmål afveg signifikant, så
|| svarede det netop til de 5% i et 95% konfidensinterval og dette skulle så
|| betyde at der ikke er signifikant forskel mellem rollerne. Denne løsning tog
|| vi for gode varer, nok især fordi det passede os fint at kunne afgøre at
|| besvarelserne ikke skulle opdeles i roller, men nu er vi i tvivl om hvorvidt
|| denne metoder er anvendelig og yderliger er det problematisk at ingen af os
|| er i standt til at forklare One-Way-Anova tilfredstillende gundet vores
|| manglende statistikkundskaber Sur

||
|| Faktorerne skal som nævnt ovenstående splittes op i forholdt til hvilken
|| rolle faktoren har betydning for et i SPI-projekt. Den opdeling af
|| faktorerne i forhold til roller, som vi selv umiddelbart finder mest logisk
|| vil vi om muligt gerne kunne understøtte med besvarelserne.
|
| Nu er jeg stødt på (endnu) et problem. variansanalysen, som viste at der var 3
| ud af 62
| faktoer, der afveg signifikant er blevet foretaget på et ikke helt korrekt
| grundlag.
| Der indgik som tidligere nævnt 6 roller, men den ene af disse roller en en
| sammensat rolle (andet) og bør derfor ikke indgå i testen af om der er
forskelle
| mellem rollernes gennemsnit.
| Når jeg gentager testen uden denne rolle øges antallet af spørgsmål hvor der
er
| signifikant afvigelse fra 3 til 8 dvs. fra 5% til 13%. Nu er jeg så i tvivl om
| hvordan jeg skal tolket dette resultat, for der er 13% af spørgsmåle, der
| angiver at der er signifikant forskel mellem rollerne, men er dette nok.
Hvilke
| tommefingerregler gælder for tolkning af dette.
|
| Samtidig er der 9 ud af de 62 spørgsmål hvor homogenitetetstesten angiver at
der
| er signifikant forskel. Hvordan tolkes dette og hvad betyder det for
| anvendeligheden af data i forhold til variansanalysen?

Nok et problem er dukket op. Jeg havde læst et sted at kravet til
variansanalysen var at der skulle være lige mange observationer i hver gruppe
eller at variansen skulle være den samme.I SPPS-manualen står der at der skal
være lige mange observationer i hver gruppe, dvs. så er der igen tvivl om
hvorvidt testen overhovedet kan anvendes.

Hvad menet I? Umiddelbart synes jeg det lyder meget fornuftig at man kan tillade
sig at se bort fra kravet til lige mange observationer i hver gruppe hvis blot
varianserne ikke afviger signifikant, men er det mon så at sige korrekt nok?

Mvh Kim

Søg

Reklame

Statistik

Spørgsmål :	177688
Tips :	31970
Nyheder :	719565
Indlæg :	6409899
Brugere :	218896

Månedens bedste

Årets bedste

Sidste års bedste