wariancja dwuczynnikowa, Drugi stopień

Nie obrażaj więc mojej inteligencji poprzez czynione na pokaz zaniżanie własnej.
Analiza wariancji dwuczynnikowej

W przypadku wieloczynnikowej analizy wariancji mamy do czynienia
z przynajmniej dwoma czynnikami. Najczęściej spotykanym modelem jest model dwuczynnikowy (dwuczynnikowa analiza wariancji), choć tych czynników może być znacznie więcej.

Stosując wieloczynnikową analizę wariancji chcemy sprawdzić wpływ kilku czynników (zmiennych niezależnych) na zmienną zależną.

Wieloczynnikowy model analizy wariancji dostarcza o wiele więcej informacji niż zwykła, jednoczynnikowa analiza wariancji, czy też porównania testami t-Studenta. Ponadto, gdy badamy, czy dany czynnik wpływa na zmienną zależną, to wprowadzenie kolejnego czynnika może dostarczyć nam bardzo cennych informacji, tj. efekt interakcji i zmienić nasz pogląd na badane zjawisko. 

Zadanie:

Niektóre bakterie produkują charakterystyczne barwniki. Przeprowadzono eksperyment, gdzie hodowano cztery różne gatunki bakterii (Pseudomonas aeruginosa –S1; Escherichia vulneris- S2; Bacillus subtilis-S3; Streptococcus pyogenes- S4) na dwóch różnych podłożach (LB
i TSB). Dla każdej kombinacji bakteria-podłoże wykonano cztery niezależne od siebie powtórzenia. Zbadać czy średnia ilość produkowanych barwników różnią się w zależności od gatunku bakterii i podłoża, na jakich zostały one hodowane oraz czy występuje ewentualna interakcja bakteria-podłoże.

 

Do obliczeń używamy programu R w wersji 3.1.2, a za poziom istotności wykonywanej analizy przyjmujemy α= 0,05.

Założenia analizy wariancji

H0: Produkcja barwników przez wszystkie gatunki bakterii jest identyczna.

H1: Istnieje różnica w produkcji barwników dla przynajmniej dwóch gatunków bakterii.

1. Wczytywanie danych

dane<-read.csv2("F:/projekt/dane3_bakterie.csv")

dane

   podloze gat_bakterii ilosc_barwnika

1       LB           S1          1.787

2       LB           S1          2.325

3       LB           S1          1.256

4       LB           S1          2.315

5       LB           S2          1.100

6       LB           S2          1.326

7       LB           S2          0.965

8       LB           S2          1.132

9       LB           S3          1.563

10      LB           S3          2.423

11      LB           S3          1.973

12      LB           S3          1.756

13      LB           S4          0.013

14      LB           S4          0.102

15      LB           S4          0.062

16      LB           S4          0.056

17     TSB           S1          1.962

18     TSB           S1          2.625

19     TSB           S1          1.654

20     TSB           S1          2.514

21     TSB           S2          1.325

22     TSB           S2          1.635

23     TSB           S2          1.389

24     TSB           S2          1.374

25     TSB           S3          1.986

26     TSB           S3          2.648

27     TSB           S3          2.364

28     TSB           S3          2.214

29     TSB           S4          0.026

30     TSB           S4          0.326

31     TSB           S4          0.095

32     TSB           S4          0.132

attach(dane)

2. Obliczenie odchyleń standardowych z podziałem na gatunki bakterii

by(ilosc_barwnika,gat_bakterii,sd) 

gat_bakterii: S1

[1] 0.4714348

------------------------------------------------------------

gat_bakterii: S2

[1] 0.2085349

------------------------------------------------------------

gat_bakterii: S3

[1] 0.3627551

------------------------------------------------------------

gat_bakterii: S4

[1] 0.09894876

Największe odchylenie standardowe jest w grupie bakterii Pseudomonas aeruginosa (S1), natomiast najmniejsze odchylenie standardowym charakteryzuje się grupa bakterii z gatunku Streptococcus pyogenes (S4).

3. Obliczenie ogólnej średniej ilości produkowanego przez bakterie barwnika (bez podziału bakterii na gatunki)

mean(ilosc_barwnika)

[1] 1.388219

4. Obliczenie ogólnej średniej ilości produkowanego przez bakterie barwnika z podziału na gatunki bakterii

by(ilosc_barwnika,gat_bakterii,mean)

gat_bakterii: S1

[1] 2.05475

------------------------------------------------------------

gat_bakterii: S2

[1] 1.28075

------------------------------------------------------------

gat_bakterii: S3

[1] 2.115875

------------------------------------------------------------

gat_bakterii: S4

[1] 0.1015

Największa średnia ilość produkowanego barwnika jest w grupie Bacillus subtilis (S3), natomiast najmniejsza w Streptococcus pyogenes (S4).

5. Tabelaryzacja średnich ilości produkowanych przez bakterie barwników

model.tables(aov(ilosc_barwnika~gat_bakterii),type="means")

Tables of means

Grand mean  

1.388219

gat_bakterii

gat_bakterii

    S1     S2     S3     S4

2.0548 1.2808 2.1159 0.1015

6. Badanie równości wariancji za pomocą testu Levence’a

δ2 S1- wariancja średniej odpowiedzi dla S1

δ2 S2 -wariancja średniej odpowiedzi dla S2

δ2S3 - wariancja średniej odpowiedzi dla S3

δ2S4 - wariancja średniej odpowiedzi dla S4

 

H0: Wszystkie wariancje są identyczne.

H1: Przynajmniej jedna wariancja różni się od pozostałych.

 

(pobranie pakietu car, w którym znajduje się test levence)

Packages → Install package(s) → car →OK

library(car)

leveneTest(ilosc_barwnika~gat_bakterii,center="mean")

 

Levene's Test for Homogeneity of Variance (center = "mean")

Df F value Pr(>F)

group  3  0.4075 0.7488

28

Z uzyskanej analizy uzyskaliśmy p-value równe 0,7488. Jest ona większa od ustalonego poziomu istotności α = 0,05, zatem przyjmujemy hipotezę zerową, a odrzucamy hipotezę alternatywną. Oznacza to, że obliczona wartość nie jest statystycznie istotna, a wariancje są identyczne (są homogeniczne), zatem można dalej przeprowadzać analizę wariancji.

 

Zbadaną wartość wariancji można jeszcze sprawdzić poprzez zastosowanie testu Bartlett’a, jednak w tym celu należy wcześniej sprawdzić normalność składnika losowego. 9. Sprawdzenie normalność składnika losowego epsilon Ɛ

model<-aov(ilosc_barwnika~gat_bakterii)

str(model)

model$residuals

        1         2         3         4         5         6         7         8

-0.305750  0.232250 -0.532750  0.222250  0.292500  0.120500  0.259500  0.426500

        9        10        11        12        13        14        15        16

0.322125  0.182125 -0.267875 -0.484875  0.025250 -0.295750 -0.325750 -0.731750

       17        18        19        20        21        22        23        24

-0.130750  0.532250 -0.438750  0.421250 -0.380500 -0.070500 -0.316500 -0.331500

       25        26        27        28        29        30        31        32

-0.254875  0.407125  0.123125 -0.026875  0.038250  1.338250  0.107250 -0.155750

10. Zbadanie normalności składnika losowego za pomocą testu Shapiro- Wilka

 

H0: Występuje normalność rozkładu reszt.

H1: Reszty nie podlegają rozkładowi normalnemu.

 

shapiro.test(model$residuals)

        Shapiro-Wilk normality test

data:  model$residuals

W = 0.937, p-value = 0.0614

 

Z uzyskanej analizy uzyskaliśmy p-value równe 0,0614. Jest ona większa od ustalonego poziomu istotności α= 0,05, zatem przyjmujemy hipotezę zerową, a odrzucamy hipotezę alternatywną. W takim przypadku można wykonać test Bartlett’a, który sprawdzenia homogeniczność wariancji.

11. Sprawdzenie homogeniczności wariancji za pomocą testu Bartlett’a

 

H0: Wszystkie wariancje są identyczne.

H1: Przynajmniej jedna wariancja różni się od pozostałych.

 

bartlett.test(ilosc_barwnika~gat_bakterii)

 

        Bartlett test of homogeneity of variances

data:  ilosc_barwnika by gat_bakterii

Bartlett's K-squared = 4.0483, df = 3, p-value = 0.2563

 

Z uzyskanej analizy uzyskaliśmy p-value równe 0,2563. Jest ona większa od α (0,05), zatem przyjmujemy hipotezę zerową, a odrzucamy hipotezę alternatywną. Przeprowadzony test potwierdził, że wariancje są homogeniczne.

 

summary(model)

             Df Sum Sq Mean Sq F value Pr(>F)

gat_bakterii  3  1.227  0.4089   2.241  0.105

Residuals    28  5.108  0.1824 

 

Tabela analizy wariancji

 

Źródło zmienności

Liczba stopni swobody

Suma kwadratów

Średni kwadrat

Statystyka testowa F

p-wartość

Czynniki eksperymentalne
(metoda)

3

1,227

0,4089

Zróżnicowanie między grupami- MSA czy MS between

 

 

 

2,241

 

 

 

0,105

...
  • zanotowane.pl
  • doc.pisz.pl
  • pdf.pisz.pl
  • alter.htw.pl
  • Powered by WordPress, © Nie obrażaj więc mojej inteligencji poprzez czynione na pokaz zaniżanie własnej.