Nie obrażaj więc mojej inteligencji poprzez czynione na pokaz zaniżanie własnej.
Analiza wariancji dwuczynnikowej
W przypadku wieloczynnikowej analizy wariancji mamy do czynienia Stosując wieloczynnikową analizę wariancji chcemy sprawdzić wpływ kilku czynników (zmiennych niezależnych) na zmienną zależną. Wieloczynnikowy model analizy wariancji dostarcza o wiele więcej informacji niż zwykła, jednoczynnikowa analiza wariancji, czy też porównania testami t-Studenta. Ponadto, gdy badamy, czy dany czynnik wpływa na zmienną zależną, to wprowadzenie kolejnego czynnika może dostarczyć nam bardzo cennych informacji, tj. efekt interakcji i zmienić nasz pogląd na badane zjawisko. Zadanie:Niektóre bakterie produkują charakterystyczne barwniki. Przeprowadzono eksperyment, gdzie hodowano cztery różne gatunki bakterii (Pseudomonas aeruginosa –S1; Escherichia vulneris- S2; Bacillus subtilis-S3; Streptococcus pyogenes- S4) na dwóch różnych podłożach (LB
Do obliczeń używamy programu R w wersji 3.1.2, a za poziom istotności wykonywanej analizy przyjmujemy α= 0,05. Założenia analizy wariancjiH0: Produkcja barwników przez wszystkie gatunki bakterii jest identyczna. H1: Istnieje różnica w produkcji barwników dla przynajmniej dwóch gatunków bakterii. 1. Wczytywanie danychdane<-read.csv2("F:/projekt/dane3_bakterie.csv") dane podloze gat_bakterii ilosc_barwnika 1 LB S1 1.787 2 LB S1 2.325 3 LB S1 1.256 4 LB S1 2.315 5 LB S2 1.100 6 LB S2 1.326 7 LB S2 0.965 8 LB S2 1.132 9 LB S3 1.563 10 LB S3 2.423 11 LB S3 1.973 12 LB S3 1.756 13 LB S4 0.013 14 LB S4 0.102 15 LB S4 0.062 16 LB S4 0.056 17 TSB S1 1.962 18 TSB S1 2.625 19 TSB S1 1.654 20 TSB S1 2.514 21 TSB S2 1.325 22 TSB S2 1.635 23 TSB S2 1.389 24 TSB S2 1.374 25 TSB S3 1.986 26 TSB S3 2.648 27 TSB S3 2.364 28 TSB S3 2.214 29 TSB S4 0.026 30 TSB S4 0.326 31 TSB S4 0.095 32 TSB S4 0.132 attach(dane) 2. Obliczenie odchyleń standardowych z podziałem na gatunki bakteriiby(ilosc_barwnika,gat_bakterii,sd) gat_bakterii: S1 [1] 0.4714348 ------------------------------------------------------------ gat_bakterii: S2 [1] 0.2085349 ------------------------------------------------------------ gat_bakterii: S3 [1] 0.3627551 ------------------------------------------------------------ gat_bakterii: S4 [1] 0.09894876 Największe odchylenie standardowe jest w grupie bakterii Pseudomonas aeruginosa (S1), natomiast najmniejsze odchylenie standardowym charakteryzuje się grupa bakterii z gatunku Streptococcus pyogenes (S4). 3. Obliczenie ogólnej średniej ilości produkowanego przez bakterie barwnika (bez podziału bakterii na gatunki)mean(ilosc_barwnika) [1] 1.388219 4. Obliczenie ogólnej średniej ilości produkowanego przez bakterie barwnika z podziału na gatunki bakteriiby(ilosc_barwnika,gat_bakterii,mean) gat_bakterii: S1 [1] 2.05475 ------------------------------------------------------------ gat_bakterii: S2 [1] 1.28075 ------------------------------------------------------------ gat_bakterii: S3 [1] 2.115875 ------------------------------------------------------------ gat_bakterii: S4 [1] 0.1015 Największa średnia ilość produkowanego barwnika jest w grupie Bacillus subtilis (S3), natomiast najmniejsza w Streptococcus pyogenes (S4). 5. Tabelaryzacja średnich ilości produkowanych przez bakterie barwnikówmodel.tables(aov(ilosc_barwnika~gat_bakterii),type="means") Tables of means Grand mean 1.388219 gat_bakterii gat_bakterii S1 S2 S3 S4 2.0548 1.2808 2.1159 0.1015 6. Badanie równości wariancji za pomocą testu Levence’aδ2 S1- wariancja średniej odpowiedzi dla S1 δ2 S2 -wariancja średniej odpowiedzi dla S2 δ2S3 - wariancja średniej odpowiedzi dla S3 δ2S4 - wariancja średniej odpowiedzi dla S4
H0: Wszystkie wariancje są identyczne. H1: Przynajmniej jedna wariancja różni się od pozostałych.
(pobranie pakietu car, w którym znajduje się test levence) Packages → Install package(s) → car →OK library(car) leveneTest(ilosc_barwnika~gat_bakterii,center="mean")
Levene's Test for Homogeneity of Variance (center = "mean") Df F value Pr(>F) group 3 0.4075 0.7488 28 Z uzyskanej analizy uzyskaliśmy p-value równe 0,7488. Jest ona większa od ustalonego poziomu istotności α = 0,05, zatem przyjmujemy hipotezę zerową, a odrzucamy hipotezę alternatywną. Oznacza to, że obliczona wartość nie jest statystycznie istotna, a wariancje są identyczne (są homogeniczne), zatem można dalej przeprowadzać analizę wariancji. Zbadaną wartość wariancji można jeszcze sprawdzić poprzez zastosowanie testu Bartlett’a, jednak w tym celu należy wcześniej sprawdzić normalność składnika losowego. 9. Sprawdzenie normalność składnika losowego epsilon Ɛ model<-aov(ilosc_barwnika~gat_bakterii) str(model) model$residuals 1 2 3 4 5 6 7 8 -0.305750 0.232250 -0.532750 0.222250 0.292500 0.120500 0.259500 0.426500 9 10 11 12 13 14 15 16 0.322125 0.182125 -0.267875 -0.484875 0.025250 -0.295750 -0.325750 -0.731750 17 18 19 20 21 22 23 24 -0.130750 0.532250 -0.438750 0.421250 -0.380500 -0.070500 -0.316500 -0.331500 25 26 27 28 29 30 31 32 -0.254875 0.407125 0.123125 -0.026875 0.038250 1.338250 0.107250 -0.155750 10. Zbadanie normalności składnika losowego za pomocą testu Shapiro- Wilka
H0: Występuje normalność rozkładu reszt. H1: Reszty nie podlegają rozkładowi normalnemu.
shapiro.test(model$residuals) Shapiro-Wilk normality test data: model$residuals W = 0.937, p-value = 0.0614
Z uzyskanej analizy uzyskaliśmy p-value równe 0,0614. Jest ona większa od ustalonego poziomu istotności α= 0,05, zatem przyjmujemy hipotezę zerową, a odrzucamy hipotezę alternatywną. W takim przypadku można wykonać test Bartlett’a, który sprawdzenia homogeniczność wariancji. 11. Sprawdzenie homogeniczności wariancji za pomocą testu Bartlett’a
H0: Wszystkie wariancje są identyczne. H1: Przynajmniej jedna wariancja różni się od pozostałych.
bartlett.test(ilosc_barwnika~gat_bakterii)
Bartlett test of homogeneity of variances data: ilosc_barwnika by gat_bakterii Bartlett's K-squared = 4.0483, df = 3, p-value = 0.2563
Z uzyskanej analizy uzyskaliśmy p-value równe 0,2563. Jest ona większa od α (0,05), zatem przyjmujemy hipotezę zerową, a odrzucamy hipotezę alternatywną. Przeprowadzony test potwierdził, że wariancje są homogeniczne.
summary(model) Df Sum Sq Mean Sq F value Pr(>F) gat_bakterii 3 1.227 0.4089 2.241 0.105 Residuals 28 5.108 0.1824 Tabela analizy wariancji
Źródło zmienności Liczba stopni swobody Suma kwadratów Średni kwadrat Statystyka testowa F p-wartość Czynniki eksperymentalne 3 1,227 0,4089 Zróżnicowanie między grupami- MSA czy MS between
2,241
0,105 ... |
Menu
|