Bài tập phân tích phương sai 2 yếu tố năm 2024

Nhóm MBA ĐH Bách Khoa [email protected] giới thiệu đến các bạn phân tích anova hai yếu tố (two-way Anova), mục đích , ý nghĩa và cách thực hành trên SPSS. Phần này nhóm lược dịch từ sách “SPSS Survival Manual” của tác giả JULIE PALLANT

Trong phần này chúng ta sẽ phân tích Anova cho hai nhóm biến độc lập với 1 biến phụ thuộc gọi là phân tích two-way Anova . Cách thường dùng là phân tích one way Anova, ví dụ để so sánh giữa các nhóm tuổi khác nhau có sự khác biệt đối với sự hài lòng hay không.

File dữ liệu có thể được download tại đây:2wayanova_staffsurvey4Ed.sav

File dữ liệu có 3 biến, GIOITINH HAILONG NHOMTUOI, tương ứng với người lao động trong một công ty, có 2 loại giới tính, 3 loại nhóm tuổi và sự hài lòng khi làm việc tương ứng. Giả sử chúng ta đã có sự khác biệt giữa các nhóm tuổi đối với sự hài lòng thì câu hỏi đặt ra tiếp theo là sự khác biệt đó có đúng cho cả hai nhóm giới tính là nam và nữ hay không. Phân tích one-way Anova không thể trả lời câu hỏi này vì phân tích này được tiến hành cho toàn bộ hai loại giới tính nam và nữ không có sự chia ra. Sự ưu việt của phân tích two-way Anova như sau: Ví dụ trường hợp chúng ta có thể tìm ra là ảnh hưởng của độ tuổi tới sự hài lòng khác nhau giữa Nam và Nữ. Đối với Nam sự hài lòng tăng theo độ tuổi trong khi đối với Nữ lại giảm theo độ tuổi, trường hợp này gọi là hiệu ứng tương tác interaction effect.

Bật chương trình SPSS lên 1. Vào menu Analyze,nhấn General Linear Model, chọn Univariate.

Bài tập phân tích phương sai 2 yếu tố năm 2024
2. Nhấn vào biến phụ thuộc sự hài lòng HAILONG ,Đưa vào ô Dependent variable.

Bài tập phân tích phương sai 2 yếu tố năm 2024

3. Nhấn vào hai biến độc lập dạng phân loại, categorical GIOITINH,NHOMTUOI Và đưa vào ô Fixed Factors.

4. Nhấn vào nút Options. • Nhấn vào Descriptive Statistics, Estimates of effect size and Homogeneity tests. • Nhấn Continue.

Bài tập phân tích phương sai 2 yếu tố năm 2024

5. Nhấn nút Post Hoc. • Từ danh sách Factors bên trái, chọn biến NHOMTUOI ( nhóm này phải có 3 nhóm trở lên) và đưa vào ô bên phải Post Hoc Tests. • Chọn loại kiểm định (Tukey).

Bài tập phân tích phương sai 2 yếu tố năm 2024

• Nhấn Continue. Kết quả ra như sau: Bảng thống kê mô tả cung cấp về: độ lệch chuẩn, số mẫu, giá trị trung bình

Bài tập phân tích phương sai 2 yếu tố năm 2024

Bảng kiểm định phương sai bằng nhau “Levene’s Test of Equality of Error Variances” cung cấp kiểm định về kết quả định bằng nhau của phương sai. Bạn sẽ muốn hệ số significant lớn hơn 5% và do đó không có ý nghĩa thống kê, như thế có thể kết luận được phương sai giữa các nhóm biến bằng nhau.

Bài tập phân tích phương sai 2 yếu tố năm 2024

Bảng: Test of between subject effect, đây là phần kết quả chính của phân tích two-way Anova.

Interaction effects: Chúng ta nhìn vào dòng NHOMTUOI*GIOITINH với giá trị kiểm định sig. hệ số là 0.138 lớn hơn 5% do đó ảnh hưởng tương tác “Interaction effects”là không có, điều đó chỉ ra rằng không có sự khác biệt trong ảnh hưởng của độ tuổi lên sự hài lòng theo giới tính (nam và nữ). Main effects: phân tích tác động chính để tìm xem một biến có tác động đến sự hài lòng hay không, chúng ta nhìn vào cột sig. Nếu giá trị này lớn hơn 5% thì không có tác động có ý nghĩa thống kê. Trong trường hợp này nhóm tuổi có Sig. bé hơn 5% và giới tính có Sig. lớn hơn 5% , có nghĩa là giữa các nhóm tuổi có sự khác biệt đối với sự hài lòng còn giữa nam và nữ thì không có sự khác biệt. Cụ thể muốn biết nhóm nào khác với nhóm nào giữa các nhóm tuổi thì chúng ta nhìn vào phần phân tích sâu Anova,

Bài tập phân tích phương sai 2 yếu tố năm 2024

Chúng ta sẽ thấy nhóm tuổi dưới 20 so với nhóm tuổi trên 40 có sig. dưới 5%, và nhóm tuổi dưới 20 so với nhóm tuổi trên 20-40 có sig. dưới 5% Do đó ta kết luận giữa nhóm dưới 20 tuổi và nhóm trên 40 tuổi có sự khác biệt đối với việc hài lòng, cũng như kết luận giữa nhóm dưới 20 tuổi và nhóm 20-40 tuổi có sự khác biệt đối với việc hài lòng.

Các bạn cần trao đổi thêm có thể chát với nhóm tạo facebook.com/hoidapSPSS hoặc mail [email protected], nhóm sẽ hỗ trợ nhé.

  • 1. PHƯƠNG SAI MỘT YẾU TỐ (ONE WAY ANOVA) ThS HUỲNH TỐ UYÊN 1
  • 2. sai? 2 Ví dụ1: Để xét xem giới tính có ảnh hưởng đến kết quả học tập hay không, người ta so sánh điểm trung bình của nhóm sinh viên nam và sinh viên nữ Nam Nữ 6.5 5.7 7.0 6.8 6.7 8.2 8.0 7.7 5.6 6.4 6.5 Kiểm định xem giới tính có ảnh hưởng đến kết quả học tập? Kiểm định sự khác nhau giữa điểm trung bình của 2 nhóm sinh viên này
  • 3. sai? 3 Ví dụ2: Để xét xem thời gian làm thêm có ảnh hưởng đến kết quả học tập hay không, người ta điều tra mẫu sau: Nhóm 1: làm thêm ít <6 giờ /tuần Nhóm 2: làm thêm TB 6-12 giờ/tuần Nhóm 3: làm thêm nhiều >12 giờ/tuần 6.3 7.2 6,3 7.0 6.6 5.8 6.5 6.1 6.0 6.6 5.8 5.5 7.2 6.8 5.2 6.9 7.1 6.5 6.4 5.9 5.3 6.2 Kiểm định xem thời gian làm thêm có ảnh hưởng đến kết quả học tập không?
  • 4. sai? 4 Phân tích phương sai là phương pháp kiểm định sự bằng nhau của trung bình nhiều tổng thể Phân tích phương sai là phương pháp phân tích sự ảnh hưởng của 1 hay nhiều yếu tố nguyên nhân đến 1 yếu tố kết quả
  • 5. phương sai 1 yếu tố 5 Phân tích phương sai một yếu tố là phân tích ảnh hưởng của một yếu tố nguyên nhân (định tính) đến một yếu tố kết quả (định lượng) Ví dụ: Thời gian làm thêm (yếu tố nguyên nhân – định tính) ảnh hưởng đến kết quả học tập ( yếu tố kết quả - định lượng)
  • 6. phương sai 1 yếu tố 6 BÀI TOÁN: Giả sử ta có k nhóm gồm phần tử được chọn từ k tổng thể. là các trung bình của k tổng thể đó là giá trị (quan sát) thứ j của nhóm thứ i. Bảng giá trị quan sát của k nhóm: 1 2, ,..., kn n n µ µ µ1 2, ,..., k ijx NHÓM 1 2 … k … … … … … … … 11x 11nx 21x 22nx 1kx kknx VD: slide 3 ijx Giả sử k tổng thể có phân phối chuẩn, có phương sai bằng nhau, các mẫu là độc lập
  • 7. phương sai 1 yếu tố 7 0 1 2 1 : ... :toàn taïi ít nhaát 1 caëp trung bình khaùc nhau kH H µ µ µ= = =   0 1 2 3 1 : :toàn taïi ít nhaát 1 caëp trung bình khaùc nhau H H µ µ µ= =   0 1 : toá kqkhoângbò aûnhhöôûngbôûi yeáutoá ñangxeùt : toá kqcoù bò aûnhhöôûng H yeáu H yeáu    Ví dụ 2.1 0 1 :thôøigianlaømtheâmkhoângaûnhhöôûngñeánkeátquaû hoïctaäp :thôøigianlaømtheâmcoù aûnhhöôûngñeánkeátquaû hoïctaäp H H   
  • 8. phương sai 1 yếu tố 8 Bước 1: Tính giá trị trung bình cho từng nhóm và chung cho tất cả các nhóm ix x = = = = = = ∑ ∑ ∑ 1 1 1 1 1 in i ij i j k i i i k i i x x n x x n n n n Ví dụ 2.2 Bước 1. Tính trung bình của từng nhóm và trung bình chung của ba nhóm. = =1 46,9 6,7 7 x = =2 45,5 6,5 7 x = =3 46,8 5,85 8 x + + = = + + 46,9 45,5 46,8 6,3273 7 7 8 x
  • 9. NHOM3 1x 2x 3x x
  • 10. phương sai 1 yếu tố 10 Bước 2: - Tính sự biến thiên (tổng bình phương độ lệch)giữa nội bộ nhóm = = −∑ 2 1 ( ) in i ij i j SS x x Ví dụ 2.3 Bước 2. - Tính sự biến thiên giữa nội bộ nhóm: = = = = + + = + + = 1 2 3 1 2 3 0,68 1,96 1,62 0,68 1,96 1,62 4,26 SS SS SS SSW SS SS SS= = ∑ 1 k i i SSW SS Tổng biến thiên nội bộ của tất cả các nhóm
  • 11. phương sai 1 yếu tố Nhận xét: SSW= tổng biến thiên nội bộ của cả 3 nhóm = sự biến thiên gây ra bởi các yếu tố khác yếu tố mà ta đang nghiên cứu
  • 12. phương sai 1 yếu tố Bước 2:(tt) - Tính sự biến thiên giữa các nhóm = = −∑ 2 1 ( ) k i i i SSG x x n Ví dụ 2.3(tt) - Tính sự biến thiên giữa các nhóm: = − + − + − = 2 2 2 (6,7 6,3273) .7 (6,5 6,3273) .7 (5,85 6,3273) .8 3,004 SSG
  • 13. phương sai 1 yếu tố Nhận xét: SSG = sự biến thiên gây ra bởi sự khác nhau giữa các nhóm = sự biến thiên gây ra bởi các yếu tố mà ta đang nghiên cứu x
  • 14. phương sai 1 yếu tố Gọi SST là tổng biến thiên của 1 quan sát bất kì so với giá trị trung bình SST= SSW + SSG Tổng biến thiên = biến thiên do các yếu tố khác(SSW) + biến thiên do yếu tố đang nghiên cứu(SSG) Nhận xét: Nếu phần biến thiên do các yếu tố nghiên cứu tạo ra (SSG) lớn hơn phần biến thiên do các yếu tố khác tạo ra (SSW) thì chứng tỏ yếu tố ta đang nghiên cứu thật sự ảnh hưởng đến yếu tố kết quả ⇒ tăng khả năng bác bỏ Ho
  • 15. phương sai 1 yếu tố Bước 3: - Tính các phương sai = − SSW MSW n k Ví dụ 2.4 - Tính các phương sai = − 1 SSG MSG k = phương sai do các yếu tố khác tạo ra = phương sai do các yếu tố nghiên cứu tạo ra = = − = = − 4,26 0,224 22 3 3,004 1,502 3 1 MSW MSG
  • 16. phương sai 1 yếu tố Bước 4: Kiểm định giả thuyết: Xét tỉ số 2 phương sai phöông sai do yeáu toá nghieân cöùu phöông sai do yeáu toá khaùc = = MSG F MSW Nhận xét: Nếu MSG lớn, MSW nhỏ ⇒ F lớn ⇒ bác bỏ Ho Fαααα (k-1,n-k) αααα 1 -αααα 0 Nếu F> Fαααα (k-1,n-k) ⇒ bác bỏ Ho
  • 17. dụ 2.5 - Tính tỉ số F = = = 1,502 6,7 0,224 MSG F MSW α− − = =1, , 2 ;19 ; 0,05 3,52k n kF F Vì nên ta bác bỏ Ho ⇒ Việc đi làm thêm có ảnh hưởng đến kết quả học tập của sinh viên α− −> 1, ,k n kF F
  • 18. quả phân tích phương sai thường được trình bày dưới dạng bảng sau đây Nguồn biến thiên Tổng các độ lệch bình phương Bậc tự do Trung bình của các độ lệch bình phương (phương sai) Giá trị kiểm định F Giữa các nhóm SSG k-1 Trong nội bộ nhóm SSW n-k Tổng cộng SST n-1 1 SSG MSG k = − MSG F MSW = SSW MSW n k = −
  • 19. Sum Average Variance Nhóm 1 7 46.9 6.7 0.11333 Nhóm 2 7 45.5 6.5 0.32666 Nhóm 3 8 46.8 5.85 0.23142 ANOVA Source of Variation SS df MS F P-value F crit Between Groups 3.00364 2 1.50181 6.69825 0.00628 3.5219 Within Groups 4.26 19 0.22421 Total 7.26364 21 F tra bảng
  • 20. dụng Ví dụ 3: Cho 1 phần bảng ANOVA a) Hãy hoàn tất bảng b) Với mức ý nghĩa 0,05 cho biết có sự khác biệt về trung bình các tổng thể hay không? Nguồn biến thiên Tổng các độ lệch bình phương Bậc tự do Trung bình của các độ lệch bình phương (phương sai) Giá trị kiểm định F Giữa các nhóm 16,9 6 ?(1) ?(2) Trong nội bộ nhóm ?(3) 41 ?(4) Tổng cộng 45,2 ?(5)
  • 21. dụng Ví dụ 4: Nghiên cứu về thu nhập của các hộ gia đình ở ngoại thành, người ta chia ngoại thành thành 7 địa bàn dân cư khác nhau. Chọn ngẫu nhiên các hộ trong từng địa bàn và ghi nhận thu nhập. Địa bàn dân cư thứ ba có 13 hộ được chọn, các địa bàn còn lại đều chọn 19 hộ. Kết quả ANOVA như sau: Ở mức ý nghĩa 1% có thể kết luận rằng thu nhập trung bình của các hộ gia đình ở các địa bàn dân cư khác nhau là như nhau được không? Source of Variation SS df MS F Between Groups 187,2649 ?(1) ?(2) ?(3) Within Groups ?(4) ?(5) ?(6) Total 1269,6891
  • 22. trường hợp bác bỏ H0 ta muốn kết luận về sự hơn kém của các trung bình thì ta cần phân tích sâu hơn ⇒ PHÂN TÍCH SÂU ANOVA (KIỂM ĐỊNH TURKEY)
  • 23. sâu ANOVA – kiểm định Turkey Mục đích phân tích sâu ANOVA Trong kiểm định: Nếu chấp nhận Ho phân tích xong Bác bỏ Ho phân tích sâu hơn để xem trung bình các nhóm nào khác nhau, lớn hơn hay nhỏ hơn. 0 1 2 1 : ... : toàn taïi ít nhaát 1 caëp trung bình khaùc nhau kH H µ µ µ= = =  
  • 24. sâu ANOVA – kiểm định Turkey Phương pháp phân tích sâu ANOVA: kiểm định Turkey: Với cùng mức ý nghĩa α, ta so sánh từng cặp trung bình để phát hiện những nhóm khác nhau. Khi có k nhóm, số cặp cần phải kiểm định là tổ hợp chập 2 của k nhóm Ck 2 Ví dụ 2.6: Trong ví dụ 2 ta có k=3, vậy ta cần kiểm định C3 2 =3 cặp 0 1 3 0 10 1 2 1 1 3 1 11 1 2 : :: , ,..., : :: k k k k H HH H HH µ µ µ µµ µ µ µ µ µµ µ − − = ==      ≠ ≠≠   0 2 3 0 1 30 1 2 1 2 3 1 1 31 1 2 : :: , , : :: H HH H HH µ µ µ µµ µ µ µ µ µµ µ = ==      ≠ ≠≠  
  • 25. sâu ANOVA – kiểm định Turkey Phương pháp phân tích sâu ANOVA: kiểm định Turkey: { } ( , ), min min 1 2min , ,..., k n k k MSW T q n n n n n α−= = Ví dụ 2.7: Bước 1: tính Bước 2: tính trong đó q: phân phối Turkey ( bảng tra 9) Bước 3: Bác bỏ Ho nếu Dij >T ij i jD x x= − 12 1 2 23 31 1: 0,2 0,65; 0,85 B D x x D D = − = = = 0,224 2: 3,59 0,6422 7 B T = = 12 1 2 23 2 3 31 3 1 3:B D T D T D T µ µ µ µ µ µ < ⇒ = > ⇒ ≠ > ⇒ ≠ 2 1 3 2 3 1 3 ì , ,v x x x µ µ µ µ > ⇒ > >
  • 26. HỢP Ban Giám hiệu một trường đại học muốn nghiên cứu ảnh hưởng của việc đi làm thêm đối với kết quả học tập của sinh viên. Một sinh viên đã thu thập thời gian đi làm thêm và kết quả học tập của một số sinh viên trong trường. Sinh viên có đi làm thêm được chia thành ba nhóm. Nhóm thứ nhất gồm 7 sinh viên có thời gian làm thêm ít, dưới 6 giờ / tuần. Nhóm thứ hai gồm 7 sinh viên có thời gian làm thêm vừa phải, từ 6 đến 12 giờ / tuần. Nhóm thứ ba gồm 8 sinh viên có thời gian làm thêm nhiều , trên 12 giờ / tuần. Điểm trung bình học tập của các sinh viên đó như sau. Nhóm 1 Nhóm 2 Nhóm 3 6,3 7.0 6,5 6,6 7,2 6,9 6,4 7,2 6,6 6,1 5,8 6,8 7,1 5,9 6,3 5,8 6,0 5,5 5,2 6,5 5,3 6,2 46,9 45,5 46,8∑ Phát bi u gi thuy t: th i gian đi làm thêm không nh hư ng đ n k t qu h c t p c a sinh viên, nghĩa là đi m trung bình h c t p c a ba nhóm trên là như nhau: . Ta ki m đ nh gi thuy t trên v i m c ý nghĩa 5%.