Kiểm định khi bình phương

     

1. Lúc nào sử dụng χ2

Kiểm tra Chi-square (χ2) bao gồm cả bài soát sổ Chi-bình phương một mẫu về tính chất độc lập (One-sample Chi-square demo of independence) và bài chất vấn Chi-bình phương nhì mẫu về tính đồng nhất (Twosample Chi-square thử nghiệm of homogeneity) là kiểu như nhau về cả thống kê giám sát và diễn giải.

Bạn đang xem: Kiểm định khi bình phương

Kiểm tra χ2 là một kiểm tra khoảng về mức ý nghĩa sâu sắc đối với sự liên kết (association) thân hai vươn lên là phân một số loại (categorical variables) khi dữ liệu ở dạng đếm gia tốc và mọt quan tâm triệu tập vào số lượng đối tượng người tiêu dùng thuộc các loại không giống nhau. Độ đúng chuẩn được kiểm tra phụ thuộc vào xây dựng mẫu được sử dụng. Những tần suất là quan liền kề được trong bảng 2 × 2 (‘2’ đầu tiên cho biết thêm số sản phẩm trong bảng và ‘2’ vật dụng hai cho biết số cột). Hai xây dựng lấy mẫu phổ biến là “kiểm tra χ2 về tính độc lập” (χ2 chạy thử of independence) với toàn bô biên của hàng và cột thốt nhiên và “kiểm tra χ2 về tính đồng nhất của tỷ lệ” (χ2 kiểm tra of homogeneity of proportions) với toàn bô biên của hàng thắt chặt và cố định hoặc là cột nuốm định.

(1) soát sổ χ2 một mẫu mã về tính chủ quyền với tổng cộng biên của hàng cùng cột ngẫu nhiên

Trong kiến tạo này, một mẫu bỗng nhiên được mang từ một số lượng dân sinh duy độc nhất vô nhị của các đối tượng người sử dụng nhưng với nhì thước đo cho từng đối tượng, kia là những biến nhị phân hàng với cột. Tổng độ lớn mẫu, n, là cố định nhưng các tần suất trong cả tổng thể biên của hàng và cột là bất chợt và không được biết trước hoặc cố định trước. Các tần số biên ngẫu nhiên nhờ vào vào bí quyết mỗi đối tượng người sử dụng được phân nhiều loại trên cả hai biến nhị phân. Nghĩa là, mỗi đối tượng người tiêu dùng sẽ được phân chia vào 1 trong những bốn ô trong bảng 2 × 2.

Ví dụ, một bên nghiên cứu điều tra vai trò của gia sư giáo dục đặc biệt trong âu yếm trẻ em mắc bệnh tự kỷ có thể đặc biệt suy xét mối quan hệ tình dục giữa thời gian kinh nghiệm cùng với tư cách là giáo viên (biến cột) và cảm xúc chi phối của họ với tư biện pháp là thầy giáo (biến hàng). Một mẫu bất chợt duy nhất gồm 100 giáo viên giáo dục đặc biệt được lựa chọn từ một dân sinh những giáo viên này. Phần lớn giáo viên giáo dục đặc biệt quan trọng được hỏi hai câu hỏi: họ đã chăm sóc trẻ em mắc bệnh tự kỉ được bao lâu? (các câu vấn đáp được phân một số loại thành lớn hơn hoặc bằng 5 năm hoặc thấp hơn năm năm), và cảm xúc chủ đạo của mình với tư bí quyết giáo viên là gì? (các câu trả lời được phân loại đa số là giận giữ hoặc đồng cảm). đưa thuyết nghiên cứu là cảm giác về mục đích của thầy giáo giáo dục đặc biệt có liên quan đến thời hạn kinh nghiệm có tác dụng việc. Giả thuyết loại bỏ là những biến hàng và cột là độc lập, kia là xác suất (số lượng) hy vọng ​​trong mỗi ô của bảng gây ra sẽ bằng nhau và sẽ không khác với số lượng quan liền kề được. Nói một cách tổng thể hơn, không có mối quan hệ giới tính giữa thời hạn là cô giáo và cảm giác chi phối về phương châm của giáo viên giáo dục và đào tạo đặc biệt.

(2) soát sổ χ2 hai mẫu về tính đồng điệu của xác suất với tổng biên của hàng (hoặc cột) được nỗ lực định

Thiết kế này được áp dụng để đối chiếu sự phân phối của hai phần trăm trong hai dân số độc lập. Vào bảng gây ra 2 × 2, mỗi đổi mới được xem như là nhị phân. Ví dụ: biến đổi cột trong bảng 2 × 2 có thể đại diện đến hai quần thể độc lập, nam và nữ, và trở thành hàng (biến phản bội hồi) rất có thể đại diện cho hiệu quả kiểm tra được phân loại là đạt hoặc không đạt. Bên nghiên cứu hoàn toàn có thể muốn khảo sát xem phần trăm ứng viên đạt có liên quan đến giới tính hay không. Ví dụ: một chủng loại ngẫu nhiên hòa bình gồm 50 nam với một mẫu ngẫu nhiên lẻ tẻ gồm 50 nữ sẽ được chọn. Tổng cột của phái nam và thiếu nữ trong lấy ví dụ như này được cố định bởi nhà nghiên cứu. Mỗi nam với nữ sẽ tiến hành phân một số loại thành một loại đạt hoặc ko đạt, toàn bô biên của mặt hàng là bỗng dưng (không được nhà nghiên cứu và phân tích cố định) và rất có thể chịu không nên số mẫu. Nếu phần trăm ứng viên “đạt” được thể hiện bằng P, thì tỷ lệ không đạt vẫn là 1-P (biến là nhị phân). đưa thuyết loại bỏ sẽ là tỷ lệ dân số (hoặc phần trăm) của nam giới và nữ giới vượt qua kỳ thi là bởi nhau, tốt nói một giải pháp khác là không có sự khác hoàn toàn giữa nam và đàn bà về tỷ lệ tỷ lệ vượt qua kỳ thi. Một dạng tổng quát hơn của giả thuyết loại bỏ này là không tồn tại mối quan hệ giới tính giữa nam nữ và các kết quả thi.

2. Suy đoán thống kê và giả thuyết vô hiệu

Suy luận thống kê lại là về tần suất, trong những số ấy số lượng các quan cạnh bên thuộc một loại ví dụ trong một đội là được so sánh với xác suất các quan ngay cạnh thuộc thuộc một loại từ team kia.

Các nhóm có thể chỉ mang đến hai phép đo độc lập từ một dân sinh hoặc mang đến hai dân số hòa bình đã được lựa chọn ngẫu nhiên. Ví dụ, trong một nghiên cứu về ảnh hưởng tác động của chương trình tư duy tích cực đến sự đầy niềm tin của sinh viên (sự tự tin giao tiếp tăng lên / ko tăng lên), chất vấn χ2 một mẫu mã về tính hòa bình sẽ được áp dụng với thi công này nhằm phát hiện ngẫu nhiên mối liên hệ nào giữa sự trường đoản cú tin với giới tính tốt không.Các đội cũng rất có thể đề cập cho hai số lượng dân sinh độc lập, ví dụ, trong một nghiên cứu và phân tích về mối quan hệ giữa nam nữ và các thành tích thi, hai nhóm học sinh thắt chặt và cố định gồm 50 nam và 50 nữ sẽ tiến hành chọn (biến cột), sau đó được phân nhiều loại thành team đạt với không đạt (biến hàng). Với kiến thiết mẫu này, kiểm soát χ2 hai chủng loại về sự đồng nhất của các phần trăm sẽ được thực hiện để đánh giá sự biệt lập giữa tỉ lệ phái nam và thanh nữ vượt qua kỳ thi.

Đối với soát sổ χ2 một mẫu về tính độc lập, những tham số được mong tính là phần trăm của từng ô của bảng 2 × 2 trong dân số. Mang thuyết nghiên cứu và phân tích là các biến hàng với cột hệ trọng với nhau, nghĩa là chúng không hòa bình và xác suất quan gần kề được trong tứ ô là khác nhau.

Tương tự, so với kiểm tra χ2 hai mẫu mã về tính nhất quán của những tỷ lệ, những tham số được ước tính là phần trăm của từng ô của bảng 2 × 2 trong dân số. Giả thuyết nghiên cứu là sự phân phối phần trăm (cho một đổi thay phân loại) là không giống nhau trong hai dân số (biến phân nhiều loại kia với tổng biên cố kỉnh định).

Giả thuyết vô hiệu cho tất cả χ2 một mẫu và hai mẫu là không có mối dục tình giữa các biến cột và hàng. Nếu đưa thuyết vô hiệu là đúng, xác suất bốn ô sẽ bằng nhau và không tồn tại sự khác hoàn toàn đáng đề cập giữa gia tốc ô quan gần cạnh được và tần số ô kỳ vọng.

Phân phối χ2 là được xác định hoàn toàn bởi một tham số duy nhất, bậc thoải mái (df). Bất cứ bao giờ chúng ta nhận xét thống kê χ2, họ cần chăm chú df say mê hợp. Trong đó, df = (số mặt hàng − 1) × (số cột − 1) và do đó luôn là giá trị ‘1’ vào bảng 2 × 2. Bình chọn χ2 với df hỗ trợ một xác suất cho sự khác hoàn toàn giữa các tần suất quan tiếp giáp được và tần suất kỳ vọng. Khi tần suất quan tiếp giáp và tần suất kỳ vọng hệt nhau nhau, những thống kê χ2 sẽ bằng không. Với ngẫu nhiên độ lệch nào, cực hiếm χ2 càng to thì ý nghĩa thống kê càng lớn.

3. Những giả định kiểm soát (Test Assumptions)

Các đưa định cơ bản của cả kiểm soát χ2 về tính hòa bình và tính đồng bộ cho bảng 2 × 2 là:

Các quan tiếp giáp là đại diện thay mặt tiêu biểu của các dân số quan tiền tâm.Dữ liệu sinh hoạt dạng đếm gia tốc quan sát.Các quan sát nên độc lập, gồm nghĩa là, một quan liền kề rơi vào ngẫu nhiên hàng rõ ràng nào của bảng tạo nên không phụ thuộc vào vào cột nó ở trong (và ngược lại).Các quan tiền sát nên làm rơi vào trong 1 ô của bảng vạc sinh.Kiểm tra χ2 không nên được thực hiện khi bất kỳ tần suất ô mong muốn ​​nào là nhỏ. Tần số kỳ vọng nhỏ tuổi là nhược điểm phổ biến đổi nhất trong việc sử dụng kiểm tra Chi-square (nghĩa là sử dụng sai Chi-bình phương). Cực hiếm kỳ vọng của 5 là giới hạn thấp độc nhất tuyệt đối. Khi size mẫu tổng là ≥20, thì gia tốc kì vọng ​trong một hoặc nhị ô rất có thể thấp cho 1 hoặc 2. Cơ mà Chi-square là một quy trình mạnh bạo và gia tốc ô mong rằng ​​2 là phân phối liên tục, cho nên vì thế việc thêm 0.5 vào từng tần số ô quan tiền sát được cho là sẽ nâng cấp phép xê dịch χ2. Nói chung, phép hiệu chỉnh này chưa hẳn trên cơ sở định hướng mà dựa trên ứng dụng của nó bởi nó có thể dẫn tới việc mất mối cung cấp không yêu cầu thiết. Với cỡ chủng loại nhỏ, nên thực hiện phép thử đúng đắn của Fisher (Fisher, 1935) (vui lòng đọc soát sổ Fisher).

4. Giấy tờ thủ tục kiểm tra χ2

Ví dụ, một nhà nghiên cứu và phân tích cần review xem giới tính cùng hiến huyết tự nguyện của sinh viên đại học có dục tình với nhau không. Một tập dữ liệu gồm 50 sv được thu thập. Trở thành giới tính được chia thành các mức giá thành trị 1 = nam, 2 = nữ, và vươn lên là hiến huyết tự nguyện (bạn đã từng tham gia hiến máu tự nguyện chưa?) được chia thành các mức chi phí trị 1= yes (có), 2 = no (không).

Giả thuyết những thống kê H0: Không có mối quan hệ giữa nguyên tố giới tính và sự hiến huyết tự nguyện của các sinh viên? nấc alpha được lựa chọn là 5%.

Kiểm tra χ2 đối chiếu tần số đếm được trong mỗi ô trong bảng phát sinh với tần số đếm mong muốn ​​cho từng ô (chúng ta bắt buộc ước tính tần số kỳ vọng). Con số ô hy vọng ​​được cầu lượng theo trả định rằng trả thuyết vô hiệu hóa là đúng, tức là không có sự liên kết giữa các biến hàng với cột.

Giá trị χ2 được tính cho từng ô vào bảng phạt sinh được xem theo công thức:

*

Trong đó, O là gia tốc ô quan tiếp giáp được, E là gia tốc ô kì vọng.

Dữ liệu điều tra khảo sát đếm tần suất được trình diễn trong bảng bên dưới đây:

*

Các bước soát sổ χ2:

Bước 1: Tính giá trị kì vọng cho mỗi ô từ bỏ A mang lại D

ô A: EA= (25×30)/50 = 15ô B: EB= (25×30)/50 = 15ô C: EC= (25×20)/50 = 10ô D: ED= (25×20)/50 = 10

Bước 2: Tính quý giá χ2 cho mỗi ô từ A đến D

ô A: χ2 = (18 – 15)2/ 15 = 0.6ô B: χ2 = (12 – 15)2/ 15 = 0.6ô C: χ2 = (7 – 10)2/ 10 = 0.9ô D: χ2 = (13 – 10)2/ 10 = 0.9

Bước 3: Tính tổng tất cả χ2

Tổng χ2 = 0.6 + 0.6 + 0.9 + 0.9 = 3.00

Cách suy đoán kết quả: Để đánh giá ý nghĩa thống kê của những thống kê χ2 được ước lượng ở trên, họ cần giám sát bậc trường đoản cú do thích hợp cho bảng vạc sinh, tại đây df = 1. Tra bảng phân phối những giá trị χ2 cho tới hạn (vui lòng xem bảng bày bán χ2), mức alpha được chọn đầu tiên là p≤0.05, quý hiếm χ2 tới hạn là 3.841, là giao điểm của cột alpha làm việc 0.05 với hàng df là 1. Vày giá trị χ2 được đo lường và tính toán (3.00) bé dại hơn giá trị χ2 tới hạn (điều sẽ được mong hóng theo trả thuyết loại bỏ là không liên tưởng giữa các biến hàng cùng cột) nên chúng ta không thể bác bỏ đưa thuyết vô hiệu hóa và kết luận rằng hai vươn lên là số, sự hiến máu tự nguyện với giới tính là không liên quan với nhau. Mặc dù tỷ lệ phái mạnh của 60% (18/30 × 100) so với nữ giới 40% (12/30 × 100) gồm sự biệt lập chút ít, tuy vậy sự khác biệt này là không có ý nghĩa sâu sắc thống kê sống mức chân thành và ý nghĩa p≤0.05, có nghĩa rằng sự hiến huyết tự nguyện với giới tính là không liên quan với nhau.

Xem thêm: Cách Làm Trà Sữa Truyền Thống Để Bán, Cách Nấu Trà Sữa Truyền Thống Để Bán

5. Khám nghiệm χ2 vào SPSS

Trong SPSS, họ thực hiện tại theo quá trình sau:

Bước 1. Vào Analyze > Descriptives Statistics > Crosstabs…

*

Bước 2. Tại cửa sổ Crosstabs, đưa biến hóa giới tính (sex) vào ô Row(s) và đổi mới hiến máu tự nguyện (hienmau) vào ô Column(s). Bạn cũng có thể nhấp vào ô Display clustered bar charts nhằm hiện vật thị quan hệ hai biến.

*

Bước 3. Nhấp vào tùy lựa chọn Statistics, chọn vào Chi-square, Phi and Cramer’s V. Tiếp nối nhấp Continue.

*

Bước 4. Nhấp vào tùy chọn Cells, chọn Observed, Expected với Total như trong hình. Về ý nghĩa sâu sắc thì Observed là số lượng thực tiễn quan sát, Expected là con số kì vọng, Total là tổng tỷ lệ theo từng dòng và từng cột. Nếu yêu cầu hiển thị thêm quý hiếm % của các ô, bọn họ chọn thêm Row với Column. Nhấp vào Continue.

*

Bước 5. Nhấp vào OK để chạy kết quả

Đọc bảng kết quả:

*

Trong bảng Giới tính * Hiến ngày tiết tự nguyện? Crosstabulation, các giá trị ngơi nghỉ ô red color là giá trị thực tế quan tiếp giáp được. Ví dụ, bao gồm 18 sv nam gia nhập hiến máu tình nguyện. Tương tự, gồm 7 sinh viên cô gái tham gia hiến huyết tình nguyện. Các giá trị làm việc ô blue color là cực hiếm kì vọng. Ví dụ, có 15 sv nam được kì vọng hiến tiết tự nguyện. Tất cả 10 sinh viên con gái được kì vọng hiến huyết tình nguyện. Ý nghĩa của quý giá kì vọng (expected), đó là khi có giả thiết giới tính và hiến máu tự nguyện không tồn tại quan hệ cùng với nhau. Thì xác suất lộ diện của giới tính và sự hiến huyết tự nguyện là tự do nhau.

*

Bảng công dụng quan trọng độc nhất vô nhị là Chi-square test. Kiểm nghiệm Chi-bình phương chỉ có ý nghĩa khi số quan gần kề đủ lớn, nếu có rất nhiều hơn 20% số ô vào bảng gây ra có tần suất kỳ vọng (expected) nhỏ dại hơn 5 thì quý giá chi-square không còn đáng tin cậy. Cuối bảng Chi-Square Tests (ô color xanh) luôn đưa ra một cái thông báo cho mình biết có bao nhiêu % số ô có tần suất mong chờ expected value bên dưới 5 của bảng. Nếu như trên 20% chúng ta phải tính đến những biện pháp khác, như thể sử kiểm tra Fisher’s exact test.

Có 3 giá chỉ trị bắt buộc lưu ý: giá trị χ2 là 3.00, cực hiếm bậc tự do df là 1, quý hiếm sig. Là 0.083. Vì sig. > 0.05 bắt buộc có bởi chứng cho biết thêm hai biến chuyển giới tính với sự hiến huyết tự nguyện là độc lập với nhau.

Còn giả dụ sig. Bảng trưng bày χ2 với bậc trường đoản cú do là 1 trong df. Trong lấy ví dụ này, vì chưng giá trị χ2 tới hạn là 3.841 lớn hơn giá trị χ2 được giám sát (3.00) nên bọn họ không thể bác bỏ đưa thuyết loại bỏ và kết luận rằng hai đổi mới số, sự hiến huyết tự nguyện và giới tính là không liên quan với nhau.

*

Giả sử, ví như hai biến này có mối dục tình với nhau, bọn họ sẽ cần reviews mức độ links giữa hai vươn lên là qua quý hiếm của thông số Phi với Cramer’s V. Hệ số Phi chỉ tương xứng để xem xét mối quan hệ giữa 2 biến đổi mà mỗi đổi thay chỉ tất cả 2 giá trị, nếu một trong những hai biến gồm từ 3 giá trị trở lên họ sẽ dùng hiệu quả của Cramer’s V. đưa sử trong lấy ví dụ như trên, chúng ta sẽ sử dụng hệ số Phi, giá trị này là 0.083, tức 8.3%, bởi vậy hai thay đổi này đối sánh thấp.

Trong nghiên cứu, kiểm tra χ2 (hay rất có thể gọi là kiểm soát Crosstab) thường xuyên được vận dụng nhiều khi chúng ta cần phân tích sâu hơn quan hệ giữa các điểm sáng nhân khẩu học của bạn trả lời, hoặc so sánh sự liên kết giữa những yếu tố chổ chính giữa lí giáo dục.

6. Ý nghĩa của hệ số Phi cùng Cramer’s Phi

Kiểm định χ2 nhạy cảm với cỡ mẫu và gần như luôn luôn luôn có ý nghĩa sâu sắc với những mẫu lớn. Chu chỉnh χ2 tấn công giá chân thành và ý nghĩa thống kê của một link chứ không phải sức mạnh của liên kết. Vì chưng đó, những thống kê kiểu đối sánh được yêu cầu để xác định độ táo bạo của bất kỳ mối links có ý nghĩa sâu sắc thống kê làm sao được phân phát hiện bởi thống kê χ2. Hai trong những các thước đo liên kết hữu ích duy nhất được thực hiện là: Φ, (Hệ số Phi) và hệ số Cramer’s V (đôi khi được gọi là Cramer’s Phi).

*

Phi nên làm được áp dụng làm thước đo độ mạnh mẽ của link khi cả hai vươn lên là đều là nhị phân. Phi có số lượng giới hạn dưới là 0, tức là không có độ mạnh link (các thay đổi không liên quan) và số lượng giới hạn trên là 1, độ khỏe mạnh tối nhiều của links (các biến chuyển có đối sánh tương quan hoàn hảo). Lúc một bảng phân phát sinh có tương đối nhiều hơn tư ô thì nên sử dụng Cramer’s V để đo thời gian chịu đựng của liên kết. Tương tự như Phi, phạm vi của thống kê lại này chuyển đổi từ 0 mang đến 1.

Xem thêm: Kem Trị Thâm Mép Miệng Của Nhất, 10 Cách Trị Vết Thâm Mép Miệng Từ Thiên Nhiên

*

Trong đó, n là tổng size mẫu, j là số nhỏ tuổi nhất của sản phẩm hoặc cột vào bảng phát sinh.

Tài liệu tham khảo