Luận án tiến sĩ: Dạy học xác suất thống kê ở trường ĐH Y - Phần 2
Xác suất thống kê
Ẩn danh
Giáo trình / Tài liệu học tập
Số trang
157
Thời gian đọc
24 phút
Lượt xem
0
Lượt tải
0
Phí lưu trữ
50 Point
Tóm tắt nội dung
I. Phương pháp kiểm định trong thống kê y học
Kiểm định giả thuyết thống kê đóng vai trò nền tảng trong nghiên cứu y học. Phương pháp này giúp xác định sự khác biệt có ý nghĩa giữa các nhóm dữ liệu. Việc lựa chọn phép kiểm phù hợp phụ thuộc vào nhiều yếu tố. Cỡ mẫu, phương sai và phân phối dữ liệu là ba tiêu chí quan trọng. Khi phương sai đã biết, kiểm định z được ưu tiên. Với cỡ mẫu nhỏ hơn 30 và phương sai chưa biết, kiểm định t-test là lựa chọn phù hợp. Mức ý nghĩa thống kê thường được đặt ở 0.05 hoặc 0.01. Giá trị p-value giúp đưa ra kết luận cuối cùng về giả thuyết.
1.1. Tiêu chí lựa chọn phép kiểm định
Cỡ mẫu là yếu tố đầu tiên cần xem xét. Với n ≥ 30, phép kiểm z có thể áp dụng khi dữ liệu có phân phối chuẩn. Với n < 30, kiểm định t-test theo phân phối Student được sử dụng. Phương sai đã biết hay chưa biết ảnh hưởng trực tiếp đến lựa chọn. Tính độc lập giữa các nhóm nghiên cứu cũng cần được đảm bảo.
1.2. Ba giả định cơ bản của kiểm định t
Dữ liệu quan sát phải có phân phối chuẩn trong mỗi nhóm. Phương sai hai nhóm cần đồng nhất với nhau. Hai nhóm đối tượng nghiên cứu phải độc lập hoàn toàn. Khi vi phạm giả định phân phối chuẩn, giá trị p sẽ thấp hơn thực tế. Điều này dẫn đến dễ dàng bác bỏ giả thuyết không một cách sai lầm.
1.3. Sai số loại I và loại II
Sai số loại I xảy ra khi bác bỏ giả thuyết không đúng. Mức ý nghĩa α kiểm soát xác suất sai số này. Sai số loại II là chấp nhận giả thuyết không sai. Khoảng tin cậy và độ tin cậy 95% giúp giảm thiểu rủi ro sai lầm. Cân bằng giữa hai loại sai số là mục tiêu trong thiết kế nghiên cứu.
II. Quy trình kiểm định giả thuyết 6 bước chuẩn
Phương pháp kiểm định được chi tiết hóa thành sáu bước rõ ràng. Bước đầu tiên là đặt giả thuyết thống kê phù hợp. Tiếp theo là xác định phép kiểm phù hợp với dữ liệu. Lựa chọn mức ý nghĩa thống kê thường là 0.01 hoặc 0.05. Xác định giá trị ngưỡng dựa trên bảng phân phối. Tính toán giá trị thống kê từ dữ liệu mẫu. Cuối cùng là đưa ra kết luận dựa trên so sánh giá trị. Quy trình này đảm bảo tính khoa học và nhất quán.
2.1. Đặt giả thuyết không và giả thuyết đối
Giả thuyết không (H₀) thể hiện không có sự khác biệt. Giả thuyết đối (H₁) khẳng định có sự khác biệt có ý nghĩa. Kiểm định một phía hai phía được chọn tùy mục đích nghiên cứu. Kiểm định hai phía phát hiện sự khác biệt theo cả hai hướng. Kiểm định một phía chỉ quan tâm đến một hướng thay đổi cụ thể.
2.2. Xác định phép kiểm và giá trị ngưỡng
Phân tích bài toán để chọn phép kiểm hai đuôi hay một đuôi. Kiểm tra điều kiện của phép kiểm trước khi áp dụng. Giá trị ngưỡng C được tra từ bảng phân phối Student hoặc chuẩn. Với mức ý nghĩa 0.01 và bậc tự do 50, giá trị ngưỡng là 2.682. Độ tin cậy 95% tương ứng với mức ý nghĩa 0.05.
2.3. Tính toán và kết luận thống kê
Công thức tính giá trị t phụ thuộc vào loại kiểm định. Với kiểm định ghép cặp, sử dụng hiệu số trung bình và độ lệch chuẩn. So sánh giá trị t tính được với giá trị ngưỡng. Nếu t lớn hơn ngưỡng, bác bỏ giả thuyết không. Giá trị p-value cung cấp thông tin bổ sung cho kết luận.
III. Ví dụ kiểm định t ghép cặp trong y học
Nghiên cứu đo lượng 7α-HCO trước và sau phẫu thuật minh họa quy trình. Với 51 bệnh nhân, hiệu số trung bình là 21.22 ng/mL. Độ lệch chuẩn là 26.68 ng/mL. Mục tiêu là kiểm tra sự thay đổi có ý nghĩa thống kê. Giả thuyết không khẳng định hiệu số bằng 0. Giả thuyết đối cho rằng hiệu số khác 0. Phép kiểm t ghép cặp được áp dụng với giả định phân phối chuẩn. Mức ý nghĩa chọn là 0.01 để đảm bảo độ tin cậy cao.
3.1. Thiết lập giả thuyết và chọn phép kiểm
Gọi δ là hiệu số lượng 7α-HCO trước và sau phẫu thuật. Giả thuyết không: δ = 0, không có sự thay đổi. Giả thuyết đối: δ ≠ 0, có sự thay đổi có ý nghĩa. Sử dụng kiểm định hai đuôi vì quan tâm cả tăng và giảm. Giả sử sự khác biệt d có phân phối chuẩn. Phép kiểm t ghép cặp với phân phối Student(50) là phù hợp.
3.2. Tính toán giá trị thống kê t
Công thức: t = (d̄ - 0) / (sd/√n). Thay số: t = 21.22 / (26.68/√51) = 5.68. Giá trị ngưỡng với α = 0.01 và df = 50 là 2.682. Giá trị t = 5.68 vượt xa ngưỡng 2.682. Khoảng tin cậy 99% không chứa giá trị 0.
3.3. Kết luận nghiên cứu lâm sàng
Vì t > 2.682, bác bỏ giả thuyết không. Lượng 7α-HCO thực sự khác biệt trước và sau phẫu thuật. Sự khác biệt này có ý nghĩa thống kê ở mức 0.01. Giá trị p-value rất nhỏ, củng cố kết luận. Phẫu thuật cắt túi mật có ảnh hưởng đến chỉ số này.
IV. Xử lý khi vi phạm điều kiện phân phối chuẩn
Dữ liệu không phải lúc nào cũng thỏa mãn phân phối chuẩn. Phương pháp hoán chuyển dữ liệu là giải pháp đầu tiên. Hàm logarithm tự nhiên (ln) thường được sử dụng trong y học. Hàm căn bậc hai hữu ích khi logarithm làm lệch quá mức. Khi hoán chuyển không hiệu quả, kiểm định phi tham số là lựa chọn. Kiểm định Wilcoxon (Mann-Whitney) thay thế cho t-test. Phương pháp này không yêu cầu giả định phân phối chuẩn. Kiểm định chi bình phương áp dụng cho dữ liệu phân loại.
4.1. Phương pháp hoán chuyển dữ liệu
Hoán chuyển theo hàm ln (cơ số e) phổ biến nhất. Phương pháp này hiệu quả với dữ liệu lệch phải. Hoán chuyển theo căn bậc hai cho phân phối lệch vừa phải. Sau hoán chuyển, kiểm tra lại tính chuẩn của dữ liệu. Nếu thỏa mãn, tiếp tục với kiểm định t-test thông thường.
4.2. Kiểm định phi tham số Wilcoxon
Áp dụng khi tất cả phương pháp hoán chuyển thất bại. Kiểm định Wilcoxon dựa trên thứ hạng thay vì giá trị. Phù hợp cho so sánh ghép cặp không có phân phối chuẩn. Mann-Whitney là biến thể cho hai nhóm độc lập. Không yêu cầu giả định về phân phối dữ liệu.
4.3. Xử lý khi phương sai không đồng nhất
Thu thập dữ liệu có cỡ mẫu bằng nhau trong hai nhóm. Điều này giảm ảnh hưởng của phương sai không đồng nhất. Kiểm định ANOVA có thể áp dụng cho nhiều nhóm. Kiểm tra đồng nhất phương sai trước khi kiểm định. Sử dụng kiểm định Levene hoặc Bartlett để kiểm tra.
V. So sánh phương pháp giữa các giáo trình
Ba giáo trình có cách tiếp cận khác nhau về kiểm định. Giáo trình VI và F giả định dữ liệu sẵn có. Giáo trình A đề cập đến quá trình thu thập dữ liệu. Cả ba đều phân biệt kiểm định một phía hai phía. Với n ≥ 30, VI và F sử dụng kiểm định z. Giáo trình A ưu tiên kiểm định t với phân phối Student. Sự khác biệt này phản ánh quan điểm giảng dạy khác nhau. Giáo trình A chi tiết hơn về điều kiện áp dụng.
5.1. Lựa chọn phép kiểm theo cỡ mẫu
VI và F: n ≥ 30 dùng kiểm định z, n < 30 dùng t-test. Giáo trình A: luôn sử dụng kiểm định t với phân phối Student. Phương pháp của A nhất quán hơn trong thực hành. Không cần phân biệt ngưỡng cỡ mẫu 30. Phân phối Student tiệm cận phân phối chuẩn khi n lớn.
5.2. Kiểm tra điều kiện trước khi kiểm định
Giáo trình A có phần riêng về kiểm tra điều kiện. VI và F đề cập nhưng không chi tiết trong ví dụ. Kiểm tra phân phối chuẩn trước khi áp dụng t-test. Đánh giá tính đồng nhất phương sai giữa các nhóm. Xác nhận tính độc lập của các quan sát.
5.3. Phương pháp xử lý vi phạm giả định
VI không trình bày cách xử lý khi vi phạm điều kiện. F và A đều đề xuất hoán chuyển dữ liệu hoặc phi tham số. Giáo trình A chi tiết về các loại hoán chuyển khác nhau. Cung cấp hướng dẫn khi nào dùng ln, khi nào dùng căn. Giới thiệu kiểm định Wilcoxon như phương án cuối cùng.
VI. Vai trò phân phối chuẩn trong kiểm định
Phân phối chuẩn là nền tảng của suy diễn thống kê. Định lý giới hạn trung tâm giải thích tầm quan trọng này. Ứng dụng trong xác suất bao gồm xấp xỉ phân phối nhị thức. Trong thống kê, phân phối chuẩn hỗ trợ ước lượng khoảng tin cậy. Kiểm định giả thuyết thống kê dựa trên giả định này. Khi dữ liệu không có phân phối chuẩn, kết quả có thể sai lệch. Việc kiểm tra và xử lý vi phạm là bắt buộc. Phương pháp thay thế cần được cân nhắc kỹ lưỡng.
6.1. Ứng dụng trong ước lượng khoảng
Khoảng tin cậy dựa trên phân phối chuẩn của ước lượng. Độ tin cậy 95% là chuẩn mực trong nghiên cứu y học. Công thức khoảng tin cậy sử dụng giá trị z hoặc t. Phân phối Student điều chỉnh cho cỡ mẫu nhỏ. Khoảng tin cậy hẹp hơn khi cỡ mẫu tăng.
6.2. Định lý giới hạn trung tâm
Trung bình mẫu tiệm cận phân phối chuẩn khi n lớn. Điều này đúng bất kể phân phối gốc của dữ liệu. Giải thích tại sao kiểm định z áp dụng với n ≥ 30. Cơ sở toán học cho hầu hết phương pháp thống kê. Kết nối giữa xác suất và thống kê suy diễn.
6.3. Kiểm tra và xử lý trong thực hành
Cả ba giáo trình đều yêu cầu phân phối chuẩn. Trong ví dụ và bài tập, kiểm tra không được nhấn mạnh. Câu hỏi về xử lý vi phạm không được đặt ra trong lý thuyết. Thực hành cần kiểm tra bằng biểu đồ hoặc kiểm định Shapiro-Wilk. Phương pháp xử lý phải được tích hợp vào quy trình chuẩn.
Tải xuống file đầy đủ để xem toàn bộ nội dung
Tải đầy đủ (157 trang)Câu hỏi thường gặp
Phương pháp dạy học xác suất thống kê tại đại học y. Luận án tiến sĩ phân tích kỹ thuật kiểm định giả thuyết và xử lý dữ liệu trong thực tế giáo dục y khoa.
Luận án "Dạy học xác suất thống kê ở trường đại học y" thuộc chuyên ngành Xác suất thống kê. Danh mục: Phương Pháp Giảng Dạy.
Luận án "Dạy học xác suất thống kê ở trường đại học y" có 157 trang. Bạn có thể xem trước một phần tài liệu ngay trên trang web trước khi tải về.
Để tải luận án về máy, bạn nhấn nút "Tải xuống ngay" trên trang này, sau đó hoàn tất thanh toán phí lưu trữ. File sẽ được tải xuống ngay sau khi thanh toán thành công. Hỗ trợ qua Zalo: 0559 297 239.