Bài giảng Thống kê cơ bản và phân tích số liệu y tế

ANOVA test

So sánh ≥ 3 giá trị trung bình của các nhóm độc lập

Điều kiện:

- Biến số kiểm định có phân bố chuẩn - Phương sai đồng nhất giữa các nhóm

Analyze -> Compare Means -> One-Way ANOVA

(Đánh dấu hộp Option: Homogeneity of variance test để kiểm định tính đồng nhất của phương sai)

pdf43 trang | Chia sẻ: Chử Khang | Ngày: 29/03/2025 | Lượt xem: 29 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Thống kê cơ bản và phân tích số liệu y tế, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
THỐNG KÊ CƠ BẢN VÀ PHÂN TÍCH SỐ LIỆU Y TẾ ThS. Đỗ Thanh Toàn BM Thống kê, Tin học Y học Mục tiêu học tập Sau bài häc, sinh viªn cã kh¶ n¨ng: 1. Trình bày được một số khái niệm cơ bản về thống kê và phân tích số liệu 2. Trình bày và áp dụng được nguyên tắc lựa chọn trắc nghiệm thống kê cho các mục tiêu phân tích và biến số 3. Trình bày và áp dụng được nguyên tắc phiên giải được kết quả phân tích số liệu 4. Lập được các bảng, biểu đồ cho dự kiến phân tích số liệu cho đề cương NC nhóm thèng kª lµ g×? Lµ m«n khoa häc liªn quan ®Õn:  thu thËp  tæ chøc  tãm t¾t vµ  ph©n tÝch sè liÖu nh»m ®ưa ra c¸c suy luËn vÒ toµn bé hay mét phÇn quÇn thÓ nghiªn cøu. Thống kê y sinh học Thống kê y sinh học là 1 cụm từ bao gồm “y sinh” và “thống kê”. Y sinh có nghĩa là cuộc sống, còn thống kê liên quan đến thu thập, tổ chức, phân tích và phiên giải các SL. Thống kê y sinh học liên quan đến ứng dụng các phương pháp TK vào KH cuộc sống như sinh học, y học và y tế công cộng. Thống kê có ý nghĩa khác nhau trong các ngữ cảnh khác nhau. VD: TK YTCC, TK bệnh viện, TK dân số, TK các dịch vụ, vvv. SỐ LIỆU Là kết quả “quan sát” được trên từng cá thể (hay từng đối tượng nghiên cứu) Ví dụ: Quan sát hộ gia đình: Số người trong hộ: 8 (4 nam, 4 nữ) Số trẻ dưới 5 tuổi: 2 Nguồn nước: nước giếng khoan Loại nhà ở: kiên cố Thu nhập bình quân: 1 triệu/tháng SỐ LIỆU Loại số liệu - Nguồn số liệu – Số liệu ban đầu: Do tự thu thập Qua điều tra Nghiên cứu thử nghiệm – Số liệu có sẵn: Do người khác thu thập Từ kết quả của các nghiên cứu khác Từ báo cáo, sổ sách, hồ sơ, bệnh án, BIẾN SỐ Là các đặc điểm có thể quan sát được Biến định tính: Ví dụ: dân tộc, giới tính, nghề nghiệp,... Biến định lượng (biến dạng số): – Biến liên tục: chiều cao theo cm, cân nặng theo kg – Biến rời rạc: số bệnh nhân đến khám trong một ngày, số giường bệnh, số trứng giun trong tiêu bản,... T«i c©n nÆng bao nhiªu? NhiÖt ®é b×nh níc nh thÕ nµo? Lưîng thøc ¨n m×nh nhËn TB 1 ngµy lµ bao nhiªu? T«i cã ®Ñp trai kh«ng? T«i ¨n mÊy b÷a mét ngµy QUẦN THỂ VÀ MẪU NGHIÊN CỨU Quần thể: Tập hợp toàn bộ các cá thể mµ chóng ta quan t©m ë mét khÝa c¹nh nµo ®ã trong mét kho¶ng thêi gian nhÊt ®Þnh Mẫu: Phần được chọn ra để đo lường, quan sát được gọi là mẫu Chän mÉu QuÇn thÓ víi cì N MÉu víi cì n p s P   X Có hai lĩnh vực chính của thống kê Thống kê mô tả • Các con số, vấn đề được mô tả dựa trên các giá trị thống kê như: trung bình, trung vị, mode, tổng số, khoảng, độ lệch chuẩn, tỉ lệ, ... • Trình bày các kết quả dựa trên các bảng biểu và đồ thị. Thống kê suy luận • Dựa trên các con số từ một mẫu để cung cấp các giá trị khái quát, suy luận về quần thể. QuÇn thÓ ®Ých QuÇn thÓ nghiªn cøu MÉu Tham sè quÇn thÓ (, , P...)MÉu x¸c suÊt - NgÉu nhiªn ®¬n - NgÉu nhiªn hÖ thèng - MÉu ph©n tÇng - MÉu chïm - MÉu nhiÒu bËc MÉu kh«ng x¸c suÊt - MÉu kinh nghiÖm - MÉu thuËn tiÖn - MÉu chØ tiªu - MÉu cã môc ®Ých. Chän mÉu ¦íc lîng  ®iÓm  kho¶ng KiÓm ®Þnh gi¶ thuyÕt Suy luËn th«ng kª (ChØ ¸p dông cho mÉu x¸c suÊt víi cì mÉu ®ñ lín) KÕt luËn ngo¹i suy - Khung chän mÉu - §¬n vÞ quan s¸t - §¬n vÞ mÉu - C¸c chØ sè C¸c test thèng kª Gi¸ trÞ p Lùa chän M« t¶ c¸c tham sè mÉu (tr×nh bµy kÕt qu¶ nghiªn có) Tham sè mÉu ( , s, p...)XBiÕn sè Thống kê Mô tả biến định lượng Mô tả biến định tính Suy luận biến định lượng Suy luận biến định tính Thống kê mô tả biến định lượng Đo lường độ tập trung – Trung bình (mean) – Trung vị (median) – Mode Đo lường độ phân tán – Khoảng số liệu (range) – Khoảng tứ phân vị (25%-75%) (Interquartile ) – Độ lệch chuẩn (Standard deviation) – Phương sai (Variance) DTT - Tong hop so lieu 14 1. Tổng hợp và mô tả số liệu định lượng DTT - Tong hop so lieu 15 Đo lường độ phân tán Thống kê mô tả biến định tính Tần số: Số lần xuất hiện của một quan sát Tỷ số: Là phân số mà mẫu số không bao hàm tử số Tỷ lệ phần trăm: Là phân số mà mẫu số bao hàm tử số Tỷ suất: dạng đặc biệt của tỷ lệ khi được đo lường trong một khoảng thời gian nhất định Thực hành Mở file ivf2.sav Màn hình data view: màn hình số liệu Màn hình variable view: xem tên biến số và giải thích của biến số Thực hiện thống kê mô tả: biến định lượng  Analyze -> Descriptive Statistic -> Descriptive  Kiểm tra phân bố số liệu Thực hiện thống kê mô tả: biến định tính Analyze -> Descriptive Statistic -> Crosstab Thống kê suy luận Là quá trình ngoại suy kết quả nghiên cứu từ mẫu ra quần thể nghiên cứu: – Ước lượng khoảng – Kiểm định giả thuyết Các tham số mẫu và tham số quần thể Các tiêu thức Tham số quần thể Tham số mẫu Trung binh sè häc (mean) μ Phư¬ng sai (variance) σ2 s2 Đé lÖch chuÈn (standard deviation σ s Tû lÖ (proportion) P p Sù kh¸c nhau giữa 2 gi¸ trÞ trung bình μ1 – μ2 - Sù kh¸c nhau giữa 2 tû lÖ P1 – P2 p1 – p2 X X X1 2 Ước lượng khoảng-khoảng tin cậy (confidence interval) Thường chọn khoảng tin cậy 95% (95%CI) Khi thực hiện đo đạc 100 lần thì it nhất 95 lần kết quả nằm trong khoảng tin cậy 95% tin tưởng rằng giá trị thực của quần thể nằm trong khoảng tin cậy 95%CI= Trung bình ± 1,96*sai số chuẩn Ước lượng khoảng-khoảng tin cậy (confidence interval) Confidence interval Multiplying factor 90 1.64 95 1.96 99 2.58 99.9 3.29 Sai số chuẩn (standard errors) 95%CI= Trung bình ± 1,96*sai số chuẩn Thực hành (ivf2.sav) Thực hiện ước lượng khoảng cho giá trị trung bình Analyze -> Descriptive Statistic -> Explore Kiểm định giả thuyết Sử dụng trắc nghiệm (test) thống kê để đưa ra kết luận về giả thuyết của nhà nghiên cứu là chấp nhận được hay không Quần thể Mẫu NC Chọn mẫu Ngoại suy Trắc nghiệm thống kê Giả thuyết nghiên cứu Giả thuyết Ho: Không có sự khác biệt Giả thuyết Ha: Có sự khác biệt Các loại sai lầm trong kiểm định Loại quyết định Thực tế Ho đúng Ho sai Chấp nhận Ho x Sai lầm loại II (β) Bác bỏ Ho Sai lầm loại I (α) x Mức ý nghĩa thống kê Loại bỏ sai lầm loại I – α= 0.05 – p = probability= Xác suất để giả thuyết Ho đúng p<0.05 = Xác suất để giả thuyết Ho đúng là < 5% = Ho xảy ra chỉ là may rủi = Bác bỏ Ho = Xác suất để giả thuyết Ha đúng là > 95% = Ha xảy ra là chắc chắn = Chấp nhận Ha p>0.05 = ??? Mức ý nghĩa thống kê α Z(1-α/2) .01 (99) 2.576 .02(98) 2.326 .05 (95) 1.960 .10 (90) 1.645 Độ mạnh Loại bỏ sai lầm loại II – 1- β = 80% – Thường dùng trong tính toán cỡ mẫu 1-β Z(1-β) .80 0.842 .85 1.036 .90 1.282 .95 1.645 Lựa chọn trắc nghiệm thống kê Mục tiêu của nghiên cứu? So sánh: – Các giá trị trung bình – Các tỷ lệ Tìm mối liên quan giữa các biến NC: – Giữa hai biến: ... – Giữa nhiều biến ... Xác định sự khác biệt hai biến định lượng 1 nhóm Phân bố chuẩn t test ANOVA (ph.s ai đ.nhấ t) Mann- Whitney test Kruskal- Wallis test 2 nhóm >2 nhóm Phân bố K chuẩn Phân bố chuẩn Phân bố K chuẩn Phân bố chuẩn Phân bố K chuẩn Sign test/ Wilcoxon test t test (Ph sai đ.nh ất) T test (Student t test) Sử dụng cho số liệu định lượng, có phân bố chuẩn So sánh sự khác biệt về giá trị trung bình của một hoặc hai nhóm độc lập Lệnh trên SPSS: • So sánh một nhóm độc lập: Analyze -> Compare Means -> One-Sample T test • So sánh hai nhóm độc lập Analyze -> Compare Means -> Independent- Samples T test Mann-Whitney test Sử dụng cho so sánh 2 giá trị trung bình của các nhóm độc lập, số liệu là phân bố không chuẩn hoặc chuẩn Analyze -> Nonparametric Tests -> 2 Independent Samples ANOVA test So sánh  3 giá trị trung bình của các nhóm độc lập Điều kiện: - Biến số kiểm định có phân bố chuẩn - Phương sai đồng nhất giữa các nhóm Analyze -> Compare Means -> One-Way ANOVA (Đánh dấu hộp Option: Homogeneity of variance test để kiểm định tính đồng nhất của phương sai) Kruskal Wallis Test So sánh  3 giá trị trung bình của các nhóm độc lập khi biến số kiểm định có phân bố không chuẩn hoặc chuẩn Analyze -> Nonparametric Tests -> K Independent Samples Xác định sự khác biệt biến định tính 1 nhóm Giá trị mong đợi ≥ 5 Khi bình phương Fisher’s exact test > 1 nhóm Giá trị mong đợi < 5 Z test Z test So sánh một tỷ lệ mẫu với một tỷ lệ lý thuyết Analyze -> Nonparametric Tests -> Binomial Test Test Khi bình phương So sánh hai hay nhiều tỷ lệ Điều kiện: Dưới 20% số ô trong bảng có tần số mong đợi (E) < 5 và không có ô nào có tần số mong đợi <1 Analyze -> Descriptive Statistic -> Crosstab Hoặc Analyze -> Nonparametric Tests -> Chi-square Test Xác định mối liên quan Biến định lượng: Hệ số tương quan (r) pearson spearman Hồi quy tuyến tính 4. Biến định tính  Tỷ suất chênh (OR), nguy cơ tương đối (RR)  Hồi quy logistic Tương quan của hai biến định lượng Hệ số tương quan r • Có giá trị từ -1 đến +1 Khi HSTQ > 0 => tương quan đồng biến Khi HSTQ tương quan nghịch biến Càng gần 1 => tương quan càng chặt • Quy ước: <0,3: tương quan yếu >=0,3-0,5: tương quan TB >=0,5-0,7: tương quan chặt chẽ >=0,7: tương quan rất chặt chẽ Tương quan của hai biến định lượng Analyze -> Correlate -> Bivariate • Chọn Pearson khi các biến tương quan là phân bố chuẩn • Chọn Spearman khi các biến tương quan không tuân theo phân bố chuẩn Tương quan của 2 biến định tính Khi muốn tìm cường độ mối liên quan giữa hai biến định tính=> có thể sử dụng: – Nguy cơ tương đối: RR, hoặc – Tỷ suất chênh: OR Bệnh Không bệnh Tổng Phơi nhiễm a b a+b Không phơi nhiễm c d c+d Tổng a+c b+d a+b+c+d Công thức tính OR - RR RR = Risk ratio = risk1/risk2 OR = Odds ratio = odds1/ odds2 RR/OR có thể: – >1  Yếu tố nguy cơ – =1  Không liên quan – <1  Yếu tố bảo vệ Analyze -> Descriptive Statistic -> Crosstab => Chọn Risk trong hộp Statistics

Các file đính kèm theo tài liệu này:

  • pdfbai_giang_thong_ke_co_ban_va_phan_tich_so_lieu_y_te.pdf
Tài liệu liên quan