ANOVA test
So sánh ≥ 3 giá trị trung bình của các nhóm độc lập
Điều kiện:
- Biến số kiểm định có phân bố chuẩn - Phương sai đồng nhất giữa các nhóm
Analyze -> Compare Means -> One-Way ANOVA
(Đánh dấu hộp Option: Homogeneity of variance test để kiểm định tính đồng nhất của phương sai)
43 trang |
Chia sẻ: Chử Khang | Ngày: 29/03/2025 | Lượt xem: 29 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Thống kê cơ bản và phân tích số liệu y tế, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
THỐNG KÊ CƠ BẢN
VÀ PHÂN TÍCH SỐ
LIỆU Y TẾ
ThS. Đỗ Thanh Toàn
BM Thống kê, Tin học Y học
Mục tiêu học tập
Sau bài häc, sinh viªn cã kh¶ n¨ng:
1. Trình bày được một số khái niệm cơ bản về
thống kê và phân tích số liệu
2. Trình bày và áp dụng được nguyên tắc lựa
chọn trắc nghiệm thống kê cho các mục tiêu
phân tích và biến số
3. Trình bày và áp dụng được nguyên tắc phiên
giải được kết quả phân tích số liệu
4. Lập được các bảng, biểu đồ cho dự kiến phân
tích số liệu cho đề cương NC nhóm
thèng kª lµ g×?
Lµ m«n khoa häc liªn quan ®Õn:
thu thËp
tæ chøc
tãm t¾t vµ
ph©n tÝch sè liÖu
nh»m ®ưa ra c¸c suy luËn vÒ toµn bé hay mét
phÇn quÇn thÓ nghiªn cøu.
Thống kê y sinh học
Thống kê y sinh học là 1 cụm từ bao gồm “y
sinh” và “thống kê”. Y sinh có nghĩa là cuộc
sống, còn thống kê liên quan đến thu thập, tổ
chức, phân tích và phiên giải các SL.
Thống kê y sinh học liên quan đến ứng dụng
các phương pháp TK vào KH cuộc sống như
sinh học, y học và y tế công cộng.
Thống kê có ý nghĩa khác nhau trong các
ngữ cảnh khác nhau. VD: TK YTCC, TK bệnh
viện, TK dân số, TK các dịch vụ, vvv.
SỐ LIỆU
Là kết quả “quan sát” được trên từng cá thể
(hay từng đối tượng nghiên cứu)
Ví dụ: Quan sát hộ gia đình:
Số người trong hộ: 8 (4 nam, 4 nữ)
Số trẻ dưới 5 tuổi: 2
Nguồn nước: nước giếng khoan
Loại nhà ở: kiên cố
Thu nhập bình quân: 1 triệu/tháng
SỐ LIỆU
Loại số liệu - Nguồn số liệu
– Số liệu ban đầu: Do tự thu thập
Qua điều tra
Nghiên cứu thử nghiệm
– Số liệu có sẵn: Do người khác thu thập
Từ kết quả của các nghiên cứu khác
Từ báo cáo, sổ sách, hồ sơ, bệnh án,
BIẾN SỐ
Là các đặc điểm có thể quan sát được
Biến định tính:
Ví dụ: dân tộc, giới tính, nghề nghiệp,...
Biến định lượng (biến dạng số):
– Biến liên tục: chiều cao theo cm, cân nặng
theo kg
– Biến rời rạc: số bệnh nhân đến khám trong
một ngày, số giường bệnh, số trứng giun
trong tiêu bản,...
T«i c©n
nÆng bao
nhiªu?
NhiÖt ®é b×nh
níc nh thÕ
nµo?
Lưîng thøc ¨n
m×nh nhËn TB
1 ngµy lµ bao
nhiªu?
T«i cã ®Ñp
trai kh«ng?
T«i ¨n mÊy
b÷a mét ngµy
QUẦN THỂ VÀ MẪU NGHIÊN CỨU
Quần thể: Tập hợp toàn bộ các cá thể mµ
chóng ta quan t©m ë mét khÝa c¹nh nµo
®ã trong mét kho¶ng thêi gian nhÊt ®Þnh
Mẫu: Phần được chọn ra để đo lường,
quan sát được gọi là mẫu
Chän mÉu
QuÇn thÓ víi cì N
MÉu víi cì n
p
s
P
X
Có hai lĩnh vực chính của thống kê
Thống kê mô tả
• Các con số, vấn đề được mô tả dựa trên các
giá trị thống kê như: trung bình, trung vị,
mode, tổng số, khoảng, độ lệch chuẩn, tỉ lệ, ...
• Trình bày các kết quả dựa trên các bảng biểu
và đồ thị.
Thống kê suy luận
• Dựa trên các con số từ một mẫu để cung cấp
các giá trị khái quát, suy luận về quần thể.
QuÇn thÓ ®Ých
QuÇn thÓ
nghiªn cøu
MÉu
Tham sè quÇn thÓ
(, , P...)MÉu x¸c suÊt
- NgÉu nhiªn ®¬n
- NgÉu nhiªn hÖ thèng
- MÉu ph©n tÇng
- MÉu chïm
- MÉu nhiÒu bËc
MÉu kh«ng x¸c suÊt
- MÉu kinh nghiÖm
- MÉu thuËn tiÖn
- MÉu chØ tiªu
- MÉu cã môc ®Ých.
Chän
mÉu
¦íc lîng
®iÓm
kho¶ng
KiÓm ®Þnh
gi¶ thuyÕt
Suy luËn
th«ng kª
(ChØ ¸p
dông cho
mÉu x¸c
suÊt víi
cì mÉu
®ñ lín)
KÕt luËn ngo¹i suy
- Khung chän mÉu
- §¬n vÞ quan s¸t
- §¬n vÞ mÉu
- C¸c chØ sè
C¸c test
thèng kª
Gi¸ trÞ p
Lùa chän
M« t¶ c¸c tham sè mÉu
(tr×nh bµy kÕt qu¶ nghiªn có)
Tham sè mÉu
( , s, p...)XBiÕn sè
Thống kê
Mô tả
biến
định
lượng
Mô tả
biến định
tính
Suy luận
biến định
lượng
Suy luận
biến
định tính
Thống kê mô tả biến định lượng
Đo lường độ tập trung
– Trung bình (mean)
– Trung vị (median)
– Mode
Đo lường độ phân tán
– Khoảng số liệu (range)
– Khoảng tứ phân vị (25%-75%) (Interquartile )
– Độ lệch chuẩn (Standard deviation)
– Phương sai (Variance)
DTT - Tong hop so lieu 14
1. Tổng hợp và mô tả số liệu định lượng
DTT - Tong hop so lieu 15
Đo lường độ phân tán
Thống kê mô tả biến định tính
Tần số: Số lần xuất hiện của một quan sát
Tỷ số: Là phân số mà mẫu số không bao
hàm tử số
Tỷ lệ phần trăm: Là phân số mà mẫu số
bao hàm tử số
Tỷ suất: dạng đặc biệt của tỷ lệ khi được
đo lường trong một khoảng thời gian nhất
định
Thực hành
Mở file ivf2.sav
Màn hình data view: màn hình số liệu
Màn hình variable view: xem tên biến số và
giải thích của biến số
Thực hiện thống kê mô tả: biến định lượng
Analyze -> Descriptive Statistic -> Descriptive
Kiểm tra phân bố số liệu
Thực hiện thống kê mô tả: biến định tính
Analyze -> Descriptive Statistic -> Crosstab
Thống kê suy luận
Là quá trình ngoại suy kết quả nghiên cứu
từ mẫu ra quần thể nghiên cứu:
– Ước lượng khoảng
– Kiểm định giả thuyết
Các tham số mẫu và tham số quần thể
Các tiêu thức Tham số
quần thể
Tham số
mẫu
Trung binh sè häc (mean) μ
Phư¬ng sai (variance) σ2 s2
Đé lÖch chuÈn (standard
deviation
σ s
Tû lÖ (proportion) P p
Sù kh¸c nhau giữa 2 gi¸ trÞ
trung bình
μ1 – μ2
- Sù kh¸c nhau giữa 2 tû lÖ P1 – P2 p1 – p2
X
X X1 2
Ước lượng khoảng-khoảng tin cậy
(confidence interval)
Thường chọn khoảng tin cậy 95%
(95%CI)
Khi thực hiện đo đạc 100 lần thì it nhất 95
lần kết quả nằm trong khoảng tin cậy
95% tin tưởng rằng giá trị thực của quần
thể nằm trong khoảng tin cậy
95%CI= Trung bình ± 1,96*sai số chuẩn
Ước lượng khoảng-khoảng tin cậy
(confidence interval)
Confidence interval Multiplying factor
90 1.64
95 1.96
99 2.58
99.9 3.29
Sai số chuẩn (standard errors)
95%CI= Trung bình ± 1,96*sai số chuẩn
Thực hành (ivf2.sav)
Thực hiện ước lượng khoảng cho giá trị
trung bình
Analyze -> Descriptive Statistic -> Explore
Kiểm định giả thuyết
Sử dụng trắc nghiệm (test) thống kê để đưa ra
kết luận về giả thuyết của nhà nghiên cứu là
chấp nhận được hay không
Quần thể
Mẫu NC
Chọn mẫu Ngoại suy Trắc nghiệm thống kê
Giả thuyết nghiên cứu
Giả thuyết Ho: Không có sự khác biệt
Giả thuyết Ha: Có sự khác biệt
Các loại sai lầm trong kiểm định
Loại quyết
định
Thực tế
Ho đúng Ho sai
Chấp nhận Ho x Sai lầm loại II
(β)
Bác bỏ Ho Sai lầm loại I
(α)
x
Mức ý nghĩa thống kê
Loại bỏ sai lầm loại I
– α= 0.05
– p = probability= Xác suất để giả thuyết Ho đúng
p<0.05
= Xác suất để giả thuyết Ho đúng là < 5%
= Ho xảy ra chỉ là may rủi
= Bác bỏ Ho
= Xác suất để giả thuyết Ha đúng là > 95%
= Ha xảy ra là chắc chắn
= Chấp nhận Ha
p>0.05 = ???
Mức ý nghĩa thống kê
α Z(1-α/2)
.01 (99) 2.576
.02(98) 2.326
.05 (95) 1.960
.10 (90) 1.645
Độ mạnh
Loại bỏ sai lầm loại II
– 1- β = 80%
– Thường dùng trong tính toán cỡ mẫu
1-β Z(1-β)
.80 0.842
.85 1.036
.90 1.282
.95 1.645
Lựa chọn trắc nghiệm thống kê
Mục tiêu của nghiên cứu?
So sánh:
– Các giá trị trung bình
– Các tỷ lệ
Tìm mối liên quan giữa các biến NC:
– Giữa hai biến:
...
– Giữa nhiều biến
...
Xác định sự khác biệt
hai biến định lượng
1 nhóm
Phân bố
chuẩn
t test ANOVA
(ph.s
ai
đ.nhấ
t)
Mann-
Whitney
test
Kruskal-
Wallis
test
2 nhóm >2 nhóm
Phân bố
K chuẩn
Phân bố
chuẩn
Phân bố
K chuẩn
Phân bố
chuẩn
Phân bố
K chuẩn
Sign test/
Wilcoxon
test
t test
(Ph sai
đ.nh
ất)
T test (Student t test)
Sử dụng cho số liệu định lượng, có phân bố chuẩn
So sánh sự khác biệt về giá trị trung bình của một hoặc hai
nhóm độc lập
Lệnh trên SPSS:
• So sánh một nhóm độc lập:
Analyze -> Compare Means -> One-Sample T test
• So sánh hai nhóm độc lập
Analyze -> Compare Means -> Independent-
Samples T test
Mann-Whitney test
Sử dụng cho so sánh 2 giá trị trung bình
của các nhóm độc lập, số liệu là phân bố
không chuẩn hoặc chuẩn
Analyze -> Nonparametric Tests -> 2 Independent
Samples
ANOVA test
So sánh 3 giá trị trung bình của các nhóm
độc lập
Điều kiện:
- Biến số kiểm định có phân bố chuẩn
- Phương sai đồng nhất giữa các nhóm
Analyze -> Compare Means -> One-Way ANOVA
(Đánh dấu hộp Option: Homogeneity of variance
test để kiểm định tính đồng nhất của phương sai)
Kruskal Wallis Test
So sánh 3 giá trị trung bình của các
nhóm độc lập khi biến số kiểm định có
phân bố không chuẩn hoặc chuẩn
Analyze -> Nonparametric Tests -> K Independent
Samples
Xác định
sự khác
biệt biến
định tính
1 nhóm
Giá trị mong đợi ≥ 5
Khi bình phương Fisher’s exact test
> 1 nhóm
Giá trị mong đợi < 5
Z test
Z test
So sánh một tỷ lệ mẫu với một tỷ lệ lý
thuyết
Analyze -> Nonparametric Tests -> Binomial Test
Test Khi bình phương
So sánh hai hay nhiều tỷ lệ
Điều kiện: Dưới 20% số ô trong bảng có
tần số mong đợi (E) < 5 và không có ô nào
có tần số mong đợi <1
Analyze -> Descriptive Statistic -> Crosstab
Hoặc
Analyze -> Nonparametric Tests -> Chi-square Test
Xác định mối liên quan
Biến định lượng:
Hệ số tương quan (r)
pearson
spearman
Hồi quy tuyến tính
4. Biến định tính
Tỷ suất chênh (OR), nguy cơ tương đối (RR)
Hồi quy logistic
Tương quan của hai biến định lượng
Hệ số tương quan r
• Có giá trị từ -1 đến +1
Khi HSTQ > 0 => tương quan đồng biến
Khi HSTQ tương quan nghịch biến
Càng gần 1 => tương quan càng chặt
• Quy ước:
<0,3: tương quan yếu
>=0,3-0,5: tương quan TB
>=0,5-0,7: tương quan chặt chẽ
>=0,7: tương quan rất chặt chẽ
Tương quan của hai biến định lượng
Analyze -> Correlate -> Bivariate
• Chọn Pearson khi các biến tương quan là
phân bố chuẩn
• Chọn Spearman khi các biến tương quan
không tuân theo phân bố chuẩn
Tương quan của 2 biến định tính
Khi muốn tìm cường độ mối liên quan giữa hai
biến định tính=> có thể sử dụng:
– Nguy cơ tương đối: RR, hoặc
– Tỷ suất chênh: OR
Bệnh Không
bệnh
Tổng
Phơi nhiễm a b a+b
Không phơi nhiễm c d c+d
Tổng a+c b+d a+b+c+d
Công thức tính OR - RR
RR = Risk ratio = risk1/risk2
OR = Odds ratio = odds1/ odds2
RR/OR có thể:
– >1 Yếu tố nguy cơ
– =1 Không liên quan
– <1 Yếu tố bảo vệ
Analyze -> Descriptive Statistic -> Crosstab
=> Chọn Risk trong hộp Statistics
Các file đính kèm theo tài liệu này:
bai_giang_thong_ke_co_ban_va_phan_tich_so_lieu_y_te.pdf