Mô hình cây quyết định
Việc ra quyết định y khoa nhằm giúp đánh giá một cá nhân có mắc một bệnh nào đó hay không. Nhưng đối với một bác sĩ lâm sàng, điều này là chưa đủ, mà cần phải ra xác định được phương pháp điều trị nào là tối ưu cho bệnh nhân này. Thí dụ, một bệnh nhân được chẩn đoán là có sỏi túi mật và người bác sĩ có phải quyết định sẽ xử trí bệnh nhân này như thế nào: phẫu thuật cắt bỏ túi mật hay điều trị bảo tồn.
Ðể chọn lựa được quyết định đúng đắn, chúng ta cần phải mô hình hoá các tình huống điều trị của bệnh nhân bằng kĩ thuật được gọi là cây quyết định (decision tree). Việc xây dựng bao gồm 5 bước sau:
Bước 1: Vẽ các nhánh
Cây quyết định bao gồm có nhiều nhánh thể hiện các tình huống có thể xảy ra ở bệnh nhân, và mỗi tình huống lại có thể diễn tiến theo các tình huống khác nhau nữa (được kí hiệu bằng các nhánh con). Thí dụ bệnh nhân bị sỏi túi mật có thể có hai tình huống: phẫu thuật túi mật hay điều trị bảo tồn (2 nhánh chính), việc điều trị bảo tồn lại có thể diễn tiến theo các tình huống: ổn định không triệu chứng, bị đau quặn mật, biến chứng nhiễm trùng, bị ung thư túi mật. Chúng ta có thể mô hình hoá các tình huống theo cây như sau (Hình 1).
Bước 2: Vẽ các nút
Tuy nhiên cách xảy ra các tình huống (các nhánh) không hoàn toàn giống nhau: có một số tình huống có thể quyết định bởi bác sĩ (thí dụ như nên phẫu thuật hay chờ đợi) và có một số tình huống không thể quyết định bởi con người (thí dụ như nếu chờ thì xảy ra các tình huống, ổn định không triệu chứng, đau quặn mật, biến chứng nhiễm trùng hay ung thư, và các tình huống này không thể lựa chọn được). Ðiểm xuất phát của các tình huống được quyết định bởi bác sĩ được gọi là nút quyết định và được kí hiệu bằng hình vuông và điểm xuất phát các tình huống không thể chọn lựa được gọi là nút cơ hội và được kí hiệu bằng hình tròn. Trong lí thuyết xác suất mà chúng ta đã nghiên cứu, nút cơ hội chính là phép thử và các nhánh từ nút cơ hội chính là các biến cố.
8 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 536 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Giáo trình Thống kê y học - Ứng dụng xác suất trong ra quyết định chẩn đoán và điều trị, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ỨNG DỤNG XÁC SUẤT TRONG RA QUYẾT ÐỊNH CHẨN ÐOÁN VÀ ÐIỀU TRỊ
Mục tiêu
Sau khi nghiên cứu chủ đề học viên có khả năng:
1. Phân biệt được tính đúng và tính tin cậy của thủ thuật chẩn đoán.
2. Trình bày 4 đo lường phản ánh tính đúng của một thủ thuật chẩn đoán định tính: tính nhạy cảm, tính chuyên biệt, giá trị tiên đoán dương, giá trị tiên đoán âm.
3. Khi được cung cấp 2 đo lường tính giá trị của thủ thuật chẩn đoán và tỉ lệ hiện mắc trong dân số, xác định được các đo lường thể hiện tính giá trị còn lại.
4. Dựa trên mô tả các tình huống của một bệnh, xây dựng cây quyết định của bệnh đó.
5. Dựa trên cây quyết định có xác suất của các nhánh cơ hội và kì vọng ở nhánh tận, chọn lựa được điều trị tối ưu.
1. Mở đầu
Một số vấn đề của y khoa, như đánh giá mức độ chính xác của một thủ thuật chẩn đoán, lí giải kết quả âm tính hay dương tính của kết quả xét nghiệm trên một bệnh nhân chuyên biệt, mô hình hoá tình huống của một bệnh nhân hay chọn lựa phương pháp điều trị thích hợp, có thể được phân tích bằng cách sử dụng lí thuyết xác suất.
Việc ứng dụng lí thuyết xác suất trong phân tích y khoa (còn gọi là ra quyết định trong y khoa) hiện nay đang được sử dụng rộng rãi và có chiều hướng phát triển. Một tổng quan cho thấy có tới 7% bài báo về ngoại khoa hay y khoa gia đình sử dụng những phương pháp này và người ta càng ngày càng sử dụng nhiều trong việc đánh giá các kĩ thuật chẩn đoán mới, chọn lựa kĩ thuật chẩn đoán có tính hiệu quả trên chi phí hay chọn lựa các giải pháp điều trị có hiệu quả trên chi phí cho bẹnh nhân. Những bác sĩ lâm sàng cũng cần phải hiểu những nguyên lí cơ bản của nội dung này để có thể chăm sóc cho bệnh nhân của mình tốt hơn hay ứng dụng những kiến thức thu lượm được trên các tạp chí chuyên ngành vào thực hành y khoa.
2. Ðo lường tính đúng (accuracy) của một thủ thuật chẩn đoán
Một phép đo lường được gọi là đúng nếu nó phản ánh chân thật giá trị nó muốn đo lường.
Thí dụ: Một đối tượng có cân nặng thực sự là 60 kg. Ðiều tra viên A cân đối tượng đó và ghi nhận kết quả là 60 kg. Ðiều tra viên B cân đối tượng đó và ghi nhận kết quả là 50 kg. Ta nói phép cân do điều tra viên A thực hiện là đúng và phép cân do điều tra viên B thực hiện là không đúng.
Thí dụ: Một đối tượng không bị nhiễm HIV. Nếu một xét nghiệm HIV trên đối tượng đó ra kết quả dương tính thì xét nghiệm đó là không đúng.
Một thủ thuật chẩn đoán được đánh giá tính đúng qua hai khía cạnh: Tính đúng của nó ở trên các đối tượng bị bệnh (được gọi là độ nhạy cảm) và tính đúng của nó ở trên các đối tượng không bị bệnh (được gọi là độ chuyên biệt).
Như vậy độ nhạy cảm là tỉ lệ dương tính trên những người bệnh (hay còn là xác suất kết quả xét nghiệm dương tính ở người bị bệnh)
Như vậy độ chuyên biệt là tỉ lệ âm tính trên những người không bệnh (hay còn là xác suất kết quả xét nghiệm âm tính ở người không bệnh)
Nếu chúng ta kí hiệu
T+ : kết quả xét nghiệm dương
T- : kết quả xét nghiệm âm
D+: người bị bệnh
D -: người không bị bệnh
Thì độ nhạy cảm = P(T+ | D+)
và độ chuyên biệt = P(T-|D-)
3. Ra quyết định y khoa
Trước khi một xét nghiệm đưa vào sử dụng, nhà sản xuất cùng với các khoa học gia phải xác định tính đúng của xét nghiệm đó và công bố độ nhạy cảm và độ chuyên biệt của xét nghiệm. Tuy nhiên đối với một bác sĩ lâm sàng, những xác suất này không thực sự có nhiều ý nghĩa mà họ muốn biết
a. Nếu một bệnh nhân của họ nếu kết quả xét nghiệm là dương tính thì xác suất người này mắc bệnh là bao nhiêu. Xác suất này được kí hiệu là P(D+|T+) và còn được gọi là giá trị tiên đoán dương
b. Nếu một bệnh nhân của họ nếu kết quả xét nghiệm là âm tính thì xác suất người này thực sự không mắc bệnh là bao nhiêu. Xác suất này được kí hiệu là P(D-|T-) và còn được gọi là giá trị tiên đoán âm.
Một tình huống cụ thể mà trong đó người bác sĩ lâm sàng phải xác định giá trị tiên đoán dương có thể được minh hoạ trong thí dụ sau:
Một test elisa để chẩn đoán HIV được biết có độ nhạy cảm: P(T+| D+) = 99% và độ chuyên biệt: P(T-| D-) = 90%. Một phòng khám thai sử dụng test này để sàng lọc cho các phụ nữ đến khám tiền sản. Một phụ nữ được xét nghiệm với test Elisa này và có kết quả dương tính. Tính xác suất người phụ nữ thực sự bị nhiễm HIV (giả sử chúng ta biết rằng tỉ lệ hiện nhiễm HIV ở phụ nữ mang thai là là 1%).
Ðể tính được giá trị tiên đoán dương và giá trị tiên đoán âm, chúng ta cần phải sử dụng một vài thao tác tính toán. Có hai cách: phương pháp dựa theo tỉ lệ và phương pháp dựa theo xác suất.
Phương pháp dựa theo tỉ lệ
Chúng ta trở lại thí dụ trên và giả sử có tất cả 10.000 phụ nữ đến khám thai và được xét nghiệm với test Elisa này. Do tỉ lệ hiện nhiễm HIV là 1% chúng ta sẽ có 100 phụ nữ thực sự bị nhiễm HIV trong 10.000 phụ nữ này. Lập bảng 2 x 2 theo kết quả xét nghiệm và tình trạng nhiễm bệnh như sau:
Bảng 2. Bảng 2 x 2 theo kết quả xét nghiệm và tình trạng nhiễm HIV trên 10.000 phụ nữ khám tiền sản (với tỉ lệ hiện nhiễm là 1%).
Nhiễm HIV
Không nhiễm
Tổng số
Test +
Test -
Tổng số
100
9.900
10.000
Bởi vì độ nhạy cảm là 99% nên trong 100 người bị nhiễm sẽ có 100 x 99% = 99 người có kết quả dương tính. Bởi vì độ chuyên biệt là 90% nên trong 9.900 người không bị nhiễm sẽ có 9.900 x 90% = 8.910 người có kết quả âm tính. Thay các kết quả trên vào Bảng 2 ta được
Bảng 3. Bảng 2 x 2 theo kết quả xét nghiệm và tình trạng nhiễm HIV trên 10.000 phụ nữ khám tiền sản (với tỉ lệ hiện nhiễm là 1%).
Nhiễm HIV
Không nhiễm
Tổng số
Test +
99
Test -
8.910
Tổng số
100
9.900
10.000
Sử dụng phép toán số học, điền vào các ô còn trống ta được:
Bảng 4. Bảng 2 x 2 theo kết quả xét nghiệm và tình trạng nhiễm HIV trên 10.000 phụ nữ khám tiền sản (với tỉ lệ hiện nhiễm là 1%).
Nhiễm HIV
Không nhiễm
Tổng số
Test +
99
990
1.089
Test -
1
8.910
8.911
Tổng số
100
9.900
10.000
Như vậy giá trị tiên đoán dương = P (D+|T+) = 99/1089 = 0,09 = 9%
Như vậy, trong thí dụ trên, một người phụ nữ mang thai nếu kết quả xét nghiệm là dương tính thì xác suất người này bị nhiễm HIV thực sự chỉ thấp có 9%.
Từ thí dụ này chúng ta có thể rút ra một số kết luận:
a. Mặc dù test có thể có tính đúng khá cao (độ nhạy cảm là 99% và độ chuyên biệt là 90%) nhưng nếu thực hiện trên dân số có tỉ lệ hiện nhiễm thấp thì giá trị tiên đoán dương của test cũng thấp.
b. Trong dân số có tỉ lệ hiện nhiễm thấp, một kết quả xét nghiệm là chưa đủ bởi vì nó có giá trị tiên đoán dương thấp. Muốn chẩn đoán cần phải làm lại một xét nghiệm thuộc nhóm cơ chế khác.
Phương pháp dựa theo công thức xác suất toàn phần
Công thức xác suất toàn phần được trình bày ở công thức (1-9) có thể trình bày theo công thức sau:
P(A)=P(A và B) + P(A và không B)
Áp dụng vào các thủ thuật chẩn đoán ta có:
P(T+)=P(T+ và D+) + P(T+ và D-)
Hay để dễ nhớ, chúng ta có thể phát biểu công thức toàn phần dưới dạng sau: một người có kết quả xét nghiệm dương có thể người đó có xét nghiệm dương và có bệnh hay có xét nghiệm dương mà không bệnh .
Áp dụng công thức xác suất toàn phần ta được
Giá trị tiên đoán dương = P(D+|T+)
Với Prev: tỉ lệ mắc bệnh
Sens: độ nhạy cảm
và Spec: độ chuyên biệt.
Áp dụng công thức trên chúng ta cũng tính được giá trị tiên đoán dương là 9%.
Ngoài ra chúng ta có thể xác tính số chênh hậu nghiệm bằng số chênh tiền nghiệm nhân với độ nhạy cảm và chia cho 1 trừ độ chuyên biệt.
4. Mô hình cây quyết định
Việc ra quyết định y khoa nhằm giúp đánh giá một cá nhân có mắc một bệnh nào đó hay không. Nhưng đối với một bác sĩ lâm sàng, điều này là chưa đủ, mà cần phải ra xác định được phương pháp điều trị nào là tối ưu cho bệnh nhân này. Thí dụ, một bệnh nhân được chẩn đoán là có sỏi túi mật và người bác sĩ có phải quyết định sẽ xử trí bệnh nhân này như thế nào: phẫu thuật cắt bỏ túi mật hay điều trị bảo tồn.
Ðể chọn lựa được quyết định đúng đắn, chúng ta cần phải mô hình hoá các tình huống điều trị của bệnh nhân bằng kĩ thuật được gọi là cây quyết định (decision tree). Việc xây dựng bao gồm 5 bước sau:
Bước 1: Vẽ các nhánh
Cây quyết định bao gồm có nhiều nhánh thể hiện các tình huống có thể xảy ra ở bệnh nhân, và mỗi tình huống lại có thể diễn tiến theo các tình huống khác nhau nữa (được kí hiệu bằng các nhánh con). Thí dụ bệnh nhân bị sỏi túi mật có thể có hai tình huống: phẫu thuật túi mật hay điều trị bảo tồn (2 nhánh chính), việc điều trị bảo tồn lại có thể diễn tiến theo các tình huống: ổn định không triệu chứng, bị đau quặn mật, biến chứng nhiễm trùng, bị ung thư túi mật. Chúng ta có thể mô hình hoá các tình huống theo cây như sau (Hình 1).
Bước 2: Vẽ các nút
Tuy nhiên cách xảy ra các tình huống (các nhánh) không hoàn toàn giống nhau: có một số tình huống có thể quyết định bởi bác sĩ (thí dụ như nên phẫu thuật hay chờ đợi) và có một số tình huống không thể quyết định bởi con người (thí dụ như nếu chờ thì xảy ra các tình huống, ổn định không triệu chứng, đau quặn mật, biến chứng nhiễm trùng hay ung thư, và các tình huống này không thể lựa chọn được). Ðiểm xuất phát của các tình huống được quyết định bởi bác sĩ được gọi là nút quyết định và được kí hiệu bằng hình vuông và điểm xuất phát các tình huống không thể chọn lựa được gọi là nút cơ hội và được kí hiệu bằng hình tròn. Trong lí thuyết xác suất mà chúng ta đã nghiên cứu, nút cơ hội chính là phép thử và các nhánh từ nút cơ hội chính là các biến cố.
Phẫu thuật ngay
Biến chứng nhiễm trùng
Ung thư
Không triệu chứng
Ðau quặn mật
1.000
0.030
0.005
0.815
0.150
0.004
0.130
1.000
0.000
0.004
Chôø
Sỏi mật
Không triẹu chứng
Hình 1. Cây quyết định mô hình hoá các tình huống cho bệnh nhân bị sỏi túi mật không triệu chứng
Bước 3: Ghi nhận xác suất xảy ra các nhánh cơ hội
Trên mỗi nhánh từ nút cơ hội, chúng ta ghi nhận xác suất xảy ra tình huống đó. Thí dụ nếu điều trị bảo tồn và chờ đợi thì xác suất không có triệu chứng = P(không triệu chứng) = 0,815, P (đau quặn mật) = 0,150, P (nhiễm trùng) = 0,030, P(ung thư) = 0,005.
Bước 4: Gán biến số ngẫu nhiên cho các nhánh tận
Ở các nhánh tận (nhánh không chia ra nhánh nào khác) chúng ta gán cho các nhánh này các giá trị của biến số ngẫu nhiên. Trong thí dụ trên nếu chúng ta quan tâm đến tử vong thì chúng ta gán biến số ngẫu nhiên X là xác suất tử vong của các tình huống này.
Bước 5: Xác định vọng trị của các nhánh quyết định
Sau đó chúng ta hãy xác định vọng trị cho các nút chọn xuất phát từ nút quyết định theo công thức sau:
E(X)=X(e1)P(e1) + X(e2)P(e2) +...
5. Chọn lựa điều trị thích hợp
Sau khi chúng ta đã mô hình hóa các tình huống của bệnh nhân, chúng ta có thể chọn lựa điều trị thích hợp bằng cách so sánh xác suất xảy ra biến cố quan tâm. Chúng ta có thể thực hiện theo hai phương pháp:
Sử dụng công thức tính vọng trị
Chúng ta tính vọng trị của biến số X (tử vong) khi điều trị bảo tồn và khi điều trị phẫu thuật:
Điều trị phẫu thuật, vọng trị tử vong bằng 0,0040
Điều trị bảo tồn, vọng trị tử vong =
P(tử vong | không triệu chứng) ´ P(không triệu chứng) +
P (tử vong | đau quặn mật ) ´ P(đau quặn mật) +
X(tử vong | nhiễm trùng) ´ P(nhiễm trùng) +
X (tử vong | ung thư) ´ P(ung thư)
= 0,000 ´ 0,815 + 0,004 ´ 0,150 + 0,130 ´ 0,030 + 1,000 ´ 0,005
= 0,0000 + 0,0006 + 0,0039 + 0,0050 = 0,0095
Do vọng trị của biến X (tử vong) khi điều trị bảo tồn là 0,0095 cao hơn vọng trị của biến X khi phẫu thuật là 0,0040 nên chúng ta quyết định sẽ phẫu thuật cho bệnh nhân bị sỏi túi mật.
Lập luận như trên giúp chúng ta hiểu rõ bản chất của lời giải. Tuy nhiên khi cây quyết định quá phức tạp thì việc tính toán cần phải được hệ thống hoá để trở thành thuật toán. Khi đó, việc tính toán trở thành tự động và ít bị sai sót.
Sử dụng thuật toán
Để phân tích cây quyết định, người ta áp dụng quy tắc sau:
1. Gán tận cùng mỗi nhánh giá trị của nhánh đó (giá trị biến số ngẫu nhiên mà chúng ta quan tâm)
2. Ði ngược từ nhánh tận cùng lên trên, chúng ta ghi nhận vọng trị của nút cơ hội bằng tổng các tích số xác suất và vọng trị của nhánh xuất phát từ nút đó. Vọng trị của nút cơ hội cũng chính là vọng trị của nhánh đưa đến nút cơ hội đó.
3.Tiếp tục cho đến khi gập nút quyết định
4. So sánh kì vọng của các nhánh xuất phát từ nút chọn để ra quyết định.
Áp dụng vào thí dụ trên ta có các bước:
1. Ở nhánh tận cùng ghi nhận các vọng trị: nhánh không triệu chứng, vọng trị tử vong là 0,000, nhánh đau quặn mật, vọng trị tử vong là 0,004, nhánh nhiễm trùng của tử vong là 0,130, nhánh ung thư có vọng trị tử vong là 1,000.
2. Ở nhánh chờ, vọng trị tử vong của nhánh = vọng trị của nút chờ
= 0,000 ´ 0,815 + 0,004 ´ 0,150 + 0,130 ´ 0,030 + 1,000 ´ 0,005
= 0,0000 + 0,0006 + 0,0039 + 0,0050 = 0,0095
4. So sánh vọng trị của các nhánh xuất phát từ nút chọn để ra quyết định. Xuất phát từ nút quyết định gồm nhánh phẫu thuật với vọng trị tử vong là 0,004 và nhánh chờ với vọng trị tử vong là 0,0095. Do đó chúng ta quyết định phẫu thuật.
Ở trường hợp trên, chúng ta dùng xác suất tử vong làm biến số ngẫu nhiên quan tâm. Chúng ta cũng có thể sử dụng ích lợi (utility) của các nhánh tận cùng làm biến ngẫu nhiên quan tâm. Khi đó các bước lập luận cũng tương tự ngoại trừ nếu chúng ta chúng ta quan tâm đến lợi ích thì nhánh quyết định được chọn sẽ là nhánh có ích lợi cao nhất.
Bài tập
1. Tám mươi người được đánh giá tình trạng cường tuyến phó giáp trạng và nồng độ calci huyết tương. Kết quả được ghi nhận trong bảng 2 x 2.
Bảng 5. Nồng độ Calcium trong huyết thanh và tình trạng cường tuyến phó giáp ở 80 đối tượng
Cường tuyến phó giáp
Không cường tuyến phó giáp
Ca HT Cao
12
3
Ca HT bình thường
8
57
Hãy tính độ nhạy cảm, độ chuyên biệt , giá trị tiên đoán + và giá trị tiên đoán âm của xét nghiệm này.
2. Một người nghi ngờ bị bệnh D với P(D+) = 0,3 cho làm xét nghiệm T. Xét nghiệm T sẽ trả về kết quả dương tính (T+) hoặc âm tính (T-). Trong số những người (T+) chỉ có 80% là bị bệnh D; còn trong số những người T(-) có 90% không có bệnh này.
a. Khả năng người này xét nghiệm trả về là T+ là bao nhiêu?
b. Tính độ nhạy và độ chuyên của xét nghiệm T.
3. Một bệnh nhân nữ 45 tuổi được phát hiện phình mạch một cách tình cờ. Người này có hai lựa chọn: hoặc là phẫu thuật với các khả năng là tử vong, tàn tật hay thành công hoặc không phẫu thuật với các khả năng bị vỡ phình mạch hoặc không bị vỡ phình mạch. Cây quyết định cho bệnh nhân này được trình bày trong hình sau (giá trị ghi ở nhánh tận cùng là giá trị lợi ích của tình huống.):
Hãy lựa chọn giải pháp điều trị phụ hợp cho bệnh nhân này.
Bài giải
1. Ðộ nhạy cảm = P(T+|D+) = 12/20 = 60%
Ðộ chuyên biệt = P(T-|D-) = 57/60 = 95%
Giá trị tiên đoán + = P(D+|T+) = 12/15 = 80%
Giá trị tiên đoán - = P(D-|T-) = 57/65 = 88%
2.a Khả năng người này xét nghiệm trả về là T+ là bao nhiêu?
P(T+ và D+) = P(T+) x P(D+|T+) = 0,8 x P(T+)
P(T- và D+) = P(T-) x P(D+|T-) = [1-P(T+)] x [1-P(D-|T-) ] = [1-P(T+)] x 0,1 = 0,1 - 0,1 x P(T+)
P(D+)= P(T+ và D+) + P(T- và D+) = 0,8 x P(T+) + 0,1 - 0,1 x P(T+) = 0,7 x P(T+) + 0,1 = 0,3
P(T+)= 2/7
2.b Tính độ nhạy và độ chuyên của xét nghiệm T
Tính độ nhạy của xét nghiệm T
P(T+|D+) = P(D và T+)/P(D) = 0,8 x P(T+)/P(D+) = 0,8 x (2/7) / (3/10) = 0,8 x 2 x 10 / (7 x 3) = 16/21 = 76,2%
Tính độ chuyên của xét nghiệm T
P(T-|D-) = P(D - và T-)/P(D-) = P(T-) x P(D-|T-) /P(D-) = (5/7) x 0,9 / (7/10) = 0,9 x 5 x 10 / (7 x 7) = 45/49 = 91,8%
3. Việc phân tích cây vấn đề để lựa chọn quyết định điều trị thích hợp bao gồm:
1. Ở nhánh tận cùng vọng trị của nhánh là lợi ích của nhánh
2. Ði ngược từ nhánh tận cùng lên trên, chúng ta ghi nhận vọng trị của nhánh bằng tổng các tích số xác suất và vọng trị của các nhánh con của nó (vọng trị của nhánh = ( xác suất của nhánh con x vọng trị của nhánh con)
Ta được:
3.Tiếp tục cho đến khi gập nút chọn.
4. So sánh vọng trị của các nhánh xuất phát từ nút chọn để ra quyết định.
Như vậy chúng ta sẽ quyết định phải phẫu thuật phòng ngừa với vọng trị lợi ích là 96,5 tốt hơn vọng trị lợi ích của không phẫu thuật là 93,3
Các file đính kèm theo tài liệu này:
- giao_trinh_thong_ke_y_hoc_ung_dung_xac_suat_trong_ra_quyet_d.doc