Mục lục
Lời nói đầu 1
Mục lục 2
Phụ lục 3
PHẦN 1:TỔNG QUAN VỀ VIỆC ỨNG DỤNG XỬ LÝ NGÔN TRONG THỰC TIỄN 4
1.1.Giới thiệu 4
1.2. Đặt vấn đề 5
1.2.1.Mục đích của đề tài 5.
1.2.2.Nội dung công việc 6
PHẦN 2:CƠ SỞ LÝ THUYẾT 7
2.1.Giao diện ngôn ngữ tự nhiên 7
2.1.1.Những ưu điểm của giao diện ngôn ngữ tự nhiên 10
2.1.2.Những nhược điểm của giao diện ngôn ngữ tự nhiên 11
2.2.Giao diện ngôn ngữ tự nhiên hạn chế 12
2.3.Kỹ thuật WYSIWYM editing 12
2.3.1.Các mô hình Editor 12
2.3.2.Kiến trúc WYSIWYM 15
2.3.3.Các thành phần cơ bản của một hệ thống WYSIWYM editing 17
PHẦN 3:HỆ THỐNG HỎI ĐÁP NGÔN NGỮ TỰ NHIÊN 19
3.1.Các hệ thống truy vấn cơ sở dữ liệu 19
3.2.Giới thiệu về một hệ thống CLEF 21
3.2.1. Ứng dụng của hệ thống 21
3.2.2. Kiến trúc của hệ thống 22
3.3.Giao diện CLEF 22
3.3.1.Chức năng và nhiệm vụ của giao diện CLEF 23
3.3.2.Mô hình hoá các văn bản trả lời 24
3.3.3.Cách thức tương tác giữa người dùng và giao diện CLEF 25
PHẦN 4:XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG GIAO DIỆN WYSIWYM 38
4.1.Phân tích thiết kế 38
4.1.1.Phân tích chức năng 38
4.1.2.Thiết kế cơ sở tri thức 40
4.1.2.1.Quan hệ ngữ nghĩa giữa các anchor(liên kết) 40
4.1.2.2.Thiết kế logic 51
4.2.Cài đặt chương trình mô phỏng 65
4.2.1.Công cụ ngôn ngữ 65
4.2.2.Mã hoá chương trình 68
PHẦN 5: ĐÁNH GIÁ KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN 94
5.1. Đánh giá kết quả 94
5.2.Hướng phát triển 95
Các tài liệu tham khảo 96
95 trang |
Chia sẻ: lethao | Lượt xem: 1609 | Lượt tải: 4
Bạn đang xem trước 20 trang tài liệu Đồ án Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
danh sách các member cùng kiểu chẳng hạn anchor( liên kết) some hospital sẽ chứa một danh sách tên các bệnh viện như bệnh viện Tràng An,bệnh viện Thanh Nhàn.vv…(trong trường hợp này chỉ giới hạn ở bốn bệnh viện ).
Hình 3.6:Tiến trình tương tác giữa người dùng và giao diện CLEF (trạng thái 5)
Khi ta lựa chọn tên một bệnh viện từ danh sách hiển thị mà pop-up menu liệt kê ví dụ bệnh viện Trang An thì anchor( liên kết) ban đầu đã kích hoạt danh sách trên sẽ được thay thế bởi tên bệnh viện như minh hoạ dưới đây :
Hình 3.7:Tiến trình tương tác giữa người dùng và giao diện CLEF (trạng thái 6)
Dễ nhận thấy tại vị trí cụm từ some hospital đã được thay thế bằng từ Trang An hospital.Các anchor đặc tả (features) được thay thế bằng khái niệm nằm trong danh sách của pop-up menu không có khả năng sinh ra anchor( liên kết) mới khi feedback text mới được hệ thống đưa ra,như vậy là các anchor( liên kết) đặc tả có một điểm chung là khả năng mở rộng “một cấp” tức là chỉ được thay thế một lần duy nhất.
Hình thức mở rộng các feedback text
Về thực chất quá trình giao diện CLEF sản sinh ra các feedback text là quá trình thay thế các anchor( liên kết) này thành nhiều anchor( liên kết) khác hoặc một giá trị cụ thể (khái niệm kết thúc quá trình thay thế các anchor( liên kết).Rõ ràng là trong quá trình này anchor( liên kết) ở vị trí hiện thời (current location) luôn nằm trong một tiến trình mở rộng theo kiểu phân cấp dạng cây vì các anchor( liên kết) tiếp theo sinh ra từ anchor( liên kết) này là một khái niệm mức chi tiết ,cụ thể (instance) hơn hoặc có liên quan về nội dung với anchor( liên kết) trước nó trong tiến trình mở rộng ví dụ trên đã chứng minh cho điều này vì Trang An hospital chính là một giá trị cụ thể (instance) của some hospital .Quá trình mở rộng của một anchor( liên kết) nằm trong một feedback text sẽ được tiến hành theo dạng đường đi trên một cây ngữ nghĩa như hình minh hoạ sau:
Hình 3.8: Minh hoạ quá trình mở rộng văn bản
Trên hình các anchor( liên kết) có màu xám.Nút gốc của cây sẽ là giá trị khởi tạo tại vị trí của anchor( liên kết) gốc tức là khái niệm ở mức khái quát cao nhất,các nút lá màu nâu là những giá trị cụ thể của các anchor( liên kết) đặc tả (features) còn nút cha của các nút lá chính là các anchor( liên kết) đặc tả.Các anchor( liên kết) khác là những anchor( liên kết) sự kiện vì các nút con của chúng là những anchor( liên kết) tiếp tục có khả năng tiếp tục được mở rộng.
Nhìn trên hình thì quá trình mở rộng theo chiều ngang được minh hoạ là từ một anchor( liên kết) (nút cha) cùng lúc sẽ sinh ra nhiều anchor( liên kết) (các nút con).Chữ AND thể hiện rằng và các nút con này sẽ cùng xuất hiện trong feedback mới để thay thế cho anchor( liên kết) nút cha với ý nghĩa này một anchor( liên kết) sự kiện được xem là một tổ hợp các anchor( liên kết) khác.Quá trình mở rộng theo chiều dọc được minh hoạ trên hình vẽ với ý nghĩa của các toán tử OR là từ một nút “cận lá” chỉ có khả năng thay thế bởi một trong các instance (tức là các nút lá có màu nâu) và các nút lá đều có cùng một kiểu ngữ nghĩa kế thừa nút cha của nó.Ví dụ Trang An hospital kế thừa nội dung ngữ nghĩa của anchor( liên kết) some hospital vì Trang An hospital là một bệnh viện cụ thể nó kế thừa mọi đặc tính của hospital và các khái niệm như Bach Mai hospital và Trang An hospital là những khái niệm có cùng một kiểu,do đó some hospital được gọi là anchor( liên kết) đặc tả (features).
Có một số đặc điểm đáng lưu ý là trong quá trình mở rộng các anchor( liên kết) có xuất hiện 2 loại anchor( liên kết) màu đỏ và màu xanh ,mục đích của việc đánh dấu như vậy nhằm chỉ thị cho người dùng về các thông tin mà anchor( liên kết) sẽ mở rộng.Màu đỏ thể hiện tính chất bắt buộc (olibigatory) ví dụ anchor( liên kết) some patient là một anchor( liên kết) có màu đỏ đòi hỏi người dùng phải lựa chọn để xác định xem bệnh nhân mà người dùng muốn đưa ra thông tin là người nào.Các anchor( liên kết) màu xanh thể hiện tính không bắt buộc (optional) người dùng có thể lựa chọn hoặc không lựa chọn.Ví đụ như anchor( liên kết) some day trong mục thông tin về ngày kết thúc việc điều trị thuốc có thể không cần lựa chọn vì rất có thể là việc này chưa kết thúc, ở thời điểm hiện tại bệnh nhân vẫn đang dùng thuốc.
Một đặc trưng quan trọng thể hiện bản chất của kỹ thuật WYSIWYM xử lý ngôn ngữ tự nhiên dựa trên ngữ nghĩa là ở chỗ mọi thao tác của người dùng đều được tự động chỉ thị bằng các nội dung phản hồi của hệ thống qua các feedback text và người dùng căn cứ vào ngữ nghĩa của nó mà thao tác.Ví dụ khi người dùng lựa chọn bệnh nhân tên là Vũ Minh Khoa thì họ tự hiểu người này là nam và trong mục giới tính họ phải chọn giới tính là male (nam).Trường hợp người dùng chọn nhầm là female(nữ) thì chương trình hỗ trợ toán tử cắt,họ có thể cắt lựa chọn vừa rồi,tại vị trí chọn nhầm sẽ trở lại trạng thái anchor( liên kết) như khi chưa lựa chọn.
Khi các anchor( liên kết) được mở rộng hết mức tức là đến nút lá thì các feedback text sẽ không còn khả năng mở rộng được nữa và nó sẽ không còn chứa các anchor( liên kết).Giao diện sẽ có dạng như sau
Hình 3.9:Tiến trình tương tác giữa người dùng và giao diện CLEF (trạng thái 7)
Hình trên mô tả tất cả những thông tin mà người dùng đã cung cấp cho hệ thống thông qua việc lựa chọn những nội dung có sẵn trong cơ sở tri thức mà hệ thống phản hồi lại (feedback) người dùng trong quá trình tương tác với hệ thống.Khi ta nhấn vào biểu tượng generate có hình bàn tay cầm cây bút viết trên frame ta sẽ có kết quả đầu ra ứng với trường hợp người dùng đã tương tác với giao diện trên là một cấu trúc có định dạng XML như sau:
Định dạng đầu ra của chương trình có thể rất khó hiểu đối với người dùng vì nó vẫn tồn tại ở dạng mã hoá tuy nhiên nhiệm vụ của chương trình mô phỏng này chưa phải là đưa ra cho người dùng những thông tin trả lời bằng ngôn ngữ tự nhiên mà là tạo ra đầu vào cho các module khác trong hệ thống CLEF đã trình bày ở trên.Các module đó sẽ thực hiện những chức năng còn lại.Phần đầu ra của chương trình minh hoạ đoạn cấu trúc tri thức (knowledge fragment) mà người dùng tạo ra trong quá trình tương tác với giao diện,cấu trúc này sẽ trở nên dễ hiểu khi nó được diễn giải trong quá trình phân tích thiết kế chương trình ở PHẦN 4.
PHẦN 4: XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG GIAO DIỆN WYSIWYM
Dẫn nhập :Phần này sẽ trình bày những nội dung về thiết kế kiến trúc của giao diện với cơ phản hồi ngôn ngữ tự nhiên bằng kỹ thuật WYSIWYM và cách thức cài đặt cụ thể bằng các công cụ lập trình để giao diện có thể hoạt động là phần thành quả công việc đạt được
4.1.Phân tích thiết kế
Phần phân tích thiết có mục đích diễn giải nội dung xây dựng một giao diện ngôn ngữ tự nhiên cần xác định xem hệ thống bao gồm những thành phần và bộ phận nào và các mối quan hệ giữa các bộ phận này ra sao.
4.1.1.Phân tích chức năng
Giao diện ngôn ngữ tự nhiên với cơ chế phản hồi sử dụng kỹ thuật WYSIWYM được gọi chung là giao diện WYSIWYM (WYSIWYM interface) là một sự kết hợp của giao diện dựa trên form và kỹ thuật xử lý ngôn ngữ tự nhiên do đó nó vừa có đặc tính của giao diện dạng form vừa có những thành phần tham gia xử lý ngôn ngữ tự nhiên mà cụ thể là theo kỹ thuật WYSIWYM -kỹ thuật xây dựng giao diện dựa trên tri thức (based knowledge).Do có những đặc tính trên mà giao diện WYSIWYM bao gồm 3 phần là thành phần giao diện người dùng API cung cấp các đặc trưng đồ hoạ của một giao diện đồ hoạ người dùng(Graphic user interface-GUI) thông dụng như menu,frame vv..và một thành phần khác là WYSIWYM engine dựa trên một Cơ sở tri thức (knowledge base) có nhiệm vụ sinh các feedback text (generates feedback text) dạng ngôn ngữ tự nhiên.
Hình 4.1: Tiến trình hoạt động của giao diện WYSIWYM
Trong sơ đồ trên giao diện người dùng được người dùng (Author) kích hoạt sinh ra một anchor( liên kết) khởi tạo từ anchor( liên kết) này người dùng sẽ lựa chọn tiếp tạo ra các tác động trên giao diện.Giao diện sẽ gửi các message tới bộ WYSIWYM engine,bộ sinh này sẽ tìm thông tin trong cơ sở tri thức rồi dựa trên các luật để sinh ra các feedback text trả về cho giao diện.Quá trình này lăp đi lặp lại cho đến khi người dùng dừng lại hoặc quá trình mở rộng các feedback text đã đạt hết mức.
Cụ thể ta sẽ xây dựng giao diện WYSIWYM áp dụng cho lĩnh vực chăm sóc điều trị bệnh nhân ung thư là giao diện CLEF đã giới thiệu ở PHẦN 3 như sau
4.1.2.Thiết kế cơ sở tri thức
4.1.2.1.Quan hệ ngữ nghĩa giữa các anchor( liên kết)
Như đã trình bày ở trên,quá trình “giao tiếp” giữa người dùng và hệ thống thông qua giao diện thực chất là quá trình mở rộng các feedback text thông qua các anchor( liên kết), đây là một tiến trình thay thế các anchor( liên kết) theo “chiều dọc” và theo chiều ngang,vì nội dung của các feedback text đều là những thông tin tri thức cụ thể liên quan đến các bệnh nhân nên sự thay thế của các anchor( liên kết) này phải căn cứ trên ngữ nghĩa tức là những tri thức về lĩnh vực bệnh ung thư ( cancer domain) mà nội dung của anchor( liên kết) đó thể hiện.Trước tiên để xây dựng được cơ sở tri thức phục vụ cho việc sinh các feedback text ta cần xác định các anchor( liên kết) đồng thời xây dựng tương quan ngữ nghĩa giữa các anchor( liên kết) tức là thiết kế tiến trình mở rộng feedback text.Căn cứ vào đó ta có thể thấy được nội dung của các anchor( liên kết) và thứ tự thay thế các anchor( liên kết) với nhau.Với ý nghĩa
Trước tiên ta bắt đầu với feedback text đầu tiên cũng là một anchor( liên kết) là some record.Từ anchor( liên kết) này trong tiến trình mở rộng sẽ xuất hiện các anchor( liên kết) khác có liên quan về mặt ngữ nghĩa với anchor( liên kết) này.Các quan hệ ngữ nghĩa được biểu diễn dưới dạng cây,vì có sáu feedback text được kích hoạt từ anchor( liên kết) đầu tiên là patient record nên sẽ có sáu cây mở rộng tương ứng với 6 feedback text như sau
1.Cây mở rộng tương ứng với feedback text xuất phát từ anchor( liên kết) some demographic (Cây số 1)
Some demographic record
Some patient
Some gender
and
2.Cây mở rộng tương ứng với feedback text xuất phát từ anchor( liên kết) some consult record (Cây số 2)
Consult record
Some patient
Some doctor
Some hospital
Some date
and
and
and
Some day
Some month
Some year
and
and
3.Cây mở rộng tương ứng với feedback text có xuất phát từ anchor( liên kết) some diagnosis record (Cây số 3)
Diagnosis record
Some patient
Some cancer
Some hospital
Some date
Some day
Some month
Some year
and
and
and
and
and
4.Cây mở rộng tương ứng với feedback text xuất phát từ anchor( liên kết) some medication record (Cây số 4)
Medication record
Some medication start event
Some medication stop event
Some patient
Some medication
Some date
Some medicine
Some weihght
Some frequency
Some day
Some month
Some year
and
and
and
and
and
and
and
and
and
5.Cây mở rộng tương ứng với feedback text xuất phát từ anchor( liên kết) some test result record (Cây số 5)
Some test result
Some patient
Some amount
Some substance
and
and
6.Cây mở rộng tương ứng với feedback text xuất phát từ anchor( liên kết) some care plan record (Cây số 6)
Some care plan
Some care plan discussion
Some care plan decision
Some type of tumor
Some team
Some date
Some type of care
Some day
Some month
Some year
and
and
and
and
and
Quá trình mô tả bởi các cây mở rộng là quá trình feedback text tăng thêm số lượng các anchor( liên kết) sau mỗi lần click chuột vì mỗi anchor( liên kết) được thay thế bởi một hoặc nhiều anchor( liên kết) khác tuy nhiên các feedback text này vẫn còn một bước mở rộng nữa tại các anchor( liên kết) đặc tả (feature) khi các anchor( liên kết) này không bị thay thế bởi các anchor( liên kết) khác mà được thay thế trực tiếp bởi giá trị cụ thể (instance) ví dụ anchor( liên kết) some year sẽ được thay bằng một năm cụ thể là 2006 chẳng hạn, đây là sự thay thế ở mức độ sâu hơn về mặt ngữ nghĩa.Ta cần chỉ ra những giá trị thay thế cho các anchor( liên kết) đặc tả (feature) đó là những nút màu nâu trên hình
Ta thấy rằng các nút lá trên 6 cây mở rộng là những anchor( liên kết) đặc tả (feature) sẽ được thay thế bằng các khái niệm cùng kiểu (same type) về mặt nội dung,tuy nhiên với mỗi anchor( liên kết) đặc tả (features) khác nhau sẽ có các giá trị thay thế nó khác nhau tuỳ theo nội dung của anchor( liên kết) đó.Vì có 13 anchor( liên kết) đặc tả khác nhau nên ta cũng có 13 kiểu giá trị (value type)thay thế khác nhau cho mỗi anchor( liên kết).Ví dụ với anchor( liên kết) some patient thì kiểu giá trị thay thế chỉ có thể là tên bệnh nhân Mỗi kiểu giá trị sẽ có một danh sách các giá trị cùng kiểu (chính là danh sách được liệt kê trong pop-up menu) để thế chỗ cho các anchor( liên kết) đặc điểm.Số lượng các giá trị trong danh sách được giới hạn tuỳ theo quy mô của cơ sở tri thức,trong nội dung của đồ án này chỉ đưa ra một số giá trị thay thế cho các loại anchor( liên kết),quan hệ giữa các anchor( liên kết) đặc tả và các giá trị này đuợc biểu diễn dưới dạng cây (tiếp tục quá trình mở rộng feedback text ở các cây đã nêu trên) và các cây này là những cây con của các cây trên làm thành cây mở rộng hoàn thiện cho toàn bộ quá trình mở rộng .Các cây có dạng như sau
Cây ứng với anchor( liên kết) đặc tả là some cancer được nối tiếp vào anchor( liên kết) some cancer của cây số 3
Some cancer
migraine
Ductal carcinoma in
adenocarcinoma
Invasive ductal carcinomal
Well diffenrentiated non hodgkins lymphoma
or
or
or
or
Quan hệ giữa các nút được biểu diễn bởi mũi tên hướng từ nút cha đến nút con thể hiện quan hệ ngữ nghĩa kế thừa nội dung của nút con từ nút cha.Ví dụ bệnh ung thư biểu mô Ductal carcinom là một bệnh ung thư tức là nó có mọi đặc điểm ngữ nghĩa của nút cha là bệnh ung thư (bệnh nhân có khối u,có thể di căn hoặc không di căn).
Cây ứng với anchor( liên kết) đặc tả là some patient được nối tiếp vào anchor( liên kết) some patient của các cây số 1,2,3,4,5.
Some patient
Vu Minh Khoa
Ngo Kieu Phuong
Ho Nhu Ngoc
or
or
Cây ứng với anchor( liên kết) đặc tả là some gender được nối tiếp vào anchor( liên kết) some gender của cây số 1
Some gender
male
female
unknow
or
or
Cây ứng với anchor( liên kết) đặc tả some hospital được nối tiếp vào anchor( liên kết) some hospital của các cây số 2 và số 3
Some hospital
Trang An hospital
Bach Mai hospital
Thanh Nhan hospital
Huu Nghi hospital
or
or
or
Cây tương ứng với anchor( liên kết) đặc tả some doctor được nối tiếp vào anchor( liên kết) some doctor của cây số 2
Some doctor
Dr. Ton That Tung
Dr. Pham Ngoc Thach
Dr.Le The Trung
Dr.Ho Dac Di
or
or
or
Cây tương ứng với anchor( liên kết) đặc tả some medicine được nối tiếp vào anchor( liên kết) some medicine của cây số 4
Some medicine
Armidex
Dexamethasone
chlorambucil
or
or
Cây tương ứng với anchor( liên kết) đặc tả some weight được nối tiếp vào anchor (liên kết) some weight của cây số 4
Some weight
1mg
2mg
5mg
3mg
or
or
or
4mg
or
Cây tương ứng với anchor( liên kết) đặc tả some frequency được nối tiếp vào anchor( liên kết) some frequency của cây số 4
Some frequency
One a day
Twice a day
or
Cây tương ứng với anchor( liên kết) đặc tả some amount được nối tiếp vào anchor( liên kết) some amount của cây số 5
Some amount
nomarl
high
excessive
low
or
or
or
Cây tương ứng với anchor( liên kết) đặc tả some substance được nối tiếp vào anchor (liên kết) some substance của cây số 5
Some substance
LFT
FBC
calcium
or
or
Cây tương ứng với anchor( liên kết) đặc tả some type of tumor được nối tiếp vào anchor( liên kết) some type of tumor của cây số 6
Some type of tumor
Recurrent tumor
Non-recurrent tumor
or
Cây tương ứng với anchor( liên kết) đặc tả some team được nối tiếp vào anchor( liên kết) some team của cây số 6
Some type of tumor
A multidisciplinary team
Cây tương ứng với anchor( liên kết) đặc tả some type of care được nối tiếp vào anchor( liên kết) some type of care của cây số 6
Some type of care
surgery
chemmotherapy
immunotherapy
Radiotherapy
or
or
or
Cây tương ứng với anchor( liên kết) đặc tả some day được nối tiếp vào anchor( jliên kết) some day của các cây số 2,3,4,6.
Some day
1st
3rd
2nd
or
or
jCây tương ứng với anchor( liên kết) đặc tả some month được nối tiếp vào anchor( liên kết) some month của các cây số 2,3,4,6.
January
or
February
May
August
March
June
September
December
October
April
November
July
Some month
or
or
or
or
or
or
or
or
or
or
jCây tương ứng với anchor( liên kết) đặc tả some year được nối tiếp vào anchor( liên kết) some year của các cây số 2,3,4,6.
Some year
2003
2002
2005
2004
or
or
or
2001
2006
or
or
4.1.2.2.Thiết kế logic
Trong phần trình bày ở trên mới cung cấp một khung nhìn người sử dụng (use case view)chỉ ra quá trình mở rộng của các feedback text tức là các hướng đi mà người dùng có thể tương tác với hệ thống qua giao diện.Tuy nhiên quá trình sản sinh ra các feedback text này được thực hiện bởi một WYSIWYM engine mà nội dung cơ bản của engine này một cơ sở tri thức (knowledge base) do đó phần sau đây sẽ đưa ra thiết kế chi tiết về Cơ sở tri thức cho giao diện CLEF cung cấp một khung nhìn thiết kế (logic view) đồng thời đi sâu vào chi tiết nội dung của kỹ thuật WYSIWYM editing
Như đã trình bày ở PHẦN 2 một cơ sở tri thức WYSIWYM bao gồm có 2 phần là
T(erminological)-box và A(serration)-box.
T-box định nghĩa các lớp (classes) mà các đối tượng (objects) phụ thuộc vào,trong T-box chúng ta sẽ chỉ ra (specify) một tập các khái niệm (a set of available concepts) và các thuộc tính (attributes) của chúng.T-box sẽ cung cấp một ontology quyết định (determines) phạm vi ngữ nghĩa của hệ thống (the semantic coverage of the system).
A-box chứa những nội dung tri thức cụ thể (actual knowledge) được tác động (edit) bởi người dùng,nó biểu diễn nội dung của một feedback text được sinh ra.
Cơ sở tri thức là một mạng ngữ nghĩa xây dựng trên phạm vi (range) mà T-box cho phép.Còn mỗi feedback text là một câu cụ thể tương ứng với một A-box vì A-box là một cấu trúc đặc tả (feature structure)biểu diễn quan hệ giữa các đối tưọng,các lớp đã chỉ ra trong T-box nên mỗi A-box là một phần (knowledge fragment) của cơ sở tri thức (knowledge base).
T-box sẽ cung cấp các lớp và các thuộc tính còn A-box sẽ tổ hợp chúng lại theo thứ tự nhất định tùy thuộc vào mối quan hệ giữa các đối tượng để tạo thành một câu sinh ra các feedback text.
Việc xây dựng các lớp của T-box và các cấu trúc của A-box sẽ được tiến hành từng bước căn cứ vào nội dung của các cây mở rộng đã trình bày ở phần trên tức là đầu tiên ta sẽ xác định các lớp các cấu trúc xuất phát rồi lần lượt bổ xung thêm các lớp mới vào T-box và các cấu trúc mới của A-box.
Trước tiên ta cần xác định nội dung của T-box để xác định phạm vi tri thức bao quát của lĩnh vực mà bài toán đề cập ở đây là tri thức về việc chăm sóc,chẩn đoán và điều trị bệnh ung thư.
a)Nội dung của T-box
Để xác định nội dung ngữ nghĩa của cho toàn bộ cơ sở tri thức, đầu tiên ta quy tất cả vào một khái niệm bao trùm cho toàn lĩnh vực một lớp gốc (superclass) là domain.Tất cả các lớp khác nằm trong T-box đều là các lớp con của domain vì đều nằm trong lĩnh vực này.Vì trong phạm vi của lĩnh vực (domain) của cơ sở tri thức là nói về hồ sơ của các bệnh nhân ung thư nên sẽ có các nhóm lớp ngữ nghĩa khác nhau là lớp con trực tiếp của domain được phân chia bao gồm 4 lớp
Lớp record xác định thông tin về hồ sơ bệnh nhân
Lớp event xác định các sự kiện xảy ra có liên quan tới bệnh nhân như chẩn đoán điều trị bệnh vv...
Lớp object xác định các loại đối tưọng như con người các loại bệnh,bệnh viện vv..
Lớp data xác định các dữ liệu cụ thể liên quan đến thông tin bệnh .
Ta biểu diễn phân nhóm các lớp ở dạng logic như sau
Domain (record,event,object,data)
Các lớp nằm trong dấu ngoặc là lớp con trực tiếp của lớp bên ngoài.Tiếp tục quá trình này với mức độ phân nhóm chi tiết cụ thể hơn.Căn cứ vào nội dung các cây mở rộng cho các feedback text ở trên ta sẽ xác định các lớp được xây dựng trong T-box như sau:
Lớp các record bản ghi diễn tả một mẫu thông tin chung về bệnh nhân theo một chủ đề nào đó có thể là chẩn đoán hoặc điều trị bệnh vv… bao gồm các loại hồ sơ bệnh như
Lớp demographic_record :thông tin về bệnh nhân như tên,giới tính
Lớp consult_record :thông tin khám bệnh xác định xem bệnh nhân được bác sĩ nào, ở bệnh viện nào khám bệnh và việc khám bệnh diễn ra vào thời gian nào
Lớp diagnosis_record:thông tin chẩn đoán bệnh xác định xem bệnh nhân được chẩn đoán mắc bệnh gì.
Lớp medication_record:thông tin về quá trình điều trị bằng thuốc của bệnh nhân
Lớp test result record:kết quả xét nghiệm của bệnh nhân
Lớp care record:thông tin về kế hoạch điều trị và chăm sóc bệnh nhân
record(patient_record,demographic_record,consult_record,diagnosis_record,medication_record,test_result_record,care_record).
Lớp các sự kiện (event) bao gồm
Lớp medication_event:Các sự kiện liên quan tới việc điều trị bằng thuốc cho bệnh nhân chẳng hạn bệnh nhân uống thuốc gì ngày bao nhiêu lần từ lúc nào và kết thúc khi nào.
Các sự kiện liên quan tới kế hoạch điều trị bệnh nhân như discuss_event(kế hoạch hội chẩn) hay decide_event (quyết định điều trị)
event (medication_event,discuss_event, decide_event).
Trong lớp medicationt_event lại có 2 lớp con là medication_start xác định sự kiện bắt đầu cho bệnh nhân điều trị thuốc và lớp medication_stop xác định sự kiện kết thúc việc dùng thuốc
medication_event(medication_start,medication_stop)
Lớp các đối tượng(object) bao gồm patient (bệnh nhân),doctor(bác sĩ),hospital(bệnh viện),cancer(bệnh ung thư),substance_name (chất độc bệnh học),medicine_name (loại thuốc dùng trong điều trị).
object(patient,doctor,hospital,cancer,substance_name,medicine_name)
Trong lớp các đối tượng (object) thì mỗi loại lớp bao gồm các đối tượng cụ thể như sau
patient(pt_Vu_Minh_Khoa,pt_Ngo_Kieu_Phuong,pt_Ho_Nhu_Ngoc)
doctor(dr_Ton_That_Tung,dr_Ho_Dac_Di,dr_Pham_Ngoc_Thach,dr_Le_The_Trung)
cancer(migraine,well_diffrenttiated_non_hodgkins_lymphoma,ductal_carcinoma_in_situ,adenocarcinoma,invasive_ductal_carcinoma)
hospital(hcu_Bach_Mai,hcu_Thanh_Nhan,hcu_Huu_Nghi,hcu_Trang_An)
substance_name(fbc,lft,calcium)
medicine_name(arimidex,dexamethasone,chlorambucil)
Lớp các dữ liệu (data) chứa các nhóm thông tin về ngày tháng,giới tính v.v…được xác định gồm các lớp con sau như sau
data(date,gender_type,substance_amount,medication_spec,frequency_spec, weight, day_spec,month_spec,year_spec,tumor_type,care_type,team_type)
Trong lớp các loại dữ liệu thì mỗi loại dữ liệu sẽ mang những giá trị cụ thể sau
Lớp gender_type sẽ xác định các giới tính của người bệnh
gender_type( male,female,unknown)
Lớp substance_amount sẽ xác định mức độ chất độc có trong người bệnh nhân là bình thường,cao,thấp hay quá mức cho phép.
substance_amount(normal,high,low, excessive)
Lớp weight xác định lượng thuốc cho mỗi lần bệnh nhân sử dụng
weight(mg1,mg1,3mg,mg4,mg5)
Lớp frequency_spec xác định số lần dùng thuốc trong ngày của bệnh nhân
frequency_spec(once_a_day,twice_a_day)
Lớp tumor_type xác định kiểu khối u cần điều trị
tumor_type(recurrent,non-recurrent)
Lớp team_type xác định nhóm tham gia hội chẩn
team_type(multidisciplinary)
Lớp care_type xác định phương pháp điều trị cho bệnh nhân là phẫu thuật (sugery),hoá trị liệu (chemotherapy),xạ trị (radiotherapy)hay là điều trị miễn dịch (immunotherapy)
care_type(sugery,chemotherapy,radiotherapy,immunotherapy)
Lớp day_spec chỉ ra thứ tự của một ngày nào đó trong tháng
day_spec(d1,d2,d3)
Lớp month_spec chỉ ra một tháng nào đó trong năm
month_spec(jan,feb,mar, apr, may, jun, jul, agu, sep, oct, nov, dec)
Lớp year_spec xác định năm mà các sự kiện (event) trong các lớp sự kiện ở trên diễn ra
year_spec(y2001,y2002,y2003,y2004,y2005,y2006)
Trong các lớp được phân loại trong bốn lớp rộng record,object,event,data như trên có một số lớp chưa nêu ra,các lớp này có đặc điểm chung là chúng có thuộc tính, đối tượng của lớp này lại là kiểu giá trị của thuộc tính lớp khác.Ví dụ một đối tượng của lớp date là sự hợp thành các đối thuộc 3 lớp day_spec, month_spec, year_spec ,các đối tượng của ba lớp day_spec,month_spec,year_spec là giá trị thuộc tính của đối tượng thuộc lớp date.Các lớp này sẽ được thiết kế tiếp như sau:
Một đối tượng thuộc lớp patient_record là tập hợp của các đối tượng thuộc các lớp: demographic_record,consult_record,diagnosis_record,medication_record,test_result_record,care_record
Mỗi đối tượng thuộc lớp này là một phần (section) của đối tượng patient_record nên ta có cấu trúc quan hệ như sau
patient_record
property
demographic_section:demographic_record
consult_section:consult_record
diagnosis_section:diagnosis_record
medication_section:medication_record
test_reuslt_section:test_result_record
care_section:care_record
Các phần trước dấu 2 chấm (: ) là tên thuộc tính còn đằng sau của dấu 2 chấm là các kiểu giá trị của thuộc tính,các kiểu giá trị này đều là các lớp trong không gian các lớp thuộc T-box.
Tương tự một đối tượng demographic_record có 2 thuộc tính là các đối tượng pat xác định bệnh nhân và gender xác định giới tính
Các file đính kèm theo tài liệu này:
- Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên.docx