Đồ án Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên

Mục lục

Lời nói đầu 1

Mục lục 2

Phụ lục 3

PHẦN 1:TỔNG QUAN VỀ VIỆC ỨNG DỤNG XỬ LÝ NGÔN TRONG THỰC TIỄN 4

1.1.Giới thiệu 4

1.2. Đặt vấn đề 5

1.2.1.Mục đích của đề tài 5.

1.2.2.Nội dung công việc 6

PHẦN 2:CƠ SỞ LÝ THUYẾT 7

2.1.Giao diện ngôn ngữ tự nhiên 7

2.1.1.Những ưu điểm của giao diện ngôn ngữ tự nhiên 10

2.1.2.Những nhược điểm của giao diện ngôn ngữ tự nhiên 11

2.2.Giao diện ngôn ngữ tự nhiên hạn chế 12

2.3.Kỹ thuật WYSIWYM editing 12

2.3.1.Các mô hình Editor 12

2.3.2.Kiến trúc WYSIWYM 15

2.3.3.Các thành phần cơ bản của một hệ thống WYSIWYM editing 17

PHẦN 3:HỆ THỐNG HỎI ĐÁP NGÔN NGỮ TỰ NHIÊN 19

3.1.Các hệ thống truy vấn cơ sở dữ liệu 19

3.2.Giới thiệu về một hệ thống CLEF 21

3.2.1. Ứng dụng của hệ thống 21

3.2.2. Kiến trúc của hệ thống 22

3.3.Giao diện CLEF 22

3.3.1.Chức năng và nhiệm vụ của giao diện CLEF 23

3.3.2.Mô hình hoá các văn bản trả lời 24

3.3.3.Cách thức tương tác giữa người dùng và giao diện CLEF 25

PHẦN 4:XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG GIAO DIỆN WYSIWYM 38

4.1.Phân tích thiết kế 38

4.1.1.Phân tích chức năng 38

4.1.2.Thiết kế cơ sở tri thức 40

4.1.2.1.Quan hệ ngữ nghĩa giữa các anchor(liên kết) 40

4.1.2.2.Thiết kế logic 51

4.2.Cài đặt chương trình mô phỏng 65

4.2.1.Công cụ ngôn ngữ 65

4.2.2.Mã hoá chương trình 68

PHẦN 5: ĐÁNH GIÁ KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN 94

5.1. Đánh giá kết quả 94

5.2.Hướng phát triển 95

Các tài liệu tham khảo 96

 

docx95 trang | Chia sẻ: lethao | Lượt xem: 1600 | Lượt tải: 4download
Bạn đang xem trước 20 trang tài liệu Đồ án Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
danh sách các member cùng kiểu chẳng hạn anchor( liên kết) some hospital sẽ chứa một danh sách tên các bệnh viện như bệnh viện Tràng An,bệnh viện Thanh Nhàn.vv…(trong trường hợp này chỉ giới hạn ở bốn bệnh viện ). Hình 3.6:Tiến trình tương tác giữa người dùng và giao diện CLEF (trạng thái 5) Khi ta lựa chọn tên một bệnh viện từ danh sách hiển thị mà pop-up menu liệt kê ví dụ bệnh viện Trang An thì anchor( liên kết) ban đầu đã kích hoạt danh sách trên sẽ được thay thế bởi tên bệnh viện như minh hoạ dưới đây : Hình 3.7:Tiến trình tương tác giữa người dùng và giao diện CLEF (trạng thái 6) Dễ nhận thấy tại vị trí cụm từ some hospital đã được thay thế bằng từ Trang An hospital.Các anchor đặc tả (features) được thay thế bằng khái niệm nằm trong danh sách của pop-up menu không có khả năng sinh ra anchor( liên kết) mới khi feedback text mới được hệ thống đưa ra,như vậy là các anchor( liên kết) đặc tả có một điểm chung là khả năng mở rộng “một cấp” tức là chỉ được thay thế một lần duy nhất. Hình thức mở rộng các feedback text Về thực chất quá trình giao diện CLEF sản sinh ra các feedback text là quá trình thay thế các anchor( liên kết) này thành nhiều anchor( liên kết) khác hoặc một giá trị cụ thể (khái niệm kết thúc quá trình thay thế các anchor( liên kết).Rõ ràng là trong quá trình này anchor( liên kết) ở vị trí hiện thời (current location) luôn nằm trong một tiến trình mở rộng theo kiểu phân cấp dạng cây vì các anchor( liên kết) tiếp theo sinh ra từ anchor( liên kết) này là một khái niệm mức chi tiết ,cụ thể (instance) hơn hoặc có liên quan về nội dung với anchor( liên kết) trước nó trong tiến trình mở rộng ví dụ trên đã chứng minh cho điều này vì Trang An hospital chính là một giá trị cụ thể (instance) của some hospital .Quá trình mở rộng của một anchor( liên kết) nằm trong một feedback text sẽ được tiến hành theo dạng đường đi trên một cây ngữ nghĩa như hình minh hoạ sau: Hình 3.8: Minh hoạ quá trình mở rộng văn bản Trên hình các anchor( liên kết) có màu xám.Nút gốc của cây sẽ là giá trị khởi tạo tại vị trí của anchor( liên kết) gốc tức là khái niệm ở mức khái quát cao nhất,các nút lá màu nâu là những giá trị cụ thể của các anchor( liên kết) đặc tả (features) còn nút cha của các nút lá chính là các anchor( liên kết) đặc tả.Các anchor( liên kết) khác là những anchor( liên kết) sự kiện vì các nút con của chúng là những anchor( liên kết) tiếp tục có khả năng tiếp tục được mở rộng. Nhìn trên hình thì quá trình mở rộng theo chiều ngang được minh hoạ là từ một anchor( liên kết) (nút cha) cùng lúc sẽ sinh ra nhiều anchor( liên kết) (các nút con).Chữ AND thể hiện rằng và các nút con này sẽ cùng xuất hiện trong feedback mới để thay thế cho anchor( liên kết) nút cha với ý nghĩa này một anchor( liên kết) sự kiện được xem là một tổ hợp các anchor( liên kết) khác.Quá trình mở rộng theo chiều dọc được minh hoạ trên hình vẽ với ý nghĩa của các toán tử OR là từ một nút “cận lá” chỉ có khả năng thay thế bởi một trong các instance (tức là các nút lá có màu nâu) và các nút lá đều có cùng một kiểu ngữ nghĩa kế thừa nút cha của nó.Ví dụ Trang An hospital kế thừa nội dung ngữ nghĩa của anchor( liên kết) some hospital vì Trang An hospital là một bệnh viện cụ thể nó kế thừa mọi đặc tính của hospital và các khái niệm như Bach Mai hospital và Trang An hospital là những khái niệm có cùng một kiểu,do đó some hospital được gọi là anchor( liên kết) đặc tả (features). Có một số đặc điểm đáng lưu ý là trong quá trình mở rộng các anchor( liên kết) có xuất hiện 2 loại anchor( liên kết) màu đỏ và màu xanh ,mục đích của việc đánh dấu như vậy nhằm chỉ thị cho người dùng về các thông tin mà anchor( liên kết) sẽ mở rộng.Màu đỏ thể hiện tính chất bắt buộc (olibigatory) ví dụ anchor( liên kết) some patient là một anchor( liên kết) có màu đỏ đòi hỏi người dùng phải lựa chọn để xác định xem bệnh nhân mà người dùng muốn đưa ra thông tin là người nào.Các anchor( liên kết) màu xanh thể hiện tính không bắt buộc (optional) người dùng có thể lựa chọn hoặc không lựa chọn.Ví đụ như anchor( liên kết) some day trong mục thông tin về ngày kết thúc việc điều trị thuốc có thể không cần lựa chọn vì rất có thể là việc này chưa kết thúc, ở thời điểm hiện tại bệnh nhân vẫn đang dùng thuốc. Một đặc trưng quan trọng thể hiện bản chất của kỹ thuật WYSIWYM xử lý ngôn ngữ tự nhiên dựa trên ngữ nghĩa là ở chỗ mọi thao tác của người dùng đều được tự động chỉ thị bằng các nội dung phản hồi của hệ thống qua các feedback text và người dùng căn cứ vào ngữ nghĩa của nó mà thao tác.Ví dụ khi người dùng lựa chọn bệnh nhân tên là Vũ Minh Khoa thì họ tự hiểu người này là nam và trong mục giới tính họ phải chọn giới tính là male (nam).Trường hợp người dùng chọn nhầm là female(nữ) thì chương trình hỗ trợ toán tử cắt,họ có thể cắt lựa chọn vừa rồi,tại vị trí chọn nhầm sẽ trở lại trạng thái anchor( liên kết) như khi chưa lựa chọn. Khi các anchor( liên kết) được mở rộng hết mức tức là đến nút lá thì các feedback text sẽ không còn khả năng mở rộng được nữa và nó sẽ không còn chứa các anchor( liên kết).Giao diện sẽ có dạng như sau Hình 3.9:Tiến trình tương tác giữa người dùng và giao diện CLEF (trạng thái 7) Hình trên mô tả tất cả những thông tin mà người dùng đã cung cấp cho hệ thống thông qua việc lựa chọn những nội dung có sẵn trong cơ sở tri thức mà hệ thống phản hồi lại (feedback) người dùng trong quá trình tương tác với hệ thống.Khi ta nhấn vào biểu tượng generate có hình bàn tay cầm cây bút viết trên frame ta sẽ có kết quả đầu ra ứng với trường hợp người dùng đã tương tác với giao diện trên là một cấu trúc có định dạng XML như sau: Định dạng đầu ra của chương trình có thể rất khó hiểu đối với người dùng vì nó vẫn tồn tại ở dạng mã hoá tuy nhiên nhiệm vụ của chương trình mô phỏng này chưa phải là đưa ra cho người dùng những thông tin trả lời bằng ngôn ngữ tự nhiên mà là tạo ra đầu vào cho các module khác trong hệ thống CLEF đã trình bày ở trên.Các module đó sẽ thực hiện những chức năng còn lại.Phần đầu ra của chương trình minh hoạ đoạn cấu trúc tri thức (knowledge fragment) mà người dùng tạo ra trong quá trình tương tác với giao diện,cấu trúc này sẽ trở nên dễ hiểu khi nó được diễn giải trong quá trình phân tích thiết kế chương trình ở PHẦN 4. PHẦN 4: XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG GIAO DIỆN WYSIWYM Dẫn nhập :Phần này sẽ trình bày những nội dung về thiết kế kiến trúc của giao diện với cơ phản hồi ngôn ngữ tự nhiên bằng kỹ thuật WYSIWYM và cách thức cài đặt cụ thể bằng các công cụ lập trình để giao diện có thể hoạt động là phần thành quả công việc đạt được 4.1.Phân tích thiết kế Phần phân tích thiết có mục đích diễn giải nội dung xây dựng một giao diện ngôn ngữ tự nhiên cần xác định xem hệ thống bao gồm những thành phần và bộ phận nào và các mối quan hệ giữa các bộ phận này ra sao. 4.1.1.Phân tích chức năng Giao diện ngôn ngữ tự nhiên với cơ chế phản hồi sử dụng kỹ thuật WYSIWYM được gọi chung là giao diện WYSIWYM (WYSIWYM interface) là một sự kết hợp của giao diện dựa trên form và kỹ thuật xử lý ngôn ngữ tự nhiên do đó nó vừa có đặc tính của giao diện dạng form vừa có những thành phần tham gia xử lý ngôn ngữ tự nhiên mà cụ thể là theo kỹ thuật WYSIWYM -kỹ thuật xây dựng giao diện dựa trên tri thức (based knowledge).Do có những đặc tính trên mà giao diện WYSIWYM bao gồm 3 phần là thành phần giao diện người dùng API cung cấp các đặc trưng đồ hoạ của một giao diện đồ hoạ người dùng(Graphic user interface-GUI) thông dụng như menu,frame vv..và một thành phần khác là WYSIWYM engine dựa trên một Cơ sở tri thức (knowledge base) có nhiệm vụ sinh các feedback text (generates feedback text) dạng ngôn ngữ tự nhiên. Hình 4.1: Tiến trình hoạt động của giao diện WYSIWYM Trong sơ đồ trên giao diện người dùng được người dùng (Author) kích hoạt sinh ra một anchor( liên kết) khởi tạo từ anchor( liên kết) này người dùng sẽ lựa chọn tiếp tạo ra các tác động trên giao diện.Giao diện sẽ gửi các message tới bộ WYSIWYM engine,bộ sinh này sẽ tìm thông tin trong cơ sở tri thức rồi dựa trên các luật để sinh ra các feedback text trả về cho giao diện.Quá trình này lăp đi lặp lại cho đến khi người dùng dừng lại hoặc quá trình mở rộng các feedback text đã đạt hết mức. Cụ thể ta sẽ xây dựng giao diện WYSIWYM áp dụng cho lĩnh vực chăm sóc điều trị bệnh nhân ung thư là giao diện CLEF đã giới thiệu ở PHẦN 3 như sau 4.1.2.Thiết kế cơ sở tri thức 4.1.2.1.Quan hệ ngữ nghĩa giữa các anchor( liên kết) Như đã trình bày ở trên,quá trình “giao tiếp” giữa người dùng và hệ thống thông qua giao diện thực chất là quá trình mở rộng các feedback text thông qua các anchor( liên kết), đây là một tiến trình thay thế các anchor( liên kết) theo “chiều dọc” và theo chiều ngang,vì nội dung của các feedback text đều là những thông tin tri thức cụ thể liên quan đến các bệnh nhân nên sự thay thế của các anchor( liên kết) này phải căn cứ trên ngữ nghĩa tức là những tri thức về lĩnh vực bệnh ung thư ( cancer domain) mà nội dung của anchor( liên kết) đó thể hiện.Trước tiên để xây dựng được cơ sở tri thức phục vụ cho việc sinh các feedback text ta cần xác định các anchor( liên kết) đồng thời xây dựng tương quan ngữ nghĩa giữa các anchor( liên kết) tức là thiết kế tiến trình mở rộng feedback text.Căn cứ vào đó ta có thể thấy được nội dung của các anchor( liên kết) và thứ tự thay thế các anchor( liên kết) với nhau.Với ý nghĩa Trước tiên ta bắt đầu với feedback text đầu tiên cũng là một anchor( liên kết) là some record.Từ anchor( liên kết) này trong tiến trình mở rộng sẽ xuất hiện các anchor( liên kết) khác có liên quan về mặt ngữ nghĩa với anchor( liên kết) này.Các quan hệ ngữ nghĩa được biểu diễn dưới dạng cây,vì có sáu feedback text được kích hoạt từ anchor( liên kết) đầu tiên là patient record nên sẽ có sáu cây mở rộng tương ứng với 6 feedback text như sau 1.Cây mở rộng tương ứng với feedback text xuất phát từ anchor( liên kết) some demographic (Cây số 1) Some demographic record Some patient Some gender and 2.Cây mở rộng tương ứng với feedback text xuất phát từ anchor( liên kết) some consult record (Cây số 2) Consult record Some patient Some doctor Some hospital Some date and and and Some day Some month Some year and and 3.Cây mở rộng tương ứng với feedback text có xuất phát từ anchor( liên kết) some diagnosis record (Cây số 3) Diagnosis record Some patient Some cancer Some hospital Some date Some day Some month Some year and and and and and 4.Cây mở rộng tương ứng với feedback text xuất phát từ anchor( liên kết) some medication record (Cây số 4) Medication record Some medication start event Some medication stop event Some patient Some medication Some date Some medicine Some weihght Some frequency Some day Some month Some year and and and and and and and and and 5.Cây mở rộng tương ứng với feedback text xuất phát từ anchor( liên kết) some test result record (Cây số 5) Some test result Some patient Some amount Some substance and and 6.Cây mở rộng tương ứng với feedback text xuất phát từ anchor( liên kết) some care plan record (Cây số 6) Some care plan Some care plan discussion Some care plan decision Some type of tumor Some team Some date Some type of care Some day Some month Some year and and and and and Quá trình mô tả bởi các cây mở rộng là quá trình feedback text tăng thêm số lượng các anchor( liên kết) sau mỗi lần click chuột vì mỗi anchor( liên kết) được thay thế bởi một hoặc nhiều anchor( liên kết) khác tuy nhiên các feedback text này vẫn còn một bước mở rộng nữa tại các anchor( liên kết) đặc tả (feature) khi các anchor( liên kết) này không bị thay thế bởi các anchor( liên kết) khác mà được thay thế trực tiếp bởi giá trị cụ thể (instance) ví dụ anchor( liên kết) some year sẽ được thay bằng một năm cụ thể là 2006 chẳng hạn, đây là sự thay thế ở mức độ sâu hơn về mặt ngữ nghĩa.Ta cần chỉ ra những giá trị thay thế cho các anchor( liên kết) đặc tả (feature) đó là những nút màu nâu trên hình Ta thấy rằng các nút lá trên 6 cây mở rộng là những anchor( liên kết) đặc tả (feature) sẽ được thay thế bằng các khái niệm cùng kiểu (same type) về mặt nội dung,tuy nhiên với mỗi anchor( liên kết) đặc tả (features) khác nhau sẽ có các giá trị thay thế nó khác nhau tuỳ theo nội dung của anchor( liên kết) đó.Vì có 13 anchor( liên kết) đặc tả khác nhau nên ta cũng có 13 kiểu giá trị (value type)thay thế khác nhau cho mỗi anchor( liên kết).Ví dụ với anchor( liên kết) some patient thì kiểu giá trị thay thế chỉ có thể là tên bệnh nhân Mỗi kiểu giá trị sẽ có một danh sách các giá trị cùng kiểu (chính là danh sách được liệt kê trong pop-up menu) để thế chỗ cho các anchor( liên kết) đặc điểm.Số lượng các giá trị trong danh sách được giới hạn tuỳ theo quy mô của cơ sở tri thức,trong nội dung của đồ án này chỉ đưa ra một số giá trị thay thế cho các loại anchor( liên kết),quan hệ giữa các anchor( liên kết) đặc tả và các giá trị này đuợc biểu diễn dưới dạng cây (tiếp tục quá trình mở rộng feedback text ở các cây đã nêu trên) và các cây này là những cây con của các cây trên làm thành cây mở rộng hoàn thiện cho toàn bộ quá trình mở rộng .Các cây có dạng như sau Cây ứng với anchor( liên kết) đặc tả là some cancer được nối tiếp vào anchor( liên kết) some cancer của cây số 3 Some cancer migraine Ductal carcinoma in adenocarcinoma Invasive ductal carcinomal Well diffenrentiated non hodgkins lymphoma or or or or Quan hệ giữa các nút được biểu diễn bởi mũi tên hướng từ nút cha đến nút con thể hiện quan hệ ngữ nghĩa kế thừa nội dung của nút con từ nút cha.Ví dụ bệnh ung thư biểu mô Ductal carcinom là một bệnh ung thư tức là nó có mọi đặc điểm ngữ nghĩa của nút cha là bệnh ung thư (bệnh nhân có khối u,có thể di căn hoặc không di căn). Cây ứng với anchor( liên kết) đặc tả là some patient được nối tiếp vào anchor( liên kết) some patient của các cây số 1,2,3,4,5. Some patient Vu Minh Khoa Ngo Kieu Phuong Ho Nhu Ngoc or or Cây ứng với anchor( liên kết) đặc tả là some gender được nối tiếp vào anchor( liên kết) some gender của cây số 1 Some gender male female unknow or or Cây ứng với anchor( liên kết) đặc tả some hospital được nối tiếp vào anchor( liên kết) some hospital của các cây số 2 và số 3 Some hospital Trang An hospital Bach Mai hospital Thanh Nhan hospital Huu Nghi hospital or or or Cây tương ứng với anchor( liên kết) đặc tả some doctor được nối tiếp vào anchor( liên kết) some doctor của cây số 2 Some doctor Dr. Ton That Tung Dr. Pham Ngoc Thach Dr.Le The Trung Dr.Ho Dac Di or or or Cây tương ứng với anchor( liên kết) đặc tả some medicine được nối tiếp vào anchor( liên kết) some medicine của cây số 4 Some medicine Armidex Dexamethasone chlorambucil or or Cây tương ứng với anchor( liên kết) đặc tả some weight được nối tiếp vào anchor (liên kết) some weight của cây số 4 Some weight 1mg 2mg 5mg 3mg or or or 4mg or Cây tương ứng với anchor( liên kết) đặc tả some frequency được nối tiếp vào anchor( liên kết) some frequency của cây số 4 Some frequency One a day Twice a day or Cây tương ứng với anchor( liên kết) đặc tả some amount được nối tiếp vào anchor( liên kết) some amount của cây số 5 Some amount nomarl high excessive low or or or Cây tương ứng với anchor( liên kết) đặc tả some substance được nối tiếp vào anchor (liên kết) some substance của cây số 5 Some substance LFT FBC calcium or or Cây tương ứng với anchor( liên kết) đặc tả some type of tumor được nối tiếp vào anchor( liên kết) some type of tumor của cây số 6 Some type of tumor Recurrent tumor Non-recurrent tumor or Cây tương ứng với anchor( liên kết) đặc tả some team được nối tiếp vào anchor( liên kết) some team của cây số 6 Some type of tumor A multidisciplinary team Cây tương ứng với anchor( liên kết) đặc tả some type of care được nối tiếp vào anchor( liên kết) some type of care của cây số 6 Some type of care surgery chemmotherapy immunotherapy Radiotherapy or or or Cây tương ứng với anchor( liên kết) đặc tả some day được nối tiếp vào anchor( jliên kết) some day của các cây số 2,3,4,6. Some day 1st 3rd 2nd or or jCây tương ứng với anchor( liên kết) đặc tả some month được nối tiếp vào anchor( liên kết) some month của các cây số 2,3,4,6. January or February May August March June September December October April November July Some month or or or or or or or or or or jCây tương ứng với anchor( liên kết) đặc tả some year được nối tiếp vào anchor( liên kết) some year của các cây số 2,3,4,6. Some year 2003 2002 2005 2004 or or or 2001 2006 or or 4.1.2.2.Thiết kế logic Trong phần trình bày ở trên mới cung cấp một khung nhìn người sử dụng (use case view)chỉ ra quá trình mở rộng của các feedback text tức là các hướng đi mà người dùng có thể tương tác với hệ thống qua giao diện.Tuy nhiên quá trình sản sinh ra các feedback text này được thực hiện bởi một WYSIWYM engine mà nội dung cơ bản của engine này một cơ sở tri thức (knowledge base) do đó phần sau đây sẽ đưa ra thiết kế chi tiết về Cơ sở tri thức cho giao diện CLEF cung cấp một khung nhìn thiết kế (logic view) đồng thời đi sâu vào chi tiết nội dung của kỹ thuật WYSIWYM editing Như đã trình bày ở PHẦN 2 một cơ sở tri thức WYSIWYM bao gồm có 2 phần là T(erminological)-box và A(serration)-box. T-box định nghĩa các lớp (classes) mà các đối tượng (objects) phụ thuộc vào,trong T-box chúng ta sẽ chỉ ra (specify) một tập các khái niệm (a set of available concepts) và các thuộc tính (attributes) của chúng.T-box sẽ cung cấp một ontology quyết định (determines) phạm vi ngữ nghĩa của hệ thống (the semantic coverage of the system). A-box chứa những nội dung tri thức cụ thể (actual knowledge) được tác động (edit) bởi người dùng,nó biểu diễn nội dung của một feedback text được sinh ra. Cơ sở tri thức là một mạng ngữ nghĩa xây dựng trên phạm vi (range) mà T-box cho phép.Còn mỗi feedback text là một câu cụ thể tương ứng với một A-box vì A-box là một cấu trúc đặc tả (feature structure)biểu diễn quan hệ giữa các đối tưọng,các lớp đã chỉ ra trong T-box nên mỗi A-box là một phần (knowledge fragment) của cơ sở tri thức (knowledge base). T-box sẽ cung cấp các lớp và các thuộc tính còn A-box sẽ tổ hợp chúng lại theo thứ tự nhất định tùy thuộc vào mối quan hệ giữa các đối tượng để tạo thành một câu sinh ra các feedback text. Việc xây dựng các lớp của T-box và các cấu trúc của A-box sẽ được tiến hành từng bước căn cứ vào nội dung của các cây mở rộng đã trình bày ở phần trên tức là đầu tiên ta sẽ xác định các lớp các cấu trúc xuất phát rồi lần lượt bổ xung thêm các lớp mới vào T-box và các cấu trúc mới của A-box. Trước tiên ta cần xác định nội dung của T-box để xác định phạm vi tri thức bao quát của lĩnh vực mà bài toán đề cập ở đây là tri thức về việc chăm sóc,chẩn đoán và điều trị bệnh ung thư. a)Nội dung của T-box Để xác định nội dung ngữ nghĩa của cho toàn bộ cơ sở tri thức, đầu tiên ta quy tất cả vào một khái niệm bao trùm cho toàn lĩnh vực một lớp gốc (superclass) là domain.Tất cả các lớp khác nằm trong T-box đều là các lớp con của domain vì đều nằm trong lĩnh vực này.Vì trong phạm vi của lĩnh vực (domain) của cơ sở tri thức là nói về hồ sơ của các bệnh nhân ung thư nên sẽ có các nhóm lớp ngữ nghĩa khác nhau là lớp con trực tiếp của domain được phân chia bao gồm 4 lớp Lớp record xác định thông tin về hồ sơ bệnh nhân Lớp event xác định các sự kiện xảy ra có liên quan tới bệnh nhân như chẩn đoán điều trị bệnh vv... Lớp object xác định các loại đối tưọng như con người các loại bệnh,bệnh viện vv.. Lớp data xác định các dữ liệu cụ thể liên quan đến thông tin bệnh . Ta biểu diễn phân nhóm các lớp ở dạng logic như sau Domain (record,event,object,data) Các lớp nằm trong dấu ngoặc là lớp con trực tiếp của lớp bên ngoài.Tiếp tục quá trình này với mức độ phân nhóm chi tiết cụ thể hơn.Căn cứ vào nội dung các cây mở rộng cho các feedback text ở trên ta sẽ xác định các lớp được xây dựng trong T-box như sau: Lớp các record bản ghi diễn tả một mẫu thông tin chung về bệnh nhân theo một chủ đề nào đó có thể là chẩn đoán hoặc điều trị bệnh vv… bao gồm các loại hồ sơ bệnh như Lớp demographic_record :thông tin về bệnh nhân như tên,giới tính Lớp consult_record :thông tin khám bệnh xác định xem bệnh nhân được bác sĩ nào, ở bệnh viện nào khám bệnh và việc khám bệnh diễn ra vào thời gian nào Lớp diagnosis_record:thông tin chẩn đoán bệnh xác định xem bệnh nhân được chẩn đoán mắc bệnh gì. Lớp medication_record:thông tin về quá trình điều trị bằng thuốc của bệnh nhân Lớp test result record:kết quả xét nghiệm của bệnh nhân Lớp care record:thông tin về kế hoạch điều trị và chăm sóc bệnh nhân record(patient_record,demographic_record,consult_record,diagnosis_record,medication_record,test_result_record,care_record). Lớp các sự kiện (event) bao gồm Lớp medication_event:Các sự kiện liên quan tới việc điều trị bằng thuốc cho bệnh nhân chẳng hạn bệnh nhân uống thuốc gì ngày bao nhiêu lần từ lúc nào và kết thúc khi nào. Các sự kiện liên quan tới kế hoạch điều trị bệnh nhân như discuss_event(kế hoạch hội chẩn) hay decide_event (quyết định điều trị) event (medication_event,discuss_event, decide_event). Trong lớp medicationt_event lại có 2 lớp con là medication_start xác định sự kiện bắt đầu cho bệnh nhân điều trị thuốc và lớp medication_stop xác định sự kiện kết thúc việc dùng thuốc medication_event(medication_start,medication_stop) Lớp các đối tượng(object) bao gồm patient (bệnh nhân),doctor(bác sĩ),hospital(bệnh viện),cancer(bệnh ung thư),substance_name (chất độc bệnh học),medicine_name (loại thuốc dùng trong điều trị). object(patient,doctor,hospital,cancer,substance_name,medicine_name) Trong lớp các đối tượng (object) thì mỗi loại lớp bao gồm các đối tượng cụ thể như sau patient(pt_Vu_Minh_Khoa,pt_Ngo_Kieu_Phuong,pt_Ho_Nhu_Ngoc) doctor(dr_Ton_That_Tung,dr_Ho_Dac_Di,dr_Pham_Ngoc_Thach,dr_Le_The_Trung) cancer(migraine,well_diffrenttiated_non_hodgkins_lymphoma,ductal_carcinoma_in_situ,adenocarcinoma,invasive_ductal_carcinoma) hospital(hcu_Bach_Mai,hcu_Thanh_Nhan,hcu_Huu_Nghi,hcu_Trang_An) substance_name(fbc,lft,calcium) medicine_name(arimidex,dexamethasone,chlorambucil) Lớp các dữ liệu (data) chứa các nhóm thông tin về ngày tháng,giới tính v.v…được xác định gồm các lớp con sau như sau data(date,gender_type,substance_amount,medication_spec,frequency_spec, weight, day_spec,month_spec,year_spec,tumor_type,care_type,team_type) Trong lớp các loại dữ liệu thì mỗi loại dữ liệu sẽ mang những giá trị cụ thể sau Lớp gender_type sẽ xác định các giới tính của người bệnh gender_type( male,female,unknown) Lớp substance_amount sẽ xác định mức độ chất độc có trong người bệnh nhân là bình thường,cao,thấp hay quá mức cho phép. substance_amount(normal,high,low, excessive) Lớp weight xác định lượng thuốc cho mỗi lần bệnh nhân sử dụng weight(mg1,mg1,3mg,mg4,mg5) Lớp frequency_spec xác định số lần dùng thuốc trong ngày của bệnh nhân frequency_spec(once_a_day,twice_a_day) Lớp tumor_type xác định kiểu khối u cần điều trị tumor_type(recurrent,non-recurrent) Lớp team_type xác định nhóm tham gia hội chẩn team_type(multidisciplinary) Lớp care_type xác định phương pháp điều trị cho bệnh nhân là phẫu thuật (sugery),hoá trị liệu (chemotherapy),xạ trị (radiotherapy)hay là điều trị miễn dịch (immunotherapy) care_type(sugery,chemotherapy,radiotherapy,immunotherapy) Lớp day_spec chỉ ra thứ tự của một ngày nào đó trong tháng day_spec(d1,d2,d3) Lớp month_spec chỉ ra một tháng nào đó trong năm month_spec(jan,feb,mar, apr, may, jun, jul, agu, sep, oct, nov, dec) Lớp year_spec xác định năm mà các sự kiện (event) trong các lớp sự kiện ở trên diễn ra year_spec(y2001,y2002,y2003,y2004,y2005,y2006) Trong các lớp được phân loại trong bốn lớp rộng record,object,event,data như trên có một số lớp chưa nêu ra,các lớp này có đặc điểm chung là chúng có thuộc tính, đối tượng của lớp này lại là kiểu giá trị của thuộc tính lớp khác.Ví dụ một đối tượng của lớp date là sự hợp thành các đối thuộc 3 lớp day_spec, month_spec, year_spec ,các đối tượng của ba lớp day_spec,month_spec,year_spec là giá trị thuộc tính của đối tượng thuộc lớp date.Các lớp này sẽ được thiết kế tiếp như sau: Một đối tượng thuộc lớp patient_record là tập hợp của các đối tượng thuộc các lớp: demographic_record,consult_record,diagnosis_record,medication_record,test_result_record,care_record Mỗi đối tượng thuộc lớp này là một phần (section) của đối tượng patient_record nên ta có cấu trúc quan hệ như sau patient_record property demographic_section:demographic_record consult_section:consult_record diagnosis_section:diagnosis_record medication_section:medication_record test_reuslt_section:test_result_record care_section:care_record Các phần trước dấu 2 chấm (: ) là tên thuộc tính còn đằng sau của dấu 2 chấm là các kiểu giá trị của thuộc tính,các kiểu giá trị này đều là các lớp trong không gian các lớp thuộc T-box. Tương tự một đối tượng demographic_record có 2 thuộc tính là các đối tượng pat xác định bệnh nhân và gender xác định giới tính

Các file đính kèm theo tài liệu này:

  • docxTìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên.docx