Luận án Nghiên cứu tính giải nghĩa được của hệ mờ theo ngữ nghĩa thế giới thực - Nguyễn Thu Anh

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT.5

DANH MỤC CÁC HÌNH VÀ BẢNG BIỂU.7

CHƯƠNG I : NHỮNG KIẾN THỨC CƠ SỞ.18

I.1. Tập mờ và các phép toán trên tập mờ .18

I.1.1.Tập mờ .18

I.1.2.Các phép toán trên tập mờ.19

1) Phép khử mờ .19

2) Phép kết nhập .20

3) Phép kéo theo mờ .21

4) Phép hợp thành các quan hệ mờ .22

I.2. Biến ngôn ngữ .23

I.3. Phân hoạch mờ .24

I.4. Mô hình mờ .25

I.5. Hệ dựa trên luật mờ (Hệ mờ) .26

1) Các thành phần của hệ mờ.26

2) Các mục tiêu khi xây dựng FRBS.27

3) Ứng dụng của hệ mờ .29

I.6. Đại số gia tử.32

1) Khái niệm Đại số gia tử .32

2) Một số tính chất của Đại số gia tử tuyến tính.33

3) Độ đo tính mờ của các giá trị ngôn ngữ .34

4) Khoảng tính mờ.37

5) Định lượng ngữ nghĩa của giá trị ngôn ngữ .38

I.7. Kết luận chương 1 .40

CHƯƠNG 2. TÍNH GIẢI NGHĨA ĐƯỢC CỦA KHUNG NHẬN THỨC NGÔN

NGỮ TRONG CÁC HỆ MỜ NGÔN NGỮ.41

II.1.Mở đầu.41

II.2.Tính giải nghĩa được của LRBSs ở mức từ ngôn ngữ.44

II.2.1.Lược đồ giải bài toán tính giải nghĩa được của biểu diễn tính toán

khung nhận thức ngôn ngữ .474

II.2.2.Ràng buộc về tính giải nghĩa được của việc biểu diễn ngữ nghĩa của

các từ của biến .50

II.2.3.Bổ sung ràng buộc trên biểu diễn tính toán của các khung NTNN .55

II.3.Giải nghĩa tính toán của LFoCs với tập mờ tam giác/ hình thang .58

II.4.Kết luận chương 2 .63

CHƯƠNG 3. TÍNH GIẢI NGHĨA ĐƯỢC THEO NGỮ NGHĨA THẾ GIỚI

THỰC CỦA CÁC BIỂU THỨC NGÔN NGỮ .65

III.1.Mở đầu .65

III.2.Tính giải nghĩa được theo ngữ nghĩa thế giới thực của miền từ các biến ngôn

ngữ .67

III.2.1.Khái niệm mới về tính giải nghĩa được theo ngữ nghĩa thế giới thực

(RWS) của các lý thuyết hình thức.68

III.2.2.Tính giải nghĩa được ngữ nghĩa thế giới thực của ngôn ngữ tự nhiên

của con người và đại số gia tử các biến ngôn ngữ.77

III.3.Tính giải nghĩa được ngữ nghĩa thế giới thực của các thành phần cấu thành

của các hệ mờ.80

III.3.1.Tính giải nghĩa được theo ngữ nghĩa thế giới thực của các khung nhận

thức ngôn ngữ LFoCs .81

III.3.2.Khả năng giải nghĩa được theo ngữ nghĩa thế giới thực đối với biểu

diễn tính toán của LRB và ARM.85

III.4.Về tính giải nghĩa được theo ngữ nghĩa thế giới thực của các biểu thức,

phương pháp luận hay các lý thuyết ngôn ngữ mờ .90

III.4.1.Kiểm tra tính giải nghĩa được theo ngữ nghĩa thế giới thực của một số

biểu thức mờ của lý thuyết tập mờ .90

III.4.2.Phương pháp biểu diễn đồ thị của các cơ sở luật ngôn ngữ và tính giải

nghĩa được theo ngữ nghĩa thế giới thực của nó .96

III.4.3.Phương pháp lập luận xấp xỉ thực hiện trên biểu diễn đồ thị của các cơ

sở luật ngôn ngữ .100

III.5.Kết luận chương 3 .105

KẾT LUẬN CỦA LUẬN ÁN .106

CÁC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN

ÁN .109

pdf116 trang | Chia sẻ: trungkhoi17 | Lượt xem: 467 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Luận án Nghiên cứu tính giải nghĩa được của hệ mờ theo ngữ nghĩa thế giới thực - Nguyễn Thu Anh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
t đẳng thức đó: Định nghĩa 2.1. Đối với bất kỳ hai bộ ba (a, b, d) và (a', b', d'), chúng ta xác định quan hệ thứ tự giữa chúng như sau: (i) Quan hệ thứ tự mạnh ≼s: (a, b, d) ≼s (a', b', d')  a<a’, b<b’and d<d’, (tất cả đều là bất đẳng thức thực sự) . (ii) Quan hệ thứ tự trung bình ≼m: (a, b, d) ≼m (a', b', d')  tồn tại hai trong ba thành phần của chúng, trong đó có thành phần thứ hai – lõi của các tập mờ, có quan hệ thứ tự tương đồng với quan hệ thứ tự giữa chúng. (iii) Quan hệ thứ tự yếu ≼w: (a, b, d) ≼w (a', b', d')  chính xác chỉ có một trong ba bất đẳng thức tương đồng với quan hệ thứ tự giữa chúng và các thành phần còn lại là các đẳng thức. (iv) Quan hệ thứ tự ≼: (a, b, d) ≼ (a', b', d')  một trong ba điều kiện (i) - (iii) thỏa mãn. Hình 2.2 (a) Ví dụ về hai tam giác có thứ tự theo điều kiện (ii):(a, b, d) ≼m (a', b', d') (b) Ví dụ về hai tam giác có thứ tự theo điều kiện (iii):(a, b, d) ≼w (a', b', d') b’ d b a d’ d b = b’ a = a’. d' (a) (b) a’ 55 II.2.3. Bổ sung ràng buộc trên biểu diễn tính toán của các khung NTNN Để nghiên cứu tính giải nghĩa được của các LRBSs ở mức khung nhận thức, trong LA này chúng tôi đưa thêm ràng buộc sau đây về lõi ngữ nghĩa các từ của LFoCs được sử dụng để thiết kế LRBSs. Đầu tiên, chúng tôi nhắc lại khái niệm LFoC được đề xuất và nghiên cứu trong [9]. Được gợi ý từ khái niệm khung nhận thức mờ (Frame of Cognition) gồm một số hữu hạn các tập mờ với nhãn ngôn ngữ, các tác giả trong [9] đã đưa ra khái niệm khung NTNN (Linguistic Frame of Cognition - LFoC). Khung NTNN LFoC của 𝒳 là một tập từ ngôn ngữ được các chuyên gia trong lĩnh vực ứng dụng sử dụng để mô tả các thực thể của thế giới thực đối với ứng dụng đó.Ví dụ tập của các từ ngôn ngữ của biến TUỔI trong ngôn ngữ tự nhiên của con người, trong miền ứng dụng quản lí cán bộ nhân viên trong quản lý các doanh nghiệp hoặc quản lý dân cư. Khung nhận thức ngôn ngữ của biến TUỔI trong hai miền ứng dụng này có ngữ nghĩa khác nhau. Như vậy, mỗi khung NTNN LFoC có thể được coi như “kho” từ vựng có giới hạn của một biến. Trong nghiên cứu [9], các tác giả đã phân tích các khung NTNN dựa trên quan sát các từ vựng thực tế được sử dụng để hình thành tri thức ngôn ngữ của các chuyên gia như các lang y hay các bác sỹ và đưa ra định nghĩa hình thức dưới đây: Định nghĩa 2.2. Một khung NTNN 𝔉 của một biến 𝒳 (trong một ngôn ngữ tự nhiên của các chuyên gia), với tập H các gia tử của biến, là một tập các từ của 𝒳 thỏa mãn các điều kiện sau: (i) {0,c, W, c+, 1} 𝔉; (ii) hx𝔉(h’H)(h’x𝔉) (nghĩa là hoặc là tất cả các từ có dạng hx, hH, đều thuộc 𝔉, hoặc tất cả chúng đều không thuộc); (iii) x𝔉 & x=hx’& hH  x’𝔉 (đóng đối với bậc sinh thành). Khi đó, k là độ dài lớn nhất của từ có mặt trong 𝔉 được gọi là mức đặc tả của khung NTNN 𝔉. Chú ý rằng, các gia tử trong (ii) và (iii) có chức năng đặc biệt mà chỉ được đề cập trong cách tiếp cận dựa trên ĐSGT là chúng được sử dụng để 56 sinh các từ có mức tính riêng cao hơn. Chung–riêng là một cặp phạm trù và, do đó, tính chung-riêng trong quan hệ giữa các từ có vai trò quan trọng để nhận thức thế giới thực. Chức năng của các gia tử trong ngôn ngữ làm cho các ngôn ngữ trở nên phong phú và cho phép người chuyên gia phát biểu tri thức bằng ngôn ngữ chính xác hơn từ việc phân tích, tổng kết các quan sát hay các dữ kiện thu được trong miền ứng dụng thực tiễn. Một thử nghiệm về vai trò quan trọng của quan hệ chung-riêng (G-S) của các từ trong tiếp cận HA là ứng dụng trong việc giải quyết vấn đề cân bằng giữa tính giải nghĩa được và tính chính xác của các hệ LRBSs trong giải quyết các bài toán phân lớp và hồi quy [9,15,11]. Để nhận biết thế giới thực của một ứng dụng bằng ngôn ngữ, mỗi từ trong khung NTNN phải được xem xét và lựa chọn trong ngữ cảnh của toàn bộ khung NTNN. Do đó, ngữ nghĩa của các từ của một LFoC phụ thuộc vào khai báo LFoC và sự phụ thuộc này dẫn đến các ràng buộc áp đặt lên các biểu diễn tính toán của khung NTNN được mô tả trong Hình 2.1. Đầu tiên, chúng ta khảo sát cái được gọi là lõi ngữ nghĩa của từ x được giới thiệu trong [11] để đưa ra một ràng buộc liên quan đến lõi của từ. Đại số gia tử mở rộng (Enlarged Hedge Algebras - EnHAs) được nghiên cứu trong [11]. Mỗi ĐSGT mở rộng 𝒜𝒳en= (Xen, G, C, Hen, en) là một sự mở rộng đại số gia tử đã cho 𝒜𝒳 = (X, G,C,H, ), gồm ĐSGT 𝒜𝒳 và phần mở rộng chứa các từ là lõi ngữ nghĩa (semantics core) các từ của ĐSGT 𝒜𝒳. Việc hình thức hoá việc mở rộng ĐSGT 𝒜𝒳 được thực hiện một phương pháp đại số bằng cách đưa thêm một gia tử nhân tạo h0 để sinh lõi ngữ nghĩa core(x) của mỗi từ x của ĐSGT 𝒜𝒳, tức là core(x) = h0x. Việc hình thức hóa bằng phương pháp tiên đề hóa cần bảo đảm được điều kiện là H = H {h0} và Xen = X {h0x : x∈X}. Để dễ hiểu, ta coi mỗi từ x của biến 𝒳 như một thể hạt có lõi, core(x). Vì vậy, nếu ta có x<y thì lõi của chúng cũng phải thỏa các bất đẳng thức: core(x) <y, x<core(y) và core(x) <core(y), nhưng không có cơ sở thông tin ngữ nghĩa nào về quan hệ thứ tự giữa x và core(x) và do đó chúng không so sánh được. 57 Vì vậy, chúng ta có thể thiết lập các tính chất trong (2.1), với x, yDom(𝒳): x<y  core(x)<y & x<core(y) & core(x)<core(y) (2.1) và x và core(x) là không so sánh được. Dựa trên hình thức hóa này, cấu trúc của một miền từ có thể sinh các tập mờ biểu diễn các ngữ nghĩa của các từ mà lõi là một khoảng thay cho một giá trị, ví dụ, tập mờ hình thang có lõi là các khoảng mờ. Trong trường hợp ĐSGT thông thường, ngữ nghĩa lõi của x chính là giá trị hàm định lượng của x. Trong cả hai trường hợp, ngữ nghĩa tính toán lõi của x được kí hiệu là C-core(x). Về trực quan, lõi ngữ nghĩa nằm trong ngữ nghĩa của từ, nên chúng ta cần đưa ra ràng buộc đối với ngữ nghĩa tính toán của lõi ngữ nghĩa. Trong LA này chúng tôi dựa trên ngữ nghĩa khoảng của từ của ĐSGT mở rộng 𝒜𝒳en, xuất phát từ quan sát thấy rằng ngữ nghĩa của từ ngôn ngữ mờ thường trong một cộng đồng dân cư chỉ đến khoảng ngữ nghĩa số. Để dễ hiểu chúng ta quan sát cầu vồng bảy màu. Về vật lý, bảy màu sắc mờ đó tương ứng với bảy khoảng các giá trị bước sóng liên tiếp. Nghĩa là bảy từ ngôn ngữ về màu sắc cầu vồng, đổ, cam vàng lục, được tương ứng với bảy khoảng giá trị bước sóng. Chúng biểu thị các ngữ nghĩa khoảng của bảy màu sắc cầu vồng. Các từ ngôn ngữ của biến chiều cao CHIỀU_CAO cũng được gán ngữ nghĩa khoảng trong một cộng đồng dân cư. Vì vậy, với mỗi biến 𝒳, với U𝒳 là miền xác định số của nó, ta sử dụng kí hiệu int(U𝒳) để chỉ tập các khoảng của U𝒳, kể cả khoảng suy biến [a, a]. Về phương pháp luận, ta có thể xét ánh xạ giá trị khoảng, kí hiệu là ℐint, ℐint : Dom(𝒳) → int(U𝒳). Để ℐint được xem là phép giải nghĩa giá trị khoảng của biến với ngữ nghĩa lõi, ta đưa ra ràng buộc sau: Ràng buộc 2.5 (Ràng buộc đối với ngữ nghĩa khoảng, ℐint, và lõi của từ): ℐint được cho là một ngữ nghĩa khoảng của các từ cùng với lõi ngữ nghĩa của biến 𝒳, nếu nó thỏa mãn điều kiện sau : x của 𝒳, C-core(x) =ℐint(h0x)  ℐint(x). Như tên của nó, lõi của x được coi là “tâm” của x thì ràng buộc trên là đương nhiên. Tuy nhiên nó cũng dùng để chỉ ngữ nghĩa khoảng của LFoCs nên có thể mất thông tin về lõi của từ khi các ngữ nghĩa lõi không xuất hiện rõ ràng. Điều này đòi hỏi phải xem xét các thuộc tính của các mối quan hệ 58 ngữ nghĩa của lõi từ và các từ khác như các mối quan hệ dựa trên thứ tự (2.1). Chú ý rằng không phải giải nghĩa tính toán nào cũng có thể bảo toàn các quan hệ này. Bây giờ chúng ta khảo sát phép giải nghĩa của các từ khi dùng ngữ nghĩa tập mờ tam giác hay tập mờ hình thang. Như đã đề cập ở trên, ta có thể sử dụng biểu diễn bộ 3 cho cả hai loại tập mờ này. Xem xét một phép giải nghĩa bộ 3, kí hiệu là ℐtrp, ℐtrp : Dom(𝒳) → {(a, b, d) : a, d∈U𝒳, b∈int(U𝒳)}. Mỗi ℐtrp(x) được gọi là ngữ nghĩa bộ ba của các từ x, nhớ rằng core(x) ∈Dom(𝒳). Mọi ℐint(core(x)) = ℐint(h0x) bao gồm các giá trị của U(𝒳) phù hợp nhất với x và, vì thế, về mặt ngữ nghĩa chúng không thể thuộc vào ngữ nghĩa của những từ khác. Do đó, khoảng ℐint(core(x)) = (b, c) có thể được viết như bộ ba (b, b, c), với b = (b,c) và, với xy, ℐint(core(x))ℐint(core(y)) = . Điều này cùng với (2.1) gợi ý chúng ta đưa ra một ràng buộc để bảo toàn ngữ nghĩa dựa trên thứ tự như sau: Ràng buộc 2.6. Cho một quan hệ thứ tự mong muốn ≼ trên bộ ba theo Định nghĩa 2.1, ngữ nghĩa bộ ba ℐtrp(x), ngữ nghĩa khoảng ℐint(x) của các từ trong 𝒳 cần bảo toàn các ngữ nghĩa của từ và lõi ngữ nghĩa của từ bằng các điều kiện ràng buộc sau: (i) ℐtrp(core(x)) = ℐint(core(x)) (ii) Với 2 từ bất kỳ x và y: x<y  ℐtrp(core(x))≼ℐtrp(y) & ℐtrp(x)≼ℐtrp(core(y)). II.3. Giải nghĩa tính toán của LFoCs với tập mờ tam giác/ hình thang Trong các tiếp cận hiện nay, một cấu trúc tập mờ biểu diễn ngữ nghĩa tính toán của các từ được gán không phụ thuộc ngữ nghĩa của bản thân các từ đó mà chỉ dựa trên trực giác của người dùng. Để thể hiện sự khác nhau giữa tiếp cận ĐSGT (HA) và các cách tiếp cận hiện có, chúng tôi giới thiệu cách chúng tôi xây dựng tập mờ hình thang hoặc tam giác để biểu diễn ngữ nghĩa của khung NTNN (LFoCs) sao cho chúng thỏa các ràng buộc được đề xuất. Như thường lệ, tập mờ được xây dựng được gán cho các từ bởi một phép giải nghĩa ℐ có thể thỏa mãn vài hoặc tất cả các ràng buộc được đề xuất. Cho khung NTNN (LFoC) 𝔉 của 𝒳 có mức tính đặc tả k. Để đơn giản, giả sử rằng tập H bao gồm 2 gia tử, L(little) và V(very), và một nhân tạo h0. 59 Chúng ta bắt đầu với cấu trúc dựa trên thứ tự của 𝔉 và quan hệ G-S của các từ trong 𝔉: hx là đặc tả hơn x hoặc x là khái quát hơn hx, với mọi hx𝔉. 1) Xây dựng đa mức đặc tả 𝔉: Phân chia 𝔉 theo các mức đặc tả sao cho các từ ở cùng một mức có cùng mức độ chung-riêng hoặc, một cách tương đương, chúng có dùng độ dài. Ký hiệu 𝔉k là tập các từ của 𝔉 có độ dài k, k = 0, 1, , κ, với 𝔉0 = {0, W, 1}, 𝔉1 = {01, c, c+, 11}, 𝔉2 = {02,Vc, Lc, Lc+, Vc+, 12}, 𝔉3 = {03,VVc, LVc, LLc, VLc, VLc+, LLc+, LVc+, VVc+, 13} Sự có mặt của các từ nhân tạo 0k and 1k xuất phát từ yêu cầu phân hoạch mờ của 𝔉j phải đầy đủ. Hơn nữa, việc thêm các từ như vậy làm cho tập 𝔉 trở nên phong phú hơn. 2) Xây dựng biểu diễn đa thể hạt mờ của 𝔉: Mọi mức đặc tả 𝔉k được biểu diễn bởi tập mờ tam giác/hình thang phân hoạch như biểu diễn ở Hình 2.3, trong đó có 3 phân hoạch mờ. Cấu trúc tập mờ như vậy được gọi là đa thể. Có thể dễ dàng xác minh rằng cấu trúc này bảo toàn quan hệ G-S của các từ trong 𝔉: độ hỗ trợ của tập mờ của hx được bao gồm trong độ hỗ trợ của tập mờ của x. Việc xây dựng cấu trúc đa thể hạt như vậy cho 𝔉 rất đơn giản: (i) với mỗi k, tính các khoảng mờ, ℑ(h0x), các lõi của tập mờ tam giác/hình thang tương ứng, của từ của 𝔉k, và đặt chúng trong U(𝒳). Sau đó, xây dựng một phân hoạch mờ tam giác/hình thang mạnh trên mức k sao cho ℑ(h0x) là lõi của tập mờ tam giác/hình thang tương ứng. Giá (support) của tập mờ được xác định duy nhất bởi khoảng tính mờ của các từ ngôn ngữ tương ứng. (ii) Cấu trúc đa mức thu được của tập mờ tam giác/hình thang được xây dựng theo cách này được gọi biểu diễn đa thể hạt mờ biểu diễn ngữ nghĩa của 𝔉 (xem Hình 2.3). 3) Tính giải nghĩa của 𝔉 được định nghĩa bởi cấu trúc đa thể hạt mờ: Chúng tôi đã lập luận rằng một khái niệm phức tạp như ngữ nghĩa của từ ngôn ngữ cần phải được nghiên cứu dựa trên các quan điểm khác nhau để làm rõ các khía cạnh ngữ nghĩa ẩn chứa trong các từ của ngôn ngữ tự nhiên. Và cấu trúc đa thể hạt được xây dựng chứa các đặc tính đa dạng cho phép xác định các phép giải nghĩa khác nhau nhằm diễn giải các khía cạnh ngữ nghĩa cá biệt của mỗi từ. 60 Cho một cấu trúc đa thể hạt, chẳng hạn giống như cấu trúc cho trong Hình 2.3. Từ cấu trúc đa thể hạt, chúng ta có thể xác định các phép giải nghĩa như sau: (I1) Giải nghĩa tập mờ của 𝔉: Nó là phép giải nghĩa, ký hiệu là ℐfuz, gán mỗi từ x trong 𝔉 một tập mờ tam giác/hình thang có lõi là ℑ(h0x) – khoảng tính mờ của từ h0x. Ví dụ, sử dụng đa thể hạt trong Hình 2.3, ta có ℐfuz(VVc+) là tập mờ hình thang ở Level 3 có nhãn VVc+, ℐfuz(Vc+) là tập mờ hình thang ở Level 2 có nhãn Vc+, còn ℐfuz(c-) là tập mờ hình thang ở Level 1 có c-, v.v (I2) Ngữ nghĩa khoảng ℐint của 𝔉: Phép giải nghĩa khoảng ℐint được định nghĩa đơn giản như sau: Với x𝔉, (i) ℐint(x) là giá (support) của tập mờ tam giác/hình thang ℐfuz(x), tức là ℐint(x) là đáy của hình tam giác hay đáy lớn của hình thang; (ii) Nếu từ x = h0y, ℐint(x) = ℐint(h0y) = ℑ(h0x), lõi của tập mờ x. (I3) Ngữ nghĩa bộ ba ℐtrp của 𝔉: Cho x𝔉, ℐtrp(x) = (a, b, d), với (a, d) là độ hỗ trợ của tập mờ ℐfuz(x) và b = ℐint(h0x) = ℑ(h0x). Bây giờ, chúng tôi chứng minh định lý phát biểu như sau : Định lý 2.1. Giải nghĩa ℐfuz và ℐtrp của khung nhận thức ngôn ngữ 𝔉, liên kết với ngữ nghĩa khoảng ℐint, định nghĩa bởi cấu trúc đa thể mờ được xây dựng như trên thỏa mãn tất cả các ràng buộc từ 2.1 – 2.6. 0 W 1 c c + Lc Vc + Level 0 Level 1 01 11 12 Lc + Level 2 Vc  02 Hình 2.3. Đa thể hạt với tập mờ tam giác/hình thang của các từ trong LFoC 𝔉 Level 3 03 13 VVc+ LVc + VLc+ LLc+ VLc  LLc  VVc  LVc 61 Chứng minh: Các ràng buộc 2.1 và 2.1 đòi hỏi ngữ nghĩa tập mờ cần phải được sinh ra từ ngữ nghĩa của các từ ngôn ngữ và cần phải dựa trên một cơ sở hình thức hóa toán học chặt chẽ để tránh trực quan hay cảm tính. Các phép giải nghĩa ℐfuz và ℐtrp được xây dựng dựa trên phương pháp biểu diễn đa thể hạt của khung nhận thức ngôn ngữ, được biểu thị ở Hình 2.3, dựa trên các miền từ được mô hình bởi ĐSGT được phát triển bằng phương pháp tiên đề hóa với các tiên đề của chúng được lựa chọn là các tính chất vốn có của từ và các gia tử. Phương pháp xây dựng cấu trúc đa thể của các tập mờ ở Hình 2.3 được xây dựng dựa trên các khoảng tính mờ của các lõi ngữ nghĩa của các từ trong khung nhận thức ngôn ngữ. Như vậy, việc xây dựng cấu trúc đa thể các tập mờ hoàn toàn dựa trên các từ của miền ngôn ngữ được mô hình hóa bởi ĐSGT và phương pháp lượng hóa ngữ nghĩa của từ và ngữ nghĩa lõi cũng được phát triển bằng phương pháp tiên đề [58,56,43,11] nên các giải nghĩa ℐfuz và ℐtrp được xây dựng thỏa các ràng buộc 2.1 và 2.2. Để kiểm tra Ràng buộc 2.3, có thể kiểm tra ℐint được định nghĩa như trên thỏa mãn Ràng buộc 2.3 thì bảo toàn quan hệ chung-riêng của các từ của 𝔉. Theo định nghĩa, có thể thấy rằng các giải nghĩa ℐfuz và ℐtrp liên quan đến giải nghĩa ℐint, như độ hỗ trợ của ℐfuzz(x) chỉ là khoảng ℐint(x) và nếu ℐtrp(x) = (a, b, d), thì (a, d) = ℐint(x). Vì vậy, ℐfuz và ℐtrp tạo ra ngữ nghĩa khoảng của chính mình thỏa mãn Ràng buộc 2.3. Xuất phát từ định nghĩa ta thấy rằng ℐint thỏa mãn Ràng buộc 2.5 và ℐtrp thỏa mãn (i) của Ràng buộc 2.6. Để chứng minh rằng ℐtrp thỏa mãn (ii) của Ràng buộc 2.66, chúng ta giả sử là x<y, kéo theo core(x)<core(y) và do đó ℑ(h0x) = ℐint(h0x) = ℐtrp(core(x)) = b= (b, c) < ℑ(h0y) = ℐint(h0y) = ℐtrp(core(y)) = b’ = (b’, c’). Giả sử bởi (I3) là ℐtrp(x) = (a, ℐint(h0x), d) và ℐtrp(y) = (a’, ℐint(h0y), d’). Như vậy, cũng bởi (I3), ta có ℐtrp(x) = (a, b, d) và ℐtrp(y) = (a’, b’, d’). Khi ngữ nghĩa bộ ba của ℐint(h0x) và ℐint(h0y) tương ứng là (b, b, c) và (b’, b’, c’), bất đẳng thức ℐint(h0x)ℐint(h0y) ở trên bao gồm cả ℐint(h0y)ℐint(y) kéo theo bởi Định nghĩa. 2.1 là ℐtrp(core(x))≼mℐtrp(y) & ℐtrp(x)≼mℐtrp(core(y)), theo (iv) của Định nghĩa. 2.1, là yêu cầu của (ii) trong Ràng buộc 2.6. Bây giờ, ta chứng minh cả ℐfuz và ℐtrp thỏa mãn Ràng buộc 2.4 với ≼ của Định nghĩa 2.1. Chú ý rằng, với tập mờ khác với dạng tam giác/hình thang, 62 sẽ có khác biệt lớn giữa ℐfuz và ℐtrp. Tuy nhiên, khi ℐfuz được định nghĩa bởi tập mờ tam giác/hình thang, quan hệ thứ tự ≼ được định nghĩa trên tập mờ tam giác/hình thang có thể được xem như đồng nhất với cái được định nghĩa trên bộ ba theo nghĩa là có tồn tại một đẳng cấu thứ tự từ cái này đến những cái khác. Vì vậy đủ để chứng minh là ℐtrp thỏa mãn Ràng buộc 2.4, có nghĩa là nó bảo toàn thứ tự từ khi dùng quan hệ thứ tự ≼ của bộ ba. Để đơn giản hóa việc trình bày, chúng tôi chứng minh tính hợp lệ của Ràng buộc 2.4 đối với các trường hợp, với ℐtrp được định nghĩa bởi cấu trúc cụ thể biểu diễn trong Hình 2.3. Trong trường hợp chung, chứng minh có thể được tổng quát từ cái này, mặc dù có nhiều trường hợp hơn được xem xét. Chúng tôi thấy rằng, với bất kỳ x, y𝔉, xy, x≤y  ℐtrp(x) ℐtrp(y) & ℐtrp(x) ≼ℐtrp(y) (2.2) Chúng tôi giả sử đầu tiên cả x và y cùng thuộc {0k, k = 0 – 3} hoặc {1k, k = 0 – 3}, có thể dễ dàng xác minh rằng, theo phát biểu (iii) của Định nghĩa. 2.1, chúng ta có ℐtrp(x) ≼wℐtrp(y). Giả sử rằng ít nhất một trong số x và y nằm giữa 0k và 1k, với một số k, k = 0–3. Trước tiên, khi x<y, chúng ta suy ra ℐtrp(core(x))=bx  ℐtrp(core(y))=by. Đó là, luôn có ít nhất một trong ba bất đẳng thức trong việc xác định tính hợp lệ của ℐtrp(x) ≼ℐtrp(y). Chúng ta chứng minh các trường hợp: + Với trường hợp x, y ở cùng một mức đặc tả, liên quan đến Hình 2.3, rõ ràng là các bộ ba ℐtrp(x) = (ax, bx, dx) và ℐtrp(y) = (ay, by, dy) thỏa mãn (2.2) vì chúng được xác định bởi độ hỗ trợ và các lõi của các tập mờ tam giác/hình thang tương ứng với dạng một phân hoạch mạnh của cấu trúc đa thể hạt. Hơn nữa, có thể thấy rằng quan hệ thứ tự giữa chúng là mạnh, nghĩa là nó là ≼s. + Trong trường hợp các từ x, y không thuộc về cùng một mức đặc tả. Nếu x{0k, k = 0–3}, dễ dàng xác minh một trong hai ℐtrp(x)≼mℐtrp(y) hay ℐtrp(x) ≼sℐtrp(y). Giả sử x∉ {0k, k = 0–3} và, do đó nó được tạo ra từ c hay c+. Có nhiều trường hợp con: 63 ∘ lev(x)>lev(y), với lev(z) ký hiệu độ đặc tả của z, số của mức trong cấu trúc Hình 2.3: Đầu tiên, xét trường hợp lev(y) = 0. Nếu y = 10, thì x là c hoặc c+. Tham khảo Hình 2.3, chúng ta có ℐtrp(x) ≼sℐtrp(y). Tương tự, nếu y = W, thì x là c hoặc con bất kỳ của nó và ta có một trong hai ℐtrp(x) ≼mℐtrp(y) hoặc ℐtrp(x) ≼sℐtrp(y). Giả sử là lev(y)<0, ta có x = σx’, với lev(x’) = lev(y). Trong HA bất kỳ, x<y kéo theo x’y. Khi x’= y, ta có x = σy<y (nghĩa là với x = VLc+ hay LLc+ và y = c+). Ở đó cũng tồn tại z trên lev(x) được sinh từ y, nhưng nằm phía bên phải của y, nghĩa là z =σ’y>y. Giả sử ℐtrp(x) = (ax,bx,dx) và ℐtrp(z) = (az,bz,dz) rằng cả hai đều bao gồm trong ℐtrp(y) = (ay,by,dy), nó kéo theo dzdy. Do đó, bằng việc xây dựng phân hoạch mờ, ta có dxbz<dzdy. Điều này cho thấy tính hợp lệ của ℐtrp(x) ≼mℐtrp(y). Bây giờ chúng ta xem xét trường hợp x’<y, nó kéo theo là dx’bydy (có thể, y = 1lev(y)). bằng lý luận tương tự x’ đóng vai trò của y, ta thu được dx<dx’, kết quả dx<dy, bất đẳng thức yêu cầu. ∘ lev(x) <lev(y): Vì cấu trúc đa thể hạt là đối xứng, lý luận tương tự như trong trường hợp được xem xét ở trên khi áp dụng một đối số kép (dual argument). II.4. Kết luận chương 2 Trong chương này, LA đã nghiên cứu tính giải nghĩa được dựa trên khái niệm phép giải nghĩa (interpretation) để chuyển tải bảo toàn ngữ nghĩa của biểu thức ngôn ngữ là khung NTNN sang biểu thức tính toán biểu diễn cấu trúc ngữ nghĩa của khung NTNN. Một số vấn đề sau đã được giải quyết: 1) Nghiên cứu, phân tích phép giải nghĩa như là việc nghiên cứu mối quan hệ giữa ngữ nghĩa thế giới thực của các biểu thức ngôn ngữ và ngữ nghĩa tính toán của biểu thức tính toán gán cho biểu thức ngôn ngữ. Tính giải nghĩa được của biểu thức tính toán của nó dựa trên ý tưởng là phép giải nghĩa cần phải bảo toàn các quan hệ được phát hiện dựa trên ngữ nghĩa của biểu thức ngôn ngữ. Ý tưởng này là khác biệt với khái niệm tính giải nghĩa được của các hệ mờ được nghiên cứu trong phạm vi lý thuyết tập mờ. Trên cơ sở ý tưởng này, đề xuất lược đồ giải bài toán tính giải nghĩa được của biểu diễn tính toán của các khung nhận thức ngôn ngữ (khung NTNN), trong 64 đó khâu phát hiện cấu trúc ngữ nghĩa của khung NTNN có ý nghĩa quan trọng. 2) Thay cho việc đưa ra các ràng buộc đối với tập mờ được thiết kế để bảo đảm tính giải nghĩa được của các hệ mờ như trong các nghiên cứu hiện nay, dựa trên lược đồ đề cập ở trên, LA nghiên cứu đề xuất các ràng buộc đối với các phép giải nghĩa được xây dựng để chuyển tải, bảo toàn các khía cạnh ngữ nghĩa mong muốn của khung NTNN cho các hệ mờ. Điều này cho thấy phương pháp tiếp cận dựa trên ĐSGT hoàn toàn khác biệt với các cách tiếp cận hiện tại đối với vấn đề tính giải nghĩa được. Hơn nữa, tiếp cận dựa trên ĐSGT tương tự và tương thích với ý tưởng để giải quyết khả năng giải nghĩa được của các ngôn ngữ lập trình hình thức, trong đó ngữ nghĩa của các biểu thức cú pháp được xác định bằng phép giải nghĩa gán cho chúng các đối tượng toán học nhất định được xem là những ngữ nghĩa của chúng. Cách giải nghĩa này nhằm bảo toàn tính hợp lệ của ngữ nghĩa của chúng trên cơ sở bảo toàn các tiên đề đối với cấu trúc toán học được gán cho các biểu thức cú pháp. 3) Ứng dụng phương pháp tiếp cận ĐSGT giải bài toán tính giải nghĩa được của biểu diễn tính toán các khung NTNN bằng việc xây dựng cấu trúc đa thể hạt các tập mờ tam giác hay các tập mờ hình thang. Các tính chất quan trọng của ngữ nghĩa cấu trúc của khung NTNN là các quan hệ thứ tự, quan hệ chung-riêng gắn kết với chức năng ngữ nghĩa của các gia tử và lõi ngữ nghĩa của các từ ngôn ngữ. Chúng dẫn đến các ràng buộc đối với việc biểu diễn tính toán khung NTNN áp đặt lên các phép giải nghĩa được nghiên cứu. Cấu trúc đa thể của các tập mờ được nghiên cứu trong chương này sinh ra hay xác định các phép giải nghĩa sang các đối tượng tính toán như tập mờ tam giác, tập mờ hình thang, ngữ nghĩa khoảng, ngữ nghĩa số ... Đã chứng minh các phép giải nghĩa thỏa tất cả hay một phần những ràng buộc đã thảo luận và đề xuất. 65 CHƯƠNG 3. TÍNH GIẢI NGHĨA ĐƯỢC THEO NGỮ NGHĨA THẾ GIỚI THỰC CỦA CÁC BIỂU THỨC NGÔN NGỮ III.1. Mở đầu Mục tiêu của lý thuyết tập mờ là thiết lập một cơ sở tính toán mô phỏng khả năng thao tác ngôn ngữ của con người trong việc mô tả, nhận thức thế giới thực cũng như trong tư duy, lập luận. Các hệ mờ mà thành phần quan trọng của chúng là cơ sở tri thức luật và phương pháp lập luận mờ là một công cụ dựa trên lý thuyết tập mờ để mô phỏng hữu hiệu những khả năng đó. Về bản chất, mỗi hệ mờ là một biểu thức tập mờ được thao tác dựa trên một cơ sở hình thức tính toán nào đó trong lý thuyết tập mờ (như đại số các tập mờ, phương pháp lập luận ).Trong đó mỗi tập mờ được gán nhãn ngôn ngữ và chúng được xem như là biểu diễn ngữ nghĩa tính toán của các nhãn ngôn ngữ đó. Do vậy, mỗi biểu thức tập mờ được tương ứng với một biểu thức ngôn ngữ mà con người đọc được và hiểu được (Comprehensive) và nó được xem là một biểu diễn tập mờ của biểu thức ngôn ngữ đó. Vấn đề giải nghĩa (interpretation) của ngôn ngữ lập trình, hay rộng hơn là của lý thuyết hình thức hóa dựa trên một ngôn ngữ hình thức, là việc gán các đối tượng của một cấu trúc toán học mong muốn, xem chúng như là ngữ nghĩa, cho các biểu thức của ngôn ngữ hình thức hóa, sao cho các tiên đề và định lý của lý thuyết hình thức hóa đó là định lý trong cấu trúc toán học đang xem xét (xem [53,55]). Vì các cấu trúc toán học biểu thị cấu trúc các sự vật trong thế giới thực nên bản chất của việc giải nghĩa các biểu thức kí hiệu của ngôn ngữ hình thức là việc gán ngữ nghĩa thế giới thực cho các biểu thức kí hiệu sao cho các tính chất phát biểu bằng ngôn ngữ hình thức hóa đúng là các tính chất quan sát được trong thế giới thực. Đối với các lý thuyết chính xác như toán và vật lý, tính giải nghĩa được thế giới thực của chúng như là một đòi hỏi tự nhiên và hiển nhiên, nhưng chỉ là ngầm định (implicit). Điều này cùng với tính không chắc chắn (uncertainty), không đầy đủ (incomplete), tính phức tạp có thể dẫn đến lý thuyết tập mờ không để ý đến đòi hỏi này. Chẳng hạn, đại số các tập mờ chuẩn (standard) là không giải nghĩa được thế giới thực. Ví dụ ta có biểu 66 thức các từ của biến chân lý “true OR very true = very true”. Tuy nhiên, có thể thấy rõ ràng rằng giữa hai biểu thức tập mờ tương ứng với hai vế đẳng thức trên, đẳng thức không xảy ra: FS(true)FS(very true) ≠ FS(very true). Nghĩa là, tính đúng đắn của đẳng thức trong biểu thức ngôn ngữ không được bảo toàn. Lý thuyết tập mờ là rất vĩ đại với vô số những thành tựu ứng dụng của nó ở hầu hết mọi lĩnh vực của đời sống kinh tế - xã hội nên không thể nói các cách tiếp cận dựa trên lý thuyết tập mờ là thiếu cơ sở. Nhưng để thấy sự khác biệt giữa những cách tiếp cận đó với cách tiếp cận dựa trên ĐSGT, trong chương này, theo hướng nghiên cứu trong [5], LA nghiên cứu tính giải nghĩa được của các hệ mờ dựa trên ngữ nghĩa thế giới thực (Real-world semantics based interpretability hay RW

Các file đính kèm theo tài liệu này:

  • pdfluan_an_nghien_cuu_tinh_giai_nghia_duoc_cua_he_mo_theo_ngu_n.pdf
Tài liệu liên quan