DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT.5
DANH MỤC CÁC HÌNH VÀ BẢNG BIỂU.7
CHƯƠNG I : NHỮNG KIẾN THỨC CƠ SỞ.18
I.1. Tập mờ và các phép toán trên tập mờ .18
I.1.1.Tập mờ .18
I.1.2.Các phép toán trên tập mờ.19
1) Phép khử mờ .19
2) Phép kết nhập .20
3) Phép kéo theo mờ .21
4) Phép hợp thành các quan hệ mờ .22
I.2. Biến ngôn ngữ .23
I.3. Phân hoạch mờ .24
I.4. Mô hình mờ .25
I.5. Hệ dựa trên luật mờ (Hệ mờ) .26
1) Các thành phần của hệ mờ.26
2) Các mục tiêu khi xây dựng FRBS.27
3) Ứng dụng của hệ mờ .29
I.6. Đại số gia tử.32
1) Khái niệm Đại số gia tử .32
2) Một số tính chất của Đại số gia tử tuyến tính.33
3) Độ đo tính mờ của các giá trị ngôn ngữ .34
4) Khoảng tính mờ.37
5) Định lượng ngữ nghĩa của giá trị ngôn ngữ .38
I.7. Kết luận chương 1 .40
CHƯƠNG 2. TÍNH GIẢI NGHĨA ĐƯỢC CỦA KHUNG NHẬN THỨC NGÔN
NGỮ TRONG CÁC HỆ MỜ NGÔN NGỮ.41
II.1.Mở đầu.41
II.2.Tính giải nghĩa được của LRBSs ở mức từ ngôn ngữ.44
II.2.1.Lược đồ giải bài toán tính giải nghĩa được của biểu diễn tính toán
khung nhận thức ngôn ngữ .474
II.2.2.Ràng buộc về tính giải nghĩa được của việc biểu diễn ngữ nghĩa của
các từ của biến .50
II.2.3.Bổ sung ràng buộc trên biểu diễn tính toán của các khung NTNN .55
II.3.Giải nghĩa tính toán của LFoCs với tập mờ tam giác/ hình thang .58
II.4.Kết luận chương 2 .63
CHƯƠNG 3. TÍNH GIẢI NGHĨA ĐƯỢC THEO NGỮ NGHĨA THẾ GIỚI
THỰC CỦA CÁC BIỂU THỨC NGÔN NGỮ .65
III.1.Mở đầu .65
III.2.Tính giải nghĩa được theo ngữ nghĩa thế giới thực của miền từ các biến ngôn
ngữ .67
III.2.1.Khái niệm mới về tính giải nghĩa được theo ngữ nghĩa thế giới thực
(RWS) của các lý thuyết hình thức.68
III.2.2.Tính giải nghĩa được ngữ nghĩa thế giới thực của ngôn ngữ tự nhiên
của con người và đại số gia tử các biến ngôn ngữ.77
III.3.Tính giải nghĩa được ngữ nghĩa thế giới thực của các thành phần cấu thành
của các hệ mờ.80
III.3.1.Tính giải nghĩa được theo ngữ nghĩa thế giới thực của các khung nhận
thức ngôn ngữ LFoCs .81
III.3.2.Khả năng giải nghĩa được theo ngữ nghĩa thế giới thực đối với biểu
diễn tính toán của LRB và ARM.85
III.4.Về tính giải nghĩa được theo ngữ nghĩa thế giới thực của các biểu thức,
phương pháp luận hay các lý thuyết ngôn ngữ mờ .90
III.4.1.Kiểm tra tính giải nghĩa được theo ngữ nghĩa thế giới thực của một số
biểu thức mờ của lý thuyết tập mờ .90
III.4.2.Phương pháp biểu diễn đồ thị của các cơ sở luật ngôn ngữ và tính giải
nghĩa được theo ngữ nghĩa thế giới thực của nó .96
III.4.3.Phương pháp lập luận xấp xỉ thực hiện trên biểu diễn đồ thị của các cơ
sở luật ngôn ngữ .100
III.5.Kết luận chương 3 .105
KẾT LUẬN CỦA LUẬN ÁN .106
CÁC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN
ÁN .109
116 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 462 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận án Nghiên cứu tính giải nghĩa được của hệ mờ theo ngữ nghĩa thế giới thực - Nguyễn Thu Anh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
t đẳng thức đó:
Định nghĩa 2.1. Đối với bất kỳ hai bộ ba (a, b, d) và (a', b', d'), chúng
ta xác định quan hệ thứ tự giữa chúng như sau:
(i) Quan hệ thứ tự mạnh ≼s: (a, b, d) ≼s (a', b', d') a<a’, b<b’and
d<d’, (tất cả đều là bất đẳng thức thực sự) .
(ii) Quan hệ thứ tự trung bình ≼m: (a, b, d) ≼m (a', b', d') tồn tại hai
trong ba thành phần của chúng, trong đó có thành phần thứ hai – lõi của các
tập mờ, có quan hệ thứ tự tương đồng với quan hệ thứ tự giữa chúng.
(iii) Quan hệ thứ tự yếu ≼w: (a, b, d) ≼w (a', b', d') chính xác chỉ có
một trong ba bất đẳng thức tương đồng với quan hệ thứ tự giữa chúng và các
thành phần còn lại là các đẳng thức.
(iv) Quan hệ thứ tự ≼: (a, b, d) ≼ (a', b', d') một trong ba điều kiện
(i) - (iii) thỏa mãn.
Hình 2.2
(a) Ví dụ về hai tam giác có thứ tự theo điều kiện (ii):(a, b, d) ≼m (a', b', d')
(b) Ví dụ về hai tam giác có thứ tự theo điều kiện (iii):(a, b, d) ≼w (a', b', d')
b’
d
b
a d’ d
b = b’
a = a’. d'
(a) (b)
a’
55
II.2.3. Bổ sung ràng buộc trên biểu diễn tính toán của các khung
NTNN
Để nghiên cứu tính giải nghĩa được của các LRBSs ở mức khung nhận
thức, trong LA này chúng tôi đưa thêm ràng buộc sau đây về lõi ngữ nghĩa
các từ của LFoCs được sử dụng để thiết kế LRBSs. Đầu tiên, chúng tôi nhắc
lại khái niệm LFoC được đề xuất và nghiên cứu trong [9]. Được gợi ý từ
khái niệm khung nhận thức mờ (Frame of Cognition) gồm một số hữu hạn
các tập mờ với nhãn ngôn ngữ, các tác giả trong [9] đã đưa ra khái niệm
khung NTNN (Linguistic Frame of Cognition - LFoC). Khung NTNN LFoC
của 𝒳 là một tập từ ngôn ngữ được các chuyên gia trong lĩnh vực ứng dụng
sử dụng để mô tả các thực thể của thế giới thực đối với ứng dụng đó.Ví dụ
tập của các từ ngôn ngữ của biến TUỔI trong ngôn ngữ tự nhiên của con
người, trong miền ứng dụng quản lí cán bộ nhân viên trong quản lý các
doanh nghiệp hoặc quản lý dân cư. Khung nhận thức ngôn ngữ của biến
TUỔI trong hai miền ứng dụng này có ngữ nghĩa khác nhau. Như vậy, mỗi
khung NTNN LFoC có thể được coi như “kho” từ vựng có giới hạn của một
biến. Trong nghiên cứu [9], các tác giả đã phân tích các khung NTNN dựa
trên quan sát các từ vựng thực tế được sử dụng để hình thành tri thức ngôn
ngữ của các chuyên gia như các lang y hay các bác sỹ và đưa ra định
nghĩa hình thức dưới đây:
Định nghĩa 2.2. Một khung NTNN 𝔉 của một biến 𝒳 (trong một ngôn
ngữ tự nhiên của các chuyên gia), với tập H các gia tử của biến, là một tập
các từ của 𝒳 thỏa mãn các điều kiện sau:
(i) {0,c, W, c+, 1} 𝔉;
(ii) hx𝔉(h’H)(h’x𝔉) (nghĩa là hoặc là tất cả các từ có dạng hx,
hH, đều thuộc 𝔉, hoặc tất cả chúng đều không thuộc);
(iii) x𝔉 & x=hx’& hH x’𝔉 (đóng đối với bậc sinh thành).
Khi đó, k là độ dài lớn nhất của từ có mặt trong 𝔉 được gọi là mức đặc
tả của khung NTNN 𝔉.
Chú ý rằng, các gia tử trong (ii) và (iii) có chức năng đặc biệt mà chỉ
được đề cập trong cách tiếp cận dựa trên ĐSGT là chúng được sử dụng để
56
sinh các từ có mức tính riêng cao hơn. Chung–riêng là một cặp phạm trù và,
do đó, tính chung-riêng trong quan hệ giữa các từ có vai trò quan trọng để
nhận thức thế giới thực. Chức năng của các gia tử trong ngôn ngữ làm cho
các ngôn ngữ trở nên phong phú và cho phép người chuyên gia phát biểu tri
thức bằng ngôn ngữ chính xác hơn từ việc phân tích, tổng kết các quan sát
hay các dữ kiện thu được trong miền ứng dụng thực tiễn. Một thử nghiệm về
vai trò quan trọng của quan hệ chung-riêng (G-S) của các từ trong tiếp cận
HA là ứng dụng trong việc giải quyết vấn đề cân bằng giữa tính giải nghĩa
được và tính chính xác của các hệ LRBSs trong giải quyết các bài toán phân
lớp và hồi quy [9,15,11].
Để nhận biết thế giới thực của một ứng dụng bằng ngôn ngữ, mỗi từ
trong khung NTNN phải được xem xét và lựa chọn trong ngữ cảnh của toàn
bộ khung NTNN. Do đó, ngữ nghĩa của các từ của một LFoC phụ thuộc vào
khai báo LFoC và sự phụ thuộc này dẫn đến các ràng buộc áp đặt lên các
biểu diễn tính toán của khung NTNN được mô tả trong Hình 2.1.
Đầu tiên, chúng ta khảo sát cái được gọi là lõi ngữ nghĩa của từ x được
giới thiệu trong [11] để đưa ra một ràng buộc liên quan đến lõi của từ. Đại số
gia tử mở rộng (Enlarged Hedge Algebras - EnHAs) được nghiên cứu trong
[11]. Mỗi ĐSGT mở rộng 𝒜𝒳en= (Xen, G, C, Hen, en) là một sự mở rộng đại
số gia tử đã cho 𝒜𝒳 = (X, G,C,H, ), gồm ĐSGT 𝒜𝒳 và phần mở rộng
chứa các từ là lõi ngữ nghĩa (semantics core) các từ của ĐSGT 𝒜𝒳. Việc
hình thức hoá việc mở rộng ĐSGT 𝒜𝒳 được thực hiện một phương pháp đại
số bằng cách đưa thêm một gia tử nhân tạo h0 để sinh lõi ngữ nghĩa core(x)
của mỗi từ x của ĐSGT 𝒜𝒳, tức là core(x) = h0x. Việc hình thức hóa bằng
phương pháp tiên đề hóa cần bảo đảm được điều kiện là H = H {h0} và Xen
= X {h0x : x∈X}.
Để dễ hiểu, ta coi mỗi từ x của biến 𝒳 như một thể hạt có lõi, core(x).
Vì vậy, nếu ta có x<y thì lõi của chúng cũng phải thỏa các bất đẳng thức:
core(x) <y, x<core(y) và core(x) <core(y), nhưng không có cơ sở thông tin
ngữ nghĩa nào về quan hệ thứ tự giữa x và core(x) và do đó chúng không so
sánh được.
57
Vì vậy, chúng ta có thể thiết lập các tính chất trong (2.1), với x,
yDom(𝒳):
x<y core(x)<y & x<core(y) & core(x)<core(y) (2.1)
và x và core(x) là không so sánh được.
Dựa trên hình thức hóa này, cấu trúc của một miền từ có thể sinh các
tập mờ biểu diễn các ngữ nghĩa của các từ mà lõi là một khoảng thay cho
một giá trị, ví dụ, tập mờ hình thang có lõi là các khoảng mờ. Trong trường
hợp ĐSGT thông thường, ngữ nghĩa lõi của x chính là giá trị hàm định lượng
của x. Trong cả hai trường hợp, ngữ nghĩa tính toán lõi của x được kí hiệu là
C-core(x). Về trực quan, lõi ngữ nghĩa nằm trong ngữ nghĩa của từ, nên
chúng ta cần đưa ra ràng buộc đối với ngữ nghĩa tính toán của lõi ngữ nghĩa.
Trong LA này chúng tôi dựa trên ngữ nghĩa khoảng của từ của ĐSGT mở
rộng 𝒜𝒳en, xuất phát từ quan sát thấy rằng ngữ nghĩa của từ ngôn ngữ mờ
thường trong một cộng đồng dân cư chỉ đến khoảng ngữ nghĩa số. Để dễ
hiểu chúng ta quan sát cầu vồng bảy màu. Về vật lý, bảy màu sắc mờ đó
tương ứng với bảy khoảng các giá trị bước sóng liên tiếp. Nghĩa là bảy từ
ngôn ngữ về màu sắc cầu vồng, đổ, cam vàng lục, được tương ứng với
bảy khoảng giá trị bước sóng. Chúng biểu thị các ngữ nghĩa khoảng của bảy
màu sắc cầu vồng. Các từ ngôn ngữ của biến chiều cao CHIỀU_CAO cũng
được gán ngữ nghĩa khoảng trong một cộng đồng dân cư.
Vì vậy, với mỗi biến 𝒳, với U𝒳 là miền xác định số của nó, ta sử dụng
kí hiệu int(U𝒳) để chỉ tập các khoảng của U𝒳, kể cả khoảng suy biến [a, a].
Về phương pháp luận, ta có thể xét ánh xạ giá trị khoảng, kí hiệu là ℐint, ℐint :
Dom(𝒳) → int(U𝒳). Để ℐint được xem là phép giải nghĩa giá trị khoảng của
biến với ngữ nghĩa lõi, ta đưa ra ràng buộc sau:
Ràng buộc 2.5 (Ràng buộc đối với ngữ nghĩa khoảng, ℐint, và lõi của
từ): ℐint được cho là một ngữ nghĩa khoảng của các từ cùng với lõi ngữ nghĩa
của biến 𝒳, nếu nó thỏa mãn điều kiện sau : x của 𝒳, C-core(x) =ℐint(h0x)
ℐint(x).
Như tên của nó, lõi của x được coi là “tâm” của x thì ràng buộc trên là
đương nhiên. Tuy nhiên nó cũng dùng để chỉ ngữ nghĩa khoảng của LFoCs
nên có thể mất thông tin về lõi của từ khi các ngữ nghĩa lõi không xuất hiện
rõ ràng. Điều này đòi hỏi phải xem xét các thuộc tính của các mối quan hệ
58
ngữ nghĩa của lõi từ và các từ khác như các mối quan hệ dựa trên thứ tự
(2.1). Chú ý rằng không phải giải nghĩa tính toán nào cũng có thể bảo toàn
các quan hệ này.
Bây giờ chúng ta khảo sát phép giải nghĩa của các từ khi dùng ngữ
nghĩa tập mờ tam giác hay tập mờ hình thang. Như đã đề cập ở trên, ta có thể
sử dụng biểu diễn bộ 3 cho cả hai loại tập mờ này.
Xem xét một phép giải nghĩa bộ 3, kí hiệu là ℐtrp, ℐtrp : Dom(𝒳) → {(a,
b, d) : a, d∈U𝒳, b∈int(U𝒳)}. Mỗi ℐtrp(x) được gọi là ngữ nghĩa bộ ba của các
từ x, nhớ rằng core(x) ∈Dom(𝒳). Mọi ℐint(core(x)) = ℐint(h0x) bao gồm các
giá trị của U(𝒳) phù hợp nhất với x và, vì thế, về mặt ngữ nghĩa chúng
không thể thuộc vào ngữ nghĩa của những từ khác. Do đó, khoảng
ℐint(core(x)) = (b, c) có thể được viết như bộ ba (b, b, c), với b = (b,c) và, với
xy, ℐint(core(x))ℐint(core(y)) = . Điều này cùng với (2.1) gợi ý chúng ta
đưa ra một ràng buộc để bảo toàn ngữ nghĩa dựa trên thứ tự như sau:
Ràng buộc 2.6. Cho một quan hệ thứ tự mong muốn ≼ trên bộ ba theo
Định nghĩa 2.1, ngữ nghĩa bộ ba ℐtrp(x), ngữ nghĩa khoảng ℐint(x) của các từ
trong 𝒳 cần bảo toàn các ngữ nghĩa của từ và lõi ngữ nghĩa của từ bằng các
điều kiện ràng buộc sau:
(i) ℐtrp(core(x)) = ℐint(core(x))
(ii) Với 2 từ bất kỳ x và y:
x<y ℐtrp(core(x))≼ℐtrp(y) & ℐtrp(x)≼ℐtrp(core(y)).
II.3. Giải nghĩa tính toán của LFoCs với tập mờ tam giác/ hình thang
Trong các tiếp cận hiện nay, một cấu trúc tập mờ biểu diễn ngữ nghĩa
tính toán của các từ được gán không phụ thuộc ngữ nghĩa của bản thân các
từ đó mà chỉ dựa trên trực giác của người dùng. Để thể hiện sự khác nhau
giữa tiếp cận ĐSGT (HA) và các cách tiếp cận hiện có, chúng tôi giới thiệu
cách chúng tôi xây dựng tập mờ hình thang hoặc tam giác để biểu diễn ngữ
nghĩa của khung NTNN (LFoCs) sao cho chúng thỏa các ràng buộc được đề
xuất. Như thường lệ, tập mờ được xây dựng được gán cho các từ bởi một
phép giải nghĩa ℐ có thể thỏa mãn vài hoặc tất cả các ràng buộc được đề xuất.
Cho khung NTNN (LFoC) 𝔉 của 𝒳 có mức tính đặc tả k. Để đơn giản,
giả sử rằng tập H bao gồm 2 gia tử, L(little) và V(very), và một nhân tạo h0.
59
Chúng ta bắt đầu với cấu trúc dựa trên thứ tự của 𝔉 và quan hệ G-S của các
từ trong 𝔉: hx là đặc tả hơn x hoặc x là khái quát hơn hx, với mọi hx𝔉.
1) Xây dựng đa mức đặc tả 𝔉: Phân chia 𝔉 theo các mức đặc tả sao cho
các từ ở cùng một mức có cùng mức độ chung-riêng hoặc, một cách tương
đương, chúng có dùng độ dài. Ký hiệu 𝔉k là tập các từ của 𝔉 có độ dài k, k =
0, 1, , κ, với 𝔉0 = {0, W, 1}, 𝔉1 = {01, c, c+, 11}, 𝔉2 = {02,Vc, Lc, Lc+,
Vc+, 12}, 𝔉3 = {03,VVc, LVc, LLc, VLc, VLc+, LLc+, LVc+, VVc+, 13}
Sự có mặt của các từ nhân tạo 0k and 1k xuất phát từ yêu cầu phân hoạch mờ
của 𝔉j phải đầy đủ. Hơn nữa, việc thêm các từ như vậy làm cho tập 𝔉 trở nên
phong phú hơn.
2) Xây dựng biểu diễn đa thể hạt mờ của 𝔉: Mọi mức đặc tả 𝔉k được
biểu diễn bởi tập mờ tam giác/hình thang phân hoạch như biểu diễn ở Hình
2.3, trong đó có 3 phân hoạch mờ. Cấu trúc tập mờ như vậy được gọi là đa
thể. Có thể dễ dàng xác minh rằng cấu trúc này bảo toàn quan hệ G-S của
các từ trong 𝔉: độ hỗ trợ của tập mờ của hx được bao gồm trong độ hỗ trợ
của tập mờ của x.
Việc xây dựng cấu trúc đa thể hạt như vậy cho 𝔉 rất đơn giản: (i) với
mỗi k, tính các khoảng mờ, ℑ(h0x), các lõi của tập mờ tam giác/hình thang
tương ứng, của từ của 𝔉k, và đặt chúng trong U(𝒳). Sau đó, xây dựng một
phân hoạch mờ tam giác/hình thang mạnh trên mức k sao cho ℑ(h0x) là lõi
của tập mờ tam giác/hình thang tương ứng. Giá (support) của tập mờ được
xác định duy nhất bởi khoảng tính mờ của các từ ngôn ngữ tương ứng. (ii)
Cấu trúc đa mức thu được của tập mờ tam giác/hình thang được xây dựng
theo cách này được gọi biểu diễn đa thể hạt mờ biểu diễn ngữ nghĩa của 𝔉
(xem Hình 2.3).
3) Tính giải nghĩa của 𝔉 được định nghĩa bởi cấu trúc đa thể hạt mờ:
Chúng tôi đã lập luận rằng một khái niệm phức tạp như ngữ nghĩa của
từ ngôn ngữ cần phải được nghiên cứu dựa trên các quan điểm khác nhau để
làm rõ các khía cạnh ngữ nghĩa ẩn chứa trong các từ của ngôn ngữ tự nhiên.
Và cấu trúc đa thể hạt được xây dựng chứa các đặc tính đa dạng cho phép
xác định các phép giải nghĩa khác nhau nhằm diễn giải các khía cạnh ngữ
nghĩa cá biệt của mỗi từ.
60
Cho một cấu trúc đa thể hạt, chẳng hạn giống như cấu trúc cho trong
Hình 2.3. Từ cấu trúc đa thể hạt, chúng ta có thể xác định các phép giải
nghĩa như sau:
(I1) Giải nghĩa tập mờ của 𝔉: Nó là phép giải nghĩa, ký hiệu là ℐfuz, gán
mỗi từ x trong 𝔉 một tập mờ tam giác/hình thang có lõi là ℑ(h0x) – khoảng
tính mờ của từ h0x.
Ví dụ, sử dụng đa thể hạt trong Hình 2.3, ta có ℐfuz(VVc+) là tập mờ
hình thang ở Level 3 có nhãn VVc+, ℐfuz(Vc+) là tập mờ hình thang ở Level 2
có nhãn Vc+, còn ℐfuz(c-) là tập mờ hình thang ở Level 1 có c-, v.v
(I2) Ngữ nghĩa khoảng ℐint của 𝔉: Phép giải nghĩa khoảng ℐint được định
nghĩa đơn giản như sau: Với x𝔉,
(i) ℐint(x) là giá (support) của tập mờ tam giác/hình thang ℐfuz(x), tức
là ℐint(x) là đáy của hình tam giác hay đáy lớn của hình thang;
(ii) Nếu từ x = h0y, ℐint(x) = ℐint(h0y) = ℑ(h0x), lõi của tập mờ x.
(I3) Ngữ nghĩa bộ ba ℐtrp của 𝔉: Cho x𝔉, ℐtrp(x) = (a, b, d), với (a, d) là
độ hỗ trợ của tập mờ ℐfuz(x) và b = ℐint(h0x) = ℑ(h0x).
Bây giờ, chúng tôi chứng minh định lý phát biểu như sau :
Định lý 2.1. Giải nghĩa ℐfuz và ℐtrp của khung nhận thức ngôn ngữ 𝔉, liên
kết với ngữ nghĩa khoảng ℐint, định nghĩa bởi cấu trúc đa thể mờ được xây
dựng như trên thỏa mãn tất cả các ràng buộc từ 2.1 – 2.6.
0 W 1
c c
+
Lc Vc
+
Level 0
Level 1
01 11
12 Lc
+
Level 2
Vc
02
Hình 2.3. Đa thể hạt với tập mờ tam giác/hình thang của các từ trong LFoC
𝔉
Level 3
03 13 VVc+ LVc
+
VLc+ LLc+ VLc
LLc
VVc
LVc
61
Chứng minh: Các ràng buộc 2.1 và 2.1 đòi hỏi ngữ nghĩa tập mờ cần
phải được sinh ra từ ngữ nghĩa của các từ ngôn ngữ và cần phải dựa trên một
cơ sở hình thức hóa toán học chặt chẽ để tránh trực quan hay cảm tính. Các
phép giải nghĩa ℐfuz và ℐtrp được xây dựng dựa trên phương pháp biểu diễn đa
thể hạt của khung nhận thức ngôn ngữ, được biểu thị ở Hình 2.3, dựa trên
các miền từ được mô hình bởi ĐSGT được phát triển bằng phương pháp tiên
đề hóa với các tiên đề của chúng được lựa chọn là các tính chất vốn có của từ
và các gia tử. Phương pháp xây dựng cấu trúc đa thể của các tập mờ ở Hình
2.3 được xây dựng dựa trên các khoảng tính mờ của các lõi ngữ nghĩa của
các từ trong khung nhận thức ngôn ngữ. Như vậy, việc xây dựng cấu trúc đa
thể các tập mờ hoàn toàn dựa trên các từ của miền ngôn ngữ được mô hình
hóa bởi ĐSGT và phương pháp lượng hóa ngữ nghĩa của từ và ngữ nghĩa lõi
cũng được phát triển bằng phương pháp tiên đề [58,56,43,11] nên các giải
nghĩa ℐfuz và ℐtrp được xây dựng thỏa các ràng buộc 2.1 và 2.2.
Để kiểm tra Ràng buộc 2.3, có thể kiểm tra ℐint được định nghĩa như trên
thỏa mãn Ràng buộc 2.3 thì bảo toàn quan hệ chung-riêng của các từ của 𝔉.
Theo định nghĩa, có thể thấy rằng các giải nghĩa ℐfuz và ℐtrp liên quan đến giải
nghĩa ℐint, như độ hỗ trợ của ℐfuzz(x) chỉ là khoảng ℐint(x) và nếu ℐtrp(x) = (a, b,
d), thì (a, d) = ℐint(x). Vì vậy, ℐfuz và ℐtrp tạo ra ngữ nghĩa khoảng của chính
mình thỏa mãn Ràng buộc 2.3.
Xuất phát từ định nghĩa ta thấy rằng ℐint thỏa mãn Ràng buộc 2.5 và ℐtrp
thỏa mãn (i) của Ràng buộc 2.6. Để chứng minh rằng ℐtrp thỏa mãn (ii) của
Ràng buộc 2.66, chúng ta giả sử là x<y, kéo theo core(x)<core(y) và do đó
ℑ(h0x) = ℐint(h0x) = ℐtrp(core(x)) = b= (b, c) < ℑ(h0y) = ℐint(h0y) = ℐtrp(core(y))
= b’ = (b’, c’).
Giả sử bởi (I3) là ℐtrp(x) = (a, ℐint(h0x), d) và ℐtrp(y) = (a’, ℐint(h0y), d’).
Như vậy, cũng bởi (I3), ta có ℐtrp(x) = (a, b, d) và ℐtrp(y) = (a’, b’, d’). Khi
ngữ nghĩa bộ ba của ℐint(h0x) và ℐint(h0y) tương ứng là (b, b, c) và (b’, b’, c’),
bất đẳng thức ℐint(h0x)ℐint(h0y) ở trên bao gồm cả ℐint(h0y)ℐint(y) kéo theo
bởi Định nghĩa. 2.1 là ℐtrp(core(x))≼mℐtrp(y) & ℐtrp(x)≼mℐtrp(core(y)), theo (iv)
của Định nghĩa. 2.1, là yêu cầu của (ii) trong Ràng buộc 2.6.
Bây giờ, ta chứng minh cả ℐfuz và ℐtrp thỏa mãn Ràng buộc 2.4 với ≼ của
Định nghĩa 2.1. Chú ý rằng, với tập mờ khác với dạng tam giác/hình thang,
62
sẽ có khác biệt lớn giữa ℐfuz và ℐtrp. Tuy nhiên, khi ℐfuz được định nghĩa bởi
tập mờ tam giác/hình thang, quan hệ thứ tự ≼ được định nghĩa trên tập mờ
tam giác/hình thang có thể được xem như đồng nhất với cái được định nghĩa
trên bộ ba theo nghĩa là có tồn tại một đẳng cấu thứ tự từ cái này đến những
cái khác. Vì vậy đủ để chứng minh là ℐtrp thỏa mãn Ràng buộc 2.4, có nghĩa
là nó bảo toàn thứ tự từ khi dùng quan hệ thứ tự ≼ của bộ ba.
Để đơn giản hóa việc trình bày, chúng tôi chứng minh tính hợp lệ của
Ràng buộc 2.4 đối với các trường hợp, với ℐtrp được định nghĩa bởi cấu trúc
cụ thể biểu diễn trong Hình 2.3. Trong trường hợp chung, chứng minh có thể
được tổng quát từ cái này, mặc dù có nhiều trường hợp hơn được xem xét.
Chúng tôi thấy rằng, với bất kỳ x, y𝔉, xy,
x≤y ℐtrp(x) ℐtrp(y) & ℐtrp(x) ≼ℐtrp(y) (2.2)
Chúng tôi giả sử đầu tiên cả x và y cùng thuộc {0k, k = 0 – 3} hoặc {1k,
k = 0 – 3}, có thể dễ dàng xác minh rằng, theo phát biểu (iii) của Định nghĩa.
2.1, chúng ta có ℐtrp(x) ≼wℐtrp(y).
Giả sử rằng ít nhất một trong số x và y nằm giữa 0k và 1k, với một số k, k
= 0–3. Trước tiên, khi x<y, chúng ta suy ra ℐtrp(core(x))=bx ℐtrp(core(y))=by.
Đó là, luôn có ít nhất một trong ba bất đẳng thức trong việc xác định tính
hợp lệ của ℐtrp(x) ≼ℐtrp(y).
Chúng ta chứng minh các trường hợp:
+ Với trường hợp x, y ở cùng một mức đặc tả, liên quan đến Hình 2.3,
rõ ràng là các bộ ba ℐtrp(x) = (ax, bx, dx) và ℐtrp(y) = (ay, by, dy) thỏa mãn (2.2)
vì chúng được xác định bởi độ hỗ trợ và các lõi của các tập mờ tam giác/hình
thang tương ứng với dạng một phân hoạch mạnh của cấu trúc đa thể hạt.
Hơn nữa, có thể thấy rằng quan hệ thứ tự giữa chúng là mạnh, nghĩa là nó là
≼s.
+ Trong trường hợp các từ x, y không thuộc về cùng một mức đặc tả.
Nếu x{0k, k = 0–3}, dễ dàng xác minh một trong hai ℐtrp(x)≼mℐtrp(y) hay
ℐtrp(x) ≼sℐtrp(y).
Giả sử x∉ {0k, k = 0–3} và, do đó nó được tạo ra từ c hay c+. Có nhiều
trường hợp con:
63
∘ lev(x)>lev(y), với lev(z) ký hiệu độ đặc tả của z, số của mức trong cấu
trúc Hình 2.3: Đầu tiên, xét trường hợp lev(y) = 0. Nếu y = 10, thì x là c hoặc
c+. Tham khảo Hình 2.3, chúng ta có ℐtrp(x) ≼sℐtrp(y). Tương tự, nếu y = W,
thì x là c hoặc con bất kỳ của nó và ta có một trong hai ℐtrp(x) ≼mℐtrp(y) hoặc
ℐtrp(x) ≼sℐtrp(y).
Giả sử là lev(y)<0, ta có x = σx’, với lev(x’) = lev(y). Trong HA bất kỳ,
x<y kéo theo x’y. Khi x’= y, ta có x = σy<y (nghĩa là với x = VLc+ hay LLc+
và y = c+). Ở đó cũng tồn tại z trên lev(x) được sinh từ y, nhưng nằm phía bên
phải của y, nghĩa là z =σ’y>y. Giả sử ℐtrp(x) = (ax,bx,dx) và ℐtrp(z) = (az,bz,dz)
rằng cả hai đều bao gồm trong ℐtrp(y) = (ay,by,dy), nó kéo theo dzdy. Do đó,
bằng việc xây dựng phân hoạch mờ, ta có dxbz<dzdy. Điều này cho thấy
tính hợp lệ của ℐtrp(x) ≼mℐtrp(y).
Bây giờ chúng ta xem xét trường hợp x’<y, nó kéo theo là dx’bydy (có
thể, y = 1lev(y)). bằng lý luận tương tự x’ đóng vai trò của y, ta thu được dx<dx’,
kết quả dx<dy, bất đẳng thức yêu cầu.
∘ lev(x) <lev(y): Vì cấu trúc đa thể hạt là đối xứng, lý luận tương tự như
trong trường hợp được xem xét ở trên khi áp dụng một đối số kép (dual
argument).
II.4. Kết luận chương 2
Trong chương này, LA đã nghiên cứu tính giải nghĩa được dựa trên khái
niệm phép giải nghĩa (interpretation) để chuyển tải bảo toàn ngữ nghĩa của
biểu thức ngôn ngữ là khung NTNN sang biểu thức tính toán biểu diễn cấu
trúc ngữ nghĩa của khung NTNN. Một số vấn đề sau đã được giải quyết:
1) Nghiên cứu, phân tích phép giải nghĩa như là việc nghiên cứu mối
quan hệ giữa ngữ nghĩa thế giới thực của các biểu thức ngôn ngữ và ngữ
nghĩa tính toán của biểu thức tính toán gán cho biểu thức ngôn ngữ. Tính giải
nghĩa được của biểu thức tính toán của nó dựa trên ý tưởng là phép giải
nghĩa cần phải bảo toàn các quan hệ được phát hiện dựa trên ngữ nghĩa của
biểu thức ngôn ngữ. Ý tưởng này là khác biệt với khái niệm tính giải nghĩa
được của các hệ mờ được nghiên cứu trong phạm vi lý thuyết tập mờ. Trên
cơ sở ý tưởng này, đề xuất lược đồ giải bài toán tính giải nghĩa được của
biểu diễn tính toán của các khung nhận thức ngôn ngữ (khung NTNN), trong
64
đó khâu phát hiện cấu trúc ngữ nghĩa của khung NTNN có ý nghĩa quan
trọng.
2) Thay cho việc đưa ra các ràng buộc đối với tập mờ được thiết kế để
bảo đảm tính giải nghĩa được của các hệ mờ như trong các nghiên cứu hiện
nay, dựa trên lược đồ đề cập ở trên, LA nghiên cứu đề xuất các ràng buộc
đối với các phép giải nghĩa được xây dựng để chuyển tải, bảo toàn các khía
cạnh ngữ nghĩa mong muốn của khung NTNN cho các hệ mờ. Điều này cho
thấy phương pháp tiếp cận dựa trên ĐSGT hoàn toàn khác biệt với các cách
tiếp cận hiện tại đối với vấn đề tính giải nghĩa được. Hơn nữa, tiếp cận dựa
trên ĐSGT tương tự và tương thích với ý tưởng để giải quyết khả năng giải
nghĩa được của các ngôn ngữ lập trình hình thức, trong đó ngữ nghĩa của các
biểu thức cú pháp được xác định bằng phép giải nghĩa gán cho chúng các đối
tượng toán học nhất định được xem là những ngữ nghĩa của chúng. Cách giải
nghĩa này nhằm bảo toàn tính hợp lệ của ngữ nghĩa của chúng trên cơ sở bảo
toàn các tiên đề đối với cấu trúc toán học được gán cho các biểu thức cú
pháp.
3) Ứng dụng phương pháp tiếp cận ĐSGT giải bài toán tính giải nghĩa
được của biểu diễn tính toán các khung NTNN bằng việc xây dựng cấu trúc
đa thể hạt các tập mờ tam giác hay các tập mờ hình thang. Các tính chất quan
trọng của ngữ nghĩa cấu trúc của khung NTNN là các quan hệ thứ tự, quan
hệ chung-riêng gắn kết với chức năng ngữ nghĩa của các gia tử và lõi ngữ
nghĩa của các từ ngôn ngữ. Chúng dẫn đến các ràng buộc đối với việc biểu
diễn tính toán khung NTNN áp đặt lên các phép giải nghĩa được nghiên cứu.
Cấu trúc đa thể của các tập mờ được nghiên cứu trong chương này sinh ra
hay xác định các phép giải nghĩa sang các đối tượng tính toán như tập mờ
tam giác, tập mờ hình thang, ngữ nghĩa khoảng, ngữ nghĩa số ... Đã chứng
minh các phép giải nghĩa thỏa tất cả hay một phần những ràng buộc đã thảo
luận và đề xuất.
65
CHƯƠNG 3. TÍNH GIẢI NGHĨA ĐƯỢC THEO NGỮ NGHĨA
THẾ GIỚI THỰC CỦA CÁC BIỂU THỨC NGÔN NGỮ
III.1. Mở đầu
Mục tiêu của lý thuyết tập mờ là thiết lập một cơ sở tính toán mô phỏng
khả năng thao tác ngôn ngữ của con người trong việc mô tả, nhận thức thế
giới thực cũng như trong tư duy, lập luận. Các hệ mờ mà thành phần quan
trọng của chúng là cơ sở tri thức luật và phương pháp lập luận mờ là một
công cụ dựa trên lý thuyết tập mờ để mô phỏng hữu hiệu những khả năng đó.
Về bản chất, mỗi hệ mờ là một biểu thức tập mờ được thao tác dựa trên
một cơ sở hình thức tính toán nào đó trong lý thuyết tập mờ (như đại số các
tập mờ, phương pháp lập luận ).Trong đó mỗi tập mờ được gán nhãn ngôn
ngữ và chúng được xem như là biểu diễn ngữ nghĩa tính toán của các nhãn
ngôn ngữ đó. Do vậy, mỗi biểu thức tập mờ được tương ứng với một biểu
thức ngôn ngữ mà con người đọc được và hiểu được (Comprehensive) và nó
được xem là một biểu diễn tập mờ của biểu thức ngôn ngữ đó.
Vấn đề giải nghĩa (interpretation) của ngôn ngữ lập trình, hay rộng hơn
là của lý thuyết hình thức hóa dựa trên một ngôn ngữ hình thức, là việc gán
các đối tượng của một cấu trúc toán học mong muốn, xem chúng như là ngữ
nghĩa, cho các biểu thức của ngôn ngữ hình thức hóa, sao cho các tiên đề và
định lý của lý thuyết hình thức hóa đó là định lý trong cấu trúc toán học đang
xem xét (xem [53,55]). Vì các cấu trúc toán học biểu thị cấu trúc các sự vật
trong thế giới thực nên bản chất của việc giải nghĩa các biểu thức kí hiệu của
ngôn ngữ hình thức là việc gán ngữ nghĩa thế giới thực cho các biểu thức kí
hiệu sao cho các tính chất phát biểu bằng ngôn ngữ hình thức hóa đúng là
các tính chất quan sát được trong thế giới thực.
Đối với các lý thuyết chính xác như toán và vật lý, tính giải nghĩa được
thế giới thực của chúng như là một đòi hỏi tự nhiên và hiển nhiên, nhưng chỉ
là ngầm định (implicit). Điều này cùng với tính không chắc chắn
(uncertainty), không đầy đủ (incomplete), tính phức tạp có thể dẫn đến lý
thuyết tập mờ không để ý đến đòi hỏi này. Chẳng hạn, đại số các tập mờ
chuẩn (standard) là không giải nghĩa được thế giới thực. Ví dụ ta có biểu
66
thức các từ của biến chân lý “true OR very true = very true”. Tuy nhiên, có
thể thấy rõ ràng rằng giữa hai biểu thức tập mờ tương ứng với hai vế đẳng
thức trên, đẳng thức không xảy ra: FS(true)FS(very true) ≠ FS(very true).
Nghĩa là, tính đúng đắn của đẳng thức trong biểu thức ngôn ngữ không được
bảo toàn. Lý thuyết tập mờ là rất vĩ đại với vô số những thành tựu ứng dụng
của nó ở hầu hết mọi lĩnh vực của đời sống kinh tế - xã hội nên không thể
nói các cách tiếp cận dựa trên lý thuyết tập mờ là thiếu cơ sở. Nhưng để thấy
sự khác biệt giữa những cách tiếp cận đó với cách tiếp cận dựa trên ĐSGT,
trong chương này, theo hướng nghiên cứu trong [5], LA nghiên cứu tính giải
nghĩa được của các hệ mờ dựa trên ngữ nghĩa thế giới thực (Real-world
semantics based interpretability hay RW
Các file đính kèm theo tài liệu này:
- luan_an_nghien_cuu_tinh_giai_nghia_duoc_cua_he_mo_theo_ngu_n.pdf