DANH MỤC HÌNH VẼ . iv
DANH MỤC BẢNG.vii
MỞ ĐẦU . 1
Chương 1. TỔNG QUAN VỀ DỊCH MÁY VÀ NGÔN NGỮ UNL . 7
1.1.Một số khái niệm sử dụng trong luận án. 7
1.2.Một số hướng tiếp cận trong dịch tự động . 9
1.2.1. Dịch máy dựa trên luật .10
1.2.2. Dịch máy dựa trên ngữ liệu .12
1.2.3. Phương pháp dịch kết hợp.14
1.2.4. Đánh giá .15
1.3.Dịch đa ngữ . 16
1.4.Vấn đề dịch tự động cho tiếng Việt. 20
1.5.Tổng quan về UNL. 22
1.5.1. Giới thiệu .22
1.5.2. Ngôn ngữ UNL.22
1.5.3. Hệ thống UNL.29
1.5.4. Một số kết quả nghiên cứu liên quan.31
1.5.5. Ứng dụng UNL làm ngôn ngữ trục trong hệ thống dịch đa ngữ .33
1.6.Tiểu kết chương. 35
Chương 2. ĐỀ XUẤT MÔ HÌNH DỊCH TIẾNG VIỆT - UNL . 37
2.1.Đặt vấn đề. 37
2.2.Ngữ pháp tiếng Việt . 39
2.3.Đề xuất mô hình dịch . 41-ii-
2.3.1. Công cụ EnCoVie.42
2.3.2. Công cụ DeCoVie .45
2.3.3. Từ điển trong UNL.46
2.3.4. Luật ngữ pháp trong UNL .49
2.4.Một số vấn đề cần xử lý cho tiếng Việt. 56
2.5.Tiểu kết chương. 58
Chương 3. GIẢI PHÁP XÂY DỰNG TỪ ĐIỂN VÀ LUẬT . 60
3.1.Giải pháp xây dựng từ điển tiếng Việt - UNL. 60
3.2.Giải pháp xây dựng luật ngữ pháp . 69
3.2.1. Xây dựng luật mã hóa.69
3.2.2. Xây dựng luật giải mã.83
3.3.Tiểu kết chương. 94
Chương 4. THỬ NGHIỆM VÀ ĐÁNH GIÁ. 96
4.1.Xây dựng công cụ EnCoVie và DeCoVie. 96
4.1.1. Xây dựng công cụ EnCoVie .96
4.1.2. Xây dựng công cụ DeCoVie.99
4.2.Thử nghiệm và đánh giá.114
4.2.1. Từ điển tiếng Việt – UNL.114
4.2.2. Dịch đa ngữ qua ngôn ngữ trục UNL.115
4.3.Tiểu kết chương.122
KẾT L ẬN .123
TÀI LIỆ THAM KHẢO .128
PHỤ LỤC.137
187 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 436 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận án Sử dụng ngôn ngữ trục trong dịch đa ngữ, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
nhân xưng
thứ hai trong cấu trúc chứ không phải là sự khởi đầu cho hành động, mối quan hệ
77
ngữ nghĩa “obj” trong UNL được định nghĩa tương đương với quan hệ ngữ pháp
trên bởi luật sửa đổi trái như sau:
<{v,vt,order:null:null}{p,pp:null:obj};
Quan hệ “gol” định nghĩa trạng thái cuối cùng đạt được mà một việc nhắm
đến. Quan hệ này có dạng cấu trúc tổng quát: gol(occur,thing và
gol(do,thing), trong đó UW được xem là sự kiện còn UW là trạng thái cuối
cùng cụ thể mà liên quan đến UW . Ví dụ, câu tiếng Anh “The lights changed from
green to red” được định nghĩa mối quan hệ giữa “change” và “red” bởi quan hệ ngữ
nghĩa “gol” với cấu trúc gol(do,thing): “gol(change(gol>thing,obj>thing,
src>thing),red(aoj>thing,mod<thing))”.
Trong cấu trúc trên, trạng thái cuối cùng mà động từ sai khiến nhắm đến đạt
được là hoạt động của động từ ngoại động. Mối quan hệ trên được định nghĩa trong
UNL bằng quan hệ ngữ nghĩa“gol” bởi luật sửa đổi phải như sau:
<{v,vt,order:null:null}{v,vt:null:gol};
3.2.1.2. Xây dựng luật mã hóa câu ghép tiếng Việt
Về phương diện cấu trúc, câu ghép bao gồm hai hoặc hơn hai bộ phận câu
tương đối độc lập và có hai trung tâm vị ngữ trở lên. Quan hệ trong các câu ghép về
cấu trúc cũng như về quan hệ ý nghĩa đều có tính chất chặt và lỏng. Câu ghép lỏng
các vế câu dễ tách thành câu riêng còn trong câu ghép chặt, các vế gắn với nhau
bằng từ nối hoặc cặp từ nối.
Các bộ phận câu ghép được nối với nhau bằng ba cách: nối bằng từ ngữ có
tác dụng nối, nối trực tiếp là sử dụng các ký hiệu, nối bởi các cặp từ quan hệ. Trong
câu ghép tiếng Việt, người ta chia thành 9 nhóm câu tương ứng với 80 mô hình
[21]. Trong phần này tác giả xây dựng luật mã hóa cho ba cách nối và trong mỗi
cách nối có mã hóa một số mô hình thuộc nhóm trên.
Trường hợp cấu trúc câu ghép thứ nhất: Sử dụng dấu phẩy “,” để nối hai
vế câu, mô hình cấu trúc như sau:
78
C1 – V1, C2 – V2
Xét trường hợp với C là “đại từ nhân xưng”, V gồm “vừa + động từ trạng
thái+ danh từ đơn thể”, C là “đại từ nhân xưng” và V là “sẽ + động từ ngoại
động + tính từ tính chất”.
Với các từ loại trên, tập luật được xây dựng cho một trường hợp cấu trúc cụ
thể câu sau: đại từ nhân xưng + phụ từ(vừa)+ động từ trạng thái
+ danh từ đơn thể, đại từ nhân xưng + phụ từ (sẽ) + động từ
ngoại động + tính từ chỉ tính chất.
Với cấu trúc này ta có các ví dụ tương ứng: Chúng tôi vừa lỡ xe buýt, chúng
tôi sẽ đến muộn; Tôi vừa lỡ tàu, tôi sẽ đến muộn; .
Thời thể từ là một từ loại rất quan trọng trong tiếng Việt, vì nó gắn với động
từ tạo thành một phạm trù ngữ pháp về thời gian ở quá khứ - hiện tại – tương lai.
Phụ từ “vừa” đi trước động từ nhằm diễn đạt ý nghĩa thời gian hành động xảy ra
trước thời điểm nói không lâu và tương ứng với thuộc tính được định nghĩa trong
UNL là “@present,@complete”. Phụ từ “sẽ” cũng đặt trước động từ để diễn đạt ý
nghĩa ngữ pháp chỉ thời tương lai của hành động và tương ứng với thuộc tính được
định nghĩa trong UNL là “@future”. Luật kết hợp phải được sử dụng để nối phụ từ
“sẽ, vừa” vào trước động từ “vs, vt”. Luật được xây dựng như sau:
-{“vừa”:null:null}{v,vs:+.@present,+.@complete,+.@entry:
null};
-{“sẽ”:null:null}{v,vt:+.@future,+.@entry:null};
Tính từ là những từ diễn đạt những đặc điểm về chất lượng, tính chất, màu
sắc, mùi vị, trạng thái, quan hệ của các danh từ hay đại từ [ 6]. Tính từ được phân
thành loại34: tính từ tính chất (Property adjective-Ap), tính từ quan hệ (Relative
adjective-Ar), tính từ tượng thanh (Onomatopoetic adjective-Ao), tính từ tượng hình
(Pictographic adjective-Ai). Tính từ chỉ tính chất là những từ mang ý nghĩa về các
34
https://vlsp.hpda.vn/demo/vcl/PoSTag.htm
79
loại phẩm chất, hay về lượng thuộc nhiều mặt như mật độ, độ dài, trọng lượng, hình
dạng, màu sắc, mùi vị, âm thanh.
Đại từ nhân xưng bị ảnh hưởng bởi động từ trạng thái nên một quan hệ ngữ
nghĩa “obj” được định nghĩa tương ứng trong UNL bởi luật sửa đổi phải như sau:
>{p,pp,@pl:null:obj}{v,vs:null:null};
Quan hệ “cob” định nghĩa một việc bị ảnh hưởng trực tiếp bởi một hành
động ở trạng thái nào đó. Quan hệ này có dạng cấu trúc tổng quát:
cob(occur,thing) và cob(do,thing), trong đó UW là sự việc được xem là
bị ảnh hưởng bởi UW . Ví dụ, câu tiếng Anh “dead with Mary” được định nghĩa
mối quan hệ giữa “die” và “Mary” bởi quan hệ ngữ nghĩa “cob” với cấu trúc
gol(do,thing) là “cob(die(obj>living thing), Mary(icl>person))”.
Danh từ đơn thể bị ảnh hưởng bởi động từ trạng thái, mối quan hệ trên được
định nghĩa trong UNL bằng quan hệ ngữ nghĩa“cob” bởi luật sửa đổi trái như sau:
<{v,vs:null:null}{n,nt:null:cob};
Mối quan hệ “agt” trong UNL được định nghĩa tương ứng giữa đại từ nhân
xưng và ngoại động từ bởi luật sửa đổi phải như sau:
>{p,pp,scope01:null:agt:01}{v,vt,@future:+scope01:null};
Quan hệ “tim” trong UNL định nghĩa thời gian mà sự kiện xảy ra hoặc trạng
thái là đúng. Quan hệ này có dạng cấu trúc tổng quát: tim(occur,time),
tim(do,time) và tim(be,time), trong đó UW là sự kiện hay trạng thái, còn
UW là thời gian diễn ra. Ví dụ, câu tiếng Anh “Let’s start when come” được
định nghĩa mối quan hệ giữa “start” và “come” bởi quan hệ ngữ nghĩa “time” với
cấu trúc gol(do,time): “tim(start(icl>do), come(icl>do))”.
Tính từ chỉ tính chất chỉ trạng thái về mặt thời gian gắn với động từ ngoại
động được định nghĩa trong UNL bởi quan hệ ngữ nghĩa “tim” tương đương bởi luật
sửa đổi trái như sau:
<{v,vt,scope01:null:nul}{a,ap:null:tim:01};
80
ấu phẩy là ký hiệu được sử dụng trong cấu trúc để nối hai mệnh đề của câu.
Các luật giải quyết như sau:
:{“,”:null:null}{“,”:+comma:null};
>{v,vs,@entry:null:cnt}{comma:null:null};
-{“:01”:null:null}{P,PP,@pl:+scope01:null};
Trường hợp cấu trúc câu ghép thứ hai: Nối bằng từ ngữ có tác dụng nối:
và, hoặc, bởi vì, mặc dù .Trong phần này, xây dựng luật mã hóa với nhóm của
dạng câu bình đẳng với từ nối “và” (trong phụ lục E của luận án).
C1 – V1 và C2 – V2
Xét trường hợp với C là “đại từ nhân xưng”, V là “động từ ngoại động”,
C2 là “đại từ nhân xưng” và V2 là “động từ ngoại động”.
Với các từ loại trên, tập luật được xây dựng cho một trường hợp cấu trúc cụ
thể câu sau: đại từ nhân xưng + động từ ngoại động + “và” + đại
từ nhân xưng +động từ ngoại động.
Với cấu trúc này, ta có các ví dụ tương ứng: Tôi nói và anh ấy nghe; Anh ấy
đọc và chúng tôi ghi;
Mối quan hệ “agt” trong UNL được định nghĩa tương ứng giữa đại từ nhân
xưng và ngoại động từ bởi luật sửa đổi phải như sau:
>{p,pp:null:agt}{v,vt,CogAct:+@present,+@entry:null};
>{p,pp,scope01:null:agt:01}{v,vt,PhyAct:+@present,+@entry:
null};
Quan hệ “and” trong UNL định nghĩa một mối quan hệ kết hợp giữa các khái
niệm. Quan hệ này dạng cấu trúc tổng quát: and(uw,uw), trong đó UW và UW2
là hai khái niệm khác nhau được nhóm lại. Ví dụ, câu tiếng Anh “... easily and
quickly” được định nghĩa mối quan hệ giữa “easily” và “quickly” bởi quan hệ “and”
là “and (quickly, easily)”
Từ nối liên từ “và” biểu thị quan hệ liên hợp giữa hai sự vật, hiện tượng, quá
trình, tính chất cùng loại, cùng phạm trù được định nghĩa quan hệ ngữ nghĩa “and”
81
trong UNL tương ứng bởi luật sửa đổi phải như sau:
:{“và”,c:null:null}{“:01”:+and:null};
>{v,vt,CogAct:null:and}{and:null:null};
-{“:01”:null:null}{P,PP:+scope01:null};
Trường hợp cấu trúc câu ghép thứ ba: Sử dụng cặp từ nối như “nhờ có
nên”, “nếu thì.”, “tuy nhưng”, Trong nội dung này, xây dựng luật
mã hóa với nhóm của dạng câu điều kiện với cặp từ nối “nếu thì ” (trong
phụ lục E của luận án).
Nếu C1 – V1 thì C2 – V2
Xét trường hợp với C là “đại từ nhân xưng”, V là “động từ ngoại động +
tính từ chí tính chất”, C là “đại từ nhân xưng” và V2= “sẽ + động từ trạng thái +
danh từ trừu tượng”.
Với các từ loại trên, tập luật được xây dựng cho một trường hợp cấu trúc cụ
thể câu sau: “nếu” + đại từ nhân xưng + động từ ngoại động +
tính từ chỉ tính chất+ “thì”+ đại từ nhân xưng + “sẽ” +động
từ trạng thái+ danh từ trừu tượng.
Với cấu trúc này ta có các ví dụ tương ứng: Nếu anh ấy học chăm chỉ thì anh
ấy sẽ đỗ học kì; Nếu chúng tôi làm việc chăm chỉ thì chúng tôi sẽ có tiền,
Quan hệ “con” trong UNL định nghĩa một sự kiện hay trạng thái không phải
là trọng tâm nhưng trong điều kiện trọng tâm của một sự kiện hay trạng thái. Quan
hệ này dạng 4 cấu trúc tổng quát: con(be,uw), con(do,uw), con(occur,uw)
và con(uw(aoj>thing),uw), trong đó UW là sự kiện hay trạng thái trọng tâm,
UW2 là điều kiện sự kiện hay trạng thái. Ví dụ, câu tiếng Anh “If you are tired, we
will go straight home” được định nghĩa mối quan hệ giữa “If you are tired” và “go”
bởi cặp quan hệ: “aoj:01(tired(aoj>thing,modmove(agt>
thing,gol>place,src>place)), :01)”
Cặp nối “nếu ... thì....” trong cấu trúc trên để gắn kết hai vế của câu tạo thành
một câu ghép với ý nghĩa hoàn chỉnh. Trong UNL để mô tả điều kiện thực hiện một
82
sự việc nào đó được định nghĩa bởi quan hệ “con”, luật chuyển đổi cặp từ nối trong
tiếng Việt tương ứng với UNL như sau:
-{“nếu”,c:null:null}{P,PP:+if :null};
+{v,vt,CogAct,if:+then:nul}{[thì],c:null:null};
:{if,then,con:-if,-then,-con:null}{“:01”:+if,then,con:null};
>{v,vt,CogAct,@entry:null:con}{if,then,con:null:null};
-{“:01”:null:null}{P,PP:+scope01:null};
Phụ từ “sẽ” cũng đặt trước động từ để diễn đạt ý nghĩa ngữ pháp chỉ thời
tương lai của hành động và tương ứng với thuộc tính được định nghĩa trong UNL là
“@future”.
-{“sẽ”:null:null}{v,vs,agt:+.future,+.@entry:null};
Mối quan hệ “agt” trong UNL được định nghĩa tương ứng giữa đại từ nhân
xưng, ngoại động từ và động từ trạng thái bởi luật sửa đổi phải như sau:
>{p,pp:null:agt}{v,vt,CogAct:+@entry,+@present:null};
>{p,pp,scope01:null:agt:01}{v,vs,agt:+scope01:null};
anh từ trừu tượng chỉ thời điểm xảy ra động từ trạng thái, mối quan hệ giữa
hai từ loại này được định nghĩa tương đương trong UNL bởi quan hệ “tim” như sau:
<{v,vs,agt,scope01:null:nul}{n,na,time:null:tim:01};
Quan hệ “man” định nghĩa một cách thức để thực hiện một sự kiện hoặc đặc
điểm của trạng thái. Quan hệ này dạng cấu trúc tổng quát: man(be,how),
man(do,how), man(occur,how) và man(uw(aoj> thing),how), trong đó
UW là sự kiện hay trạng thái, UW là cách thức thực hiện. Ví dụ, câu tiếng Anh
“move quickly” được định nghĩa mối quan hệ giữa “move” và “quickly” bởi quan hệ
“man(move(agtplace, src>place), quickly)”.
Tính từ tính chất gắn với thuộc tính “aways” là chỉ cách thức để thực hiện
ngoại động từ được định nghĩa trong UNL với quan hệ “man” bởi luật sau:
<{v,vt,CogAct:null:nul}{a,ap,ways:null:man};
83
3.2.2. Xây dựng luật giải mã
Để tạo ra một câu tiếng Việt đúng ngữ pháp từ biểu thức UNL, tập luật giải
mã được xây dựng dựa vào việc xác định mối quan hệ giữa biểu thức UNL với cấu
trúc ngữ pháp câu tiếng Việt tương ứng. Tiếp đến là quá trình chuyển giao từ vựng
giữa hai ngôn ngữ, sắp xếp từ và hình thái của câu.
Ví dụ biểu thức UNL như sau:
{unl}
aoj(teacher(icl>educator>thing).@entry.@present.@affirmative,
I(icl>person))
{/unl}
Đồ thị biểu diễn biểu thức UNL trên như sau:
H nh 3.2. Đồ hị biểu iễn biểu hức NL
Khi biểu thức UNL được chuyển sang câu tiếng Việt, việc đầu tiên là xác
định sự tương quan ngữ pháp giữa hai ngôn ngữ và chuyển giao từ vựng tương ứng.
Hình 3.3 là một ví dụ minh họa.
H nh 3.3. Mối ương quan giữa hai ngôn ngữ Việ và NL
teacher(icl>educator>thing)
.@entry.@present.@affirmative
I(icl>person)
aoj
teacher(icl>educator>thing)
.@entry.@present.@affirmative
I(icl>person)
aoj
Teacher giáo viên
@present.@affirmative
I tôi
Aoj trạng thái sự việc
Đại từ
anh từ đơn thể
84
Bước tiếp là sắp xếp trật tự từ để tạo câu đầu ra tiếng Việt.
H nh 3.4. Sắp xếp rậ ự các ừ câu ầu ra iếng Việ
Cuối cùng là dựa vào các thuộc tính đi kèm để hoàn chỉnh ngữ pháp câu
tiếng Việt và tạo khoảng trống giữa các từ trong câu.
H nh 3.5. Sắp xếp rậ ự các ừ câu ầu ra iếng Việ
Trong mục 3.2.2.1 và 3.2.2.2 sẽ trình bày các giải pháp xây dựng tập luật giải
mã cho hai trường hợp: biểu thức chứa nhiều nút con và biểu thức chứa nút kết hợp
(scope). Trên mỗi trường hợp, luận án chỉ giải quyết một số dạng biểu thức chứa
một số quan hệ nhị phân.
3.2.2.1. Trường hợp biểu thức chứa nhiều nút con
Trường hợp biểu thức chứa một nút con có quan hệ “aoj(n,nt;p,pp)”
H nh 3.6. Đồ hị NL biểu iễn cho biểu hức có mộ nú c n
Teacher giáo viên
@present.@affirmative
I tôi
Aoj trạng thái sự việc
Đại từ
anh từ đơn thể
Trạng thái sự việc
@present.@affirmative
tôi giáo viên
@present.@affirmative
là giáo viên Tôi
UW (n,nt)
UW (p,pp)
aoj
85
Ví dụ một trường hợp với biểu thức UNL có một nút con với quan hệ ngữ
nghĩa “aoj” và từ vựng thứ nhất chứa thuộc tính “n,nt”, từ vựng thứ hai chứa thuộc
tính “p, pp” như sau:
{unl}
aoj(teacher(icl>educator>thing).@entry.@present.@affirmative,
I(icl>person))
{/unl}
Quan hệ “aoj” trong UNL định nghĩa một sự việc mà đang ở một trạng thái
hoặc thuộc tính nào đó với cấu trúc aoj(UW1=thing,UW2=thing). Ví dụ ta có
quan hệ “aoj (nice,ski(agt>person)”, trong đó UW sẽ là thuộc tính của UW với
đầu ra là “Skiiing is nice”.
Luật chèn một nút mới có thuộc tính “p,pp” vào bên trái nút có thuộc tính
“n,nt” và quan hệ “aoj” giữa hai nút bị xóa bỏ.
:“n,nt:null:aoj”{p,pp:null:null};
Thuộc tính “@affirmative” được định nghĩa trong UNL mang ý nghĩa khẳng
định quan điểm của người nói. Thuộc tính này nếu gắn với quan hệ ngữ nghĩa “aoj”
và thuộc tính “@present” được hiểu là gắn với hệ từ “là” trong tiếng Việt. Luật này
chèn một nút mới có nội dung là “là” với thuộc tính “c”.
:“[là]:+c:null”{n,nt.@affirmative:-@present,@affirmative
:null};
Để tạo thành một câu đích hoàn chỉnh, quá trình chuyển đổi còn sử dụng các
luật để tạo khoảng cách trắng giữa các từ trong câu như sau:
:{p,pp,^blk:+blk:null}“[],blk:null:null”;
:{C,^blk:+blk:null}“[],blk:null:null”;
Trường hợp biểu thức có nhiều nút con chứa các quan hệ
“agt(v,vt;p,pp)”, “obj(v,vt;n,na)” và “pcl(n,na;n,ng)”.
86
H nh 3.7. Đồ hị NL biểu iễn cho biểu hức có nhiều nú c n
Ví dụ trường hợp với biểu thức UNL có nhiều nút con và chứa quan hệ:
{unl}
agt(send(icl>direct>do,plt>uw,plf>thing,agt>volitional_
thing,obj>thing,rec>thing).@entry.@present,i(icl>
person))
obj(send(icl>direct>do,plt>uw,plf>thing,agt>volitional_thing,
obj>thing,rec>thing).@entry.@present,letter(icl>
text>thing))
plc(letter(icl>text>thing),post(icl>upright>thing))
{/unl}
Quan hệ “agt” định nghĩa một sự việc khởi đầu cho một hành động với cấu
trúc agt(UW1=do,UW2=thing). Ví dụ, ta có quan hệ “agt(translate (agt>thing
,gol>language,obj>information,src>language), computer(icl>machine))”, trong đó
UW2 là khởi đầu cho hành động của UW và câu đầu ra là “computer translates”.
Luật chèn một nút mới có thuộc tính “p,pp” vào bên trái nút có thuộc tính
“v,vt” và quan hệ “agt” giữa hai nút bị xóa bỏ.
:“v,vt:null:agt”{p,pp:null:null};
Quan hệ “obj” định nghĩa một việc trung tâm bị ảnh hưởng trực tiếp bởi một
sự kiện hoặc trạng thái với cấu trúc obj(UW1=do,UW2=thing). Ví dụ, ta có quan hệ
“obj(move(gol>place,obj>thing,src>place),table(icl> furniture))”, trong đó UW
bị ảnh hưởng trực tiếp bởi sự kiện của UW với đầu ra là “the table moved”.
Luật chèn một nút mới có thuộc tính “n,na” vào bên phải nút có thuộc tính
agt UW (v,vt)
UW (p,pp)
UW (n,na)
UW (n,ng)
obj
plc
87
“v,vt” và quan hệ “obj” giữa hai nút bị xóa bỏ.
:{v,vt:null:null}“n,na:null:obj”;
Quan hệ “plc” định nghĩa nơi mà sự kiện xảy ra hoặc một trạng thái là đúng
hoặc một sự việc tồn tại với cấu trúc obj(UW1=thing,UW2=thing). Ví dụ, ta có
quan hệ “plc(cook(icl>do),kitchen(pof>building))”, trong đó UW là sự kiện và
UW là địa điểm và đầu ra tương ứng là “ cook in the kitchen”.
Luật chèn một nút mới có thuộc tính “n,ng” vào bên phải nút có thuộc tính
“n,na” và quan hệ “plc” giữa hai nút bị xóa bỏ.
:{n,na:null:null}“n,ng:+@plc:plc”;
Nếu một từ có thuộc tính “@plc” và UW có thuộc tính “n,ng” là dấu hiệu
nhận biết đây là một từ chỉ địa điểm, trong tiếng Việt sẽ thêm giới từ “ở” để biểu thị
điều sắp nêu ra là nơi, chỗ, khoảng thời gian sự vật hay sự việc được nói đến tồn tại
hay diễn ra. Luật chèn một nút mới “ở” có thuộc tính “e” vào bên trái nút có thuộc
tính “n, ng, @plc”.
:“[ở]:+e:null:null”{n,ng,@plc:-@plc:null};
Để tạo thành một câu đích hoàn chỉnh, quá trình chuyển đổi còn sử dụng các
luật để tạo khoảng cách trắng giữa các từ trong câu như sau:
:{p,pp,^blk:+blk:null}“[],blk:null:null”;
:{v,vt,^blk:+blk:null}“[],blk:null:null”;
:{n,na,^blk:+blk:null}“[],blk:null:null”;
:{e,^blk:+blk:null}“[],blk:null:null”;
3.2.2.2. Trường hợp biểu thức chứa nút kết hợp
Trường hợp biểu thức có các quan hệ “agt(v,vt;p,pp)” và “and- nút kết
hợp”.
88
H nh 3.8. Đồ hị NL biểu iễn biểu hức chứa nú kế hợp rường hợp 1
Ví dụ một trường hợp với biểu thức UNL có nút kết hợp và chứa ba quan hệ:
{unl}
agt(speak(icl>communicate>do,equ>talk,agt>person,cao>thing,me
t>thing,ptn>person).@entry.@present,i(icl> person))
and(:01,speak(icl>communicate>do,equ>talk,agt>person,cao>thin
g,met>thing,ptn> person).@entry.@present)
agt:01(listen(icl>hear>do,agt>person,obj>thing).@entry.@prese
nt,he(icl>person))
{/unl}
Quan hệ “agt” định nghĩa một sự việc khởi đầu cho một hành động với cấu
trúc agt(do,thing). Quan hệ “agt”, ta thấy UW được xem là vai trò trực tiếp
để UW xảy ra. Luật chèn một nút mới có thuộc tính “p,pp” vào bên trái nút có
thuộc tính “v,vt” và quan hệ “agt” giữa hai nút bị xóa bỏ.
:“v,vt:null:agt”{p,pp:null:null};
Quan hệ “and” định nghĩa một mối quan hệ kết hợp giữa hai khái niệm khác
nhau với cấu trúc and(uw,uw). Ví dụ, quan hệ “and(dance(agt>person),
sing(agt>person))” là định nghĩa hai khái niệm “ singing and dancing”. Luật này
sẽ chèn một nút mới có thuộc tính “scope,and” vào bên phải nút có thuộc tính “v,vt”
và quan hệ “and” giữa hai nút bị xóa bỏ.
:{v,vt:null:null}“[:01]:+scope,+and:and”;
Tập luật xóa nút kết hợp được định nghĩa bởi quan hệ “and”:
agt
and
UW (v,vt)
UW (p,pp)
UW (v,vt)
UW (p,pp)
agt
89
:“[và]:+and:null:null”{scope,and:-and:null};
:{scope:null:null}“v,vt:@entry:null”;
DL“scope:nul:null”{v,vt:null:null};
Để tạo thành một câu đích hoàn chỉnh, quá trình chuyển đổi còn sử dụng các
luật để tạo khoảng cách trắng giữa các từ trong câu như sau:
:{p,pp,^blk:+blk:null}“[],blk:null:null”;
:{v,vt,^blk:+blk:null}“[],blk:null:null”;
:{and,^blk:+blk:null}“[],blk:null:null”;
:{p,pp,^blk:+blk:null}“[],blk:null:null”;
Trường hợp biểu thức có các quan hệ “obj(v,vs;p,pp)”, “cob(v,vs;n,nt)”,
“agt(v,vt;p,pp)”, “tim(v,vt;a,ap) và “cnt-nút kết hợp”.
H nh 3.9. Đồ hị NL biểu iễn biểu hức chứa nú kế hợp rường hợp 2
Ví dụ biểu thức UNL có nút kết hợp và chứa năm quan hệ:
{unl}
obj(miss(icl>occur,com>fail,cob>thing,obj>thing).@entry.@pres
ent.@complete,we(icl>group).@pl)
cob(miss(icl>occur,com>fail,cob>thing,obj>thing).@entry.@pres
ent.@complete,bus(icl>public_transport>thing))
cnt(miss(icl>occur,com>fail,cob>thing,obj>thing).@entry.@pres
ent.@complete,:01)
obj
tim
cnt cob
UW (v,vs)
UW (p,pp)
UW (n, nt)
UW (v,vt)
UW (p,pp)
agt
UW (a,ap)
90
agt:01(come(icl>move>do,plt>place,agt>person).@entry.@future,
we(icl>group).@pl)
tim:01(come(icl>move>do,plt>place,agt>person).@entry.@future,
late(icl>how,ant>early))
{/unl}
Mối quan hệ “obj” định nghĩa một sự việc trung tâm bị ảnh hưởng bởi một sự
kiện hoặc trạng thái với cấu trúc obj(do,thing). Ví dụ, quan hệ “obj(move
(gol> place, obj> thing,src>place), table(icl>furniture))” là định nghĩa UW là sự
kiện mà UW được xem là ảnh hưởng trực tiếp “the table moved”. Luật này sẽ chèn
một nút mới có thuộc tính “p,pp” vào bên trái nút có thuộc tính “v,vs” và quan hệ
“obj” giữa hai nút bị xóa bỏ.
:“v,vs:null:obj”{p,pp:null:null};
Mối quan hệ “cob” định nghĩa một sự việc nào đó bị ảnh hưởng trực tiếp bởi
một sự kiện hoặc trạng thái với cấu trúc cob(occur,thing). Ví dụ quan hệ “cob
(die(obj>living thing), Mary(icl>person))” là định nghĩa UW bị ảnh hưởng trực
tiếp bởi UW “dead with Mary”. Luật này sẽ chèn một nút mới có thuộc tính “n,nt”
vào bên phải nút có thuộc tính “v,vs” và quan hệ “cob” giữa hai nút bị xóa bỏ.
:{v,vs:null:null}“n,nt:null:cob”;
Mối quan hệ “cnt” định nghĩa nội dung khái niệm với cấu trúc
“cnt(thing,thing)”. Ví dụ, quan hệ “cnt(UNL(icl>Universal Networking
Language),Universal Networking Language)” UW2 là nội dung giải thích cho UW1
“UNL, Universal Networking Language”. Luật này sẽ chèn một nút mới có thuộc
tính “scope, comma” vào bên phải nút có thuộc tính “v,vs” và quan hệ “cnt” giữa hai
nút bị xóa bỏ.
:{v,vs:null:null}“:01:+scope,+comma:cnt”;
Quan hệ “agt” định nghĩa một sự việc khởi đầu cho một hành động với cấu
trúc agt(do,thing), UW được xem là vai trò trực tiếp để UW xảy ra. Luật này
91
sẽ chèn một nút mới có thuộc tính “p,pp” vào bên trái nút có thuộc tính “v,vt” và
quan hệ “agt” giữa hai nút bị xóa bỏ.
:“v,vt:null:agt”{p,pp:null:null};
Mối quan hệ “tim” định nghĩa thời gian xảy ra sự kiện là đúng với cấu trúc
tim(occur,time). Ví dụ quan hệ “tim(leave(icl>do), Tuesday(icl>time))” là
định nghĩa UW được thực hiện toàn bộ xảy ra đúng thời điểm được chỉ định bởi
UW2 “leave on Tuesday”. Luật này sẽ chèn một nút mới có thuộc tính “a,ap” vào
bên phải nút có thuộc tính “v,vt” và quan hệ “tim” giữa hai nút bị xóa bỏ.
:{v,vt:null:null}“a,ap:null:tim”;
Tập luật xóa nút kết hợp được định nghĩa bởi quan hệ “cnt”:
:“[vừa]:+r:null:null”{v,vs,@complete:-@complete:null};
:“[,]:+commo:null”{scope,commo:-commo:null};
DL“blk:nul:null”{comma:null:null};
:{scope:null:null}“v,vt:null:null”;
DL“scope:nul:null”{v,vt:null:null};
:“[sẽ]:+r:null:null”{v,vt,@future:-@future:null};
Để tạo thành một câu đích hoàn chỉnh, quá trình chuyển đổi còn sử dụng các
luật để tạo khoảng cách trắng giữa các từ trong câu như sau:
:{p,pp,^blk:+blk:null}“[],blk:null:null”;
:{r,^blk:+blk:null}“[],blk:null:null”;
:{v,vs,^blk:+blk:null}“[],blk:null:null”;
:{n,nt,^blk:+blk:null}“[],blk:null:null”;
:{comman,^blk:+blk:null}“[],blk:null:null”;
:{p,pp,^blk:+blk:null}“[],blk:null:null”;
:{r,^blk:+blk:null}“[],blk:null:null”;
:{v,vt,^blk:+blk:null}“[],blk:null:null”;
Trường hợp biểu thức có các quan hệ “agt(v,vt;p,pp)”, “man(v,vt;a,ap),
“agt(v,vs;p,pp)”, “tim(v,vs; n,na)” và “con-nút kết hợp”.
92
H nh 3.10. Đồ hị NL biểu iễn biểu hức chứa nú kế hợp rường hợp 3
Ví dụ biểu thức UNL có nút kết hợp và chứa năm quan hệ sau:
{unl}
agt(learn(icl>acquire>do,src>uw,agt>volitional_thing,obj>thin
g).@entry.@present,he(icl>person))
man(learn(icl>acquire>do,src>uw,agt>volitional_thing,obj>thin
g).@entry.@present,studiously(icl>how,com> studious))
con(:01,learn(icl>acquire>do,src>uw,agt>volitional_thing,obj>
thing).@entry.@present)
agt:01(pass(icl>cross>do,via>thing,plt>thing,plf>thing,
agt>thing,plc>thing).@entry.@future,he(icl>person))
tim:01(pass(icl>cross>do,via>thing,plt>thing,plf>thing,
agt>thing,plc>thing).@entry.@future,semester(icl>
school_term>thing)))
{/unl}
Quan hệ “agt” định nghĩa một sự việc khởi đầu cho một hành động với cấu
trúc agt(do,thing), ta thấy UW được xem là vai trò trực tiếp để UW xảy ra.
Luật này sẽ chèn một nút mới có thuộc tính “p,pp” vào bên trái nút có thuộc tính
“v,vs” và quan hệ “agt” giữa hai nút bị xóa bỏ.
agt
con
UW (v, vt)
UW (p, pp)
UW (v,vs)
UW (p,pp)
agt
UW (a, ap)
UW (n,na)
obj
man
93
:“v,vt:null:agt”{p,pp:null:null};
:“v,vs:null:agt”{p,pp:null:null};
Mối quan hệ “man” định nghĩa một cách để thực hiện một sự kiện hoặc một
đặc điểm của trạng thái với cấu trúc man(occur,how). Ví dụ, quan hệ
“man(beautiful, very(icl>how))” UW là cách và UW1 trạng thái được định nghĩa
bởi “....very beautiful”. Luật này sẽ chèn một nút mới có thuộc tính “a,ap” vào bên
phải nút có thuộc tính “v,vt” và quan hệ “man” giữa hai nút bị xóa bỏ.
:{v,vt:null:null}“a,ap:null:man”;
Mối quan hệ “con” định nghĩa một hoàn cảnh để xảy ra sự kiện hoặc trạng
thái nào đó với cấu trúc con(occur,uw) trong đó UW là sự kiện hoặc trạng thái
và UW là hoàn cảnh xảy ra. Ví dụ, quan hệ “aoj:01(tired(aoj>thing,mod<thing),
you); con(go(icl>move(agt>thing,gol>place, src>place)),:01)” được định nghĩa
c
Các file đính kèm theo tài liệu này:
- luan_an_su_dung_ngon_ngu_truc_trong_dich_da_ngu.pdf