MỤC LỤC
----------
NỘI DUNG TRANG
PHẦN 0: MỞ ĐẦU 3
PHẦN 1: TỔNG QUAN
I. Khái quát 4
II. Phạm vi sử dụng 4
III. Người sử dụng 4
IV. Nhiệm vụ 4
PHẦN 2 : QUÁ TRÌNH PHÁT TRIỂN VÀ ĐẶC ĐIỂM CỦA NHẬT NGỮ.
I. Sự du nhập chữ Hán vào Nhật Bản 6
II. Hoàn cảnh ra đời hệ chữ Kana 7
III. Quá trình phát triển của hệ chữ Kana 9
IV. Đặc điểm của hệ chữ Kana 11
V. Chữ Hiragana 11
1. Nguồn gốc chữ Hiragana 11
2. Phạm vi sử dụng 12
3. Bảng ký tự Hiragana 13
4. Âm hữu thanh 13
5. Ảo âm 14
6. Nguyên âm 14
7. Xúc âm 15
VI. Chữ Katakana 15
1. Nguồn gốc hình thành chữ Katakana 15
2. Phạm vi sử dụng 16
3. Cách viết chữ Katakana 18
4. Việc ký âm các từ vay mượn từ tiếng nước ngoài 19
VII. Các kiểu chữ khác trong Nhật Ngữ. 20
VIII. Các dấu câu trong Nhật ngữ. 20
PHẦN 3 : NHẬT NGỮ TRONG TIN HỌC
I. Quá trình phát triển font chữ 2 byte. 21
1. Bộ kí tự tiếng Nhật 21
2. ASCII và Katakana 22
3. 7 bit JIS 23
4. 8 bit JIS 23
5. Sự phát triển của bộ kí tự Kanji 24
6. Bộ ký tự 2 byte (DBCS) 25
7. Sự chuyển đổi giữa SBCS và DBCS 26
8. Shift JIS and JIS 26
9. Unicode và ISO 106-46 27
II. Các phần mềm hỗ trợ việc nhập chữ Kana và Kanji 28
1. IME (Input Method Editor) 29
2. TwinBridge 35
3. Kết luận 41
PHẦN 4 : TÌM HIỂU CÁC CÔNG CỤ HỖ TRỢ CHO PHÁT ÂM
I. Tìm hiểu về Microftsoft Agent 40
1. Microsoft Agent là gì ? 40
2. Cấu hình yêu cầu. 41
3. Cài đặt Microsoft Agent 41
4. Lập trình với Microsoft Agent . 42
5. Cửa sổ các lệnh phát âm (Voice Commands Window). 43
6. Cửa sổ các chức năng hỗ trợ cho đối tượng (Advanced Character Options Window). 44
7. Ví dụ về MS Agent 45
8. .Kết luận 47
II. Tìm hiểu về công cụ Microsoft Linguistic Information Sound Editing 47
1. Cài đặt trình soạn thảo âm thanh 47
2. Tạo mới một tập tin âm thanh 48
3. Tạo thông tin cho ngôn ngữ 48
4. Lưu tập tin âm thanh 49
5. Sử dụng Editor cho Speech Engine khác. 50
6. Kết luật 51
PHẦN 5 : TÌM HIỂU MỘT SỐ TỪ ĐIỂN ĐÃ CÓ.
I. Từ điển EDICT 52
II. Từ điển JEDICT 54
III. Từ điển Babylon 57
IV. Kết luận 60
PHẦN 6 : XÂY DỰNG ỨNG DỤNG MINH HỌA TỪ ĐIỂN VIỆT NHẬT
I. Yêu cầu chung 61
II. Phân tích yêu cầu 61
1. Lựa chọn DBMS và ngôn ngữ lập trình 61
2. Các yêu cầu của đề tài và cách giải quyết 63
3. Thông tin cần lưu trữ 64
III. Các công cụ, phần mềm cài đặt cho chương trình 64
IV. Các lưu đồ
1. Lưu đồ tìm kiếm 65
2. Lưu đồ phát âm 66
V. Các giao diện
1. Màn hình chính 67
2. Màn hình điều chỉnh giọng nói 68
3. Màn hình tra cứu ký tự Kanji 69
4. Bàn phím nhập các ký tự tiếng Việt 69
PHẦN 7 : TỔNG KẾT
I. KẾT LUẬN 70
II. HƯỚNG PHÁT TRIỂN 70
76 trang |
Chia sẻ: maiphuongdc | Lượt xem: 2491 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận văn Từ điển Việt-Nhật, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
t (KO), ở 0E Hex) được dùng để thay đổi giữa bảng mã ASCII va Katakana.
Điều này có nghĩa là ban đầu hệ thống in các ký tự ASCII cho tới khi nó chạy trên SO thì tất cả các ký tự sau đó được in ra là ký tự Katakana. Nó ngừng khi hệ thống tìm ra được ký tự SI, đó là sự chuyển đổi từ chế độ Katakana sang chế độ ASCII. Việc sử dụng một ký tự SI và một ký tự SO để chuyển đổi giữa 2 bảng mã đã xảy ra một số vấn đề, vấn đề này sẽ được đề cập ở phần sau.
8 bit JIS
Vấn đề xảy này không xảy ra khi hệ thống của bạn có thể sử dụng phiên bản 8 bit của JIS X0201- 1989. Trong trường hơp này hệ thống phải có thể làm việc với những ký tự 8 bit (được gọi là 8 bit clean, mà nó thì thường có thể không xảy ra, trong những bổ sung mới nhất của UNIX, thỉnh thoảng chúng được sử dụng bit cao nhất là một bit chẵn lẻ).
Với phiên bản 8 bit bạn không phải dùng kí tự SI và SO để chuyển đổi giữa bảng mã ASCII và Katakana. Ký tự Katakana được định vị ở vùng trên 7F Hex ( vùng không dùng đến). Việc sử dụng vùng này đã nảy sinh một số vấn đề khi bạn làm việc với phầm mềm máy tính PC IBC cũ của Mỹ chẳng hạn, ở máy PC IBM có một bảng mã hoàn toàn khác trong vùng từ 7F Hex đến FF Hex. Nếu bạn bắt đầu dùng phầm mềm nước ngoài thì có thể xảy ra một màn hình nền trông rất tức cười bởi vì có sự xuất hiện của những ký tự Katakana đã được thay thế mà không có luật lệ nào cả. Kết quả là bảng mã ASCII gần như không tương thích.
Ở version 8 bit, vùng dưới 7F Hex gần như tương thích. Chỉ khác là nó làm cho một số các ký tự chỉ gần như tương thích như là có dấu \ (5C Hex) thay thế cho ký tự yên và dấu “ (7Fhex) được thay thế bằng dấu (-). Còn tất cả các ký tự khác thì đúng với ASCII tương ứng.
Những ký tự Katakana có cùng kích thước với kí tư ASCII này được gọi là Half-Width Katakana (trong Japanese Hankaku). Điều này vẫn chưa là giải pháp thõa mãn cho những người sử dụng máy tính tiếng Nhật trước đây. Sự thiếu các ký tự Kanji là một điều quan trọng làm cho họ bắt đầu nghĩ đến cách để tích hợp các ký tự Kanji vào hệ thống máy tính.
Sự phát triển của bộ kí tự Kanji
Để hiểu về quá trình phát triển của bảng mã Kanji chúng ta phải xem bộ ký tự non-electric mà đang được dùng để định nghĩa cho JIS C6226-1978 đang đi theo hướng JIS X0208-1990, là chuẩn hiện nay.
Nhật ngữ có khoảng 40000 đến 60000 chữ Kanji được biết. Vấn đề là không ai có thể nhớ được tất cả chúng. Bộ Giáo Dục đã bắt đầu giới hạn số lượng chữ Kanji được dùng trong giáo dục. Ngày nay một sinh viên Nhật học khoảng 2000 chữ Kanji.
Lịch sử phát triển của chuẩn được bắt đầu với những chữ Kanji được cho phép trong giáo dục. Bảng đầu tiên này được gọi là Toyo Kanji và vào năm 1946 nó có 1850 chữ Kanji. Vào 1981 bảng này được thay thế bằng bảng Yoyo Kanji, có 1946 chữ Kanji.
Những bảng khác được dùng để định dạng bộ ký tự chuẩn là Gakushu Kanji với 1006 chữ Kanji thay thế cho bảng Koyiku Kanji cũ có 881 chữ Kanji, nó tăng thêm 996 chữ Kanji ( năm 1992 ) và bảng ký tự Jimei-yo Kanji có 85 chữ (năm 1946), 112 chữ (năm 1976), 166 chữ (năm 1981) và đến năm 1990 có 284 chữ . Một sự việc thú vị là Gatushu Kanji là một tập hợp con của Joyo Kanji.
Bộ ký tự 2 byte (DBCS)
Bộ ký tự non-electric này được dùng để xác định bộ ký tự chuẩn DBCS JIS X0208-1990 hiện nay. Ngoài những kí tự Kanji, 83 kí tự Hiragana và 86 kí tự Katakana thì chuẩn này còn bao gồm các ký tự xếp theo chữ cái (10 kí tự số, 52 ký tự Latinh), ký tự đặc biệt có 147 ký tự), ký tự Hylạp có 48 kí tự và ký tự Nga có 66 kí tự và những thành phần không luật lệ khác. Suốt những năm sau đã có những thay đổi (X208 được phát hành đầu tiên vào năm 1978, sự thay đổi đầu tiên được thấy năm 1983, phiên bản hiện nay là có từ 1990) nó được thêm vào một số chữ Kanji mới, hình dạng một số chữ thay đổi và có sự thay đổi ở vị trí của một số chữ được thay thế.
Ngày nay chuẩn này chứa 2 cấp độ với 2965 ký tự ở cấp độ 1 và 3388 ký tự ở cấp độ 2. Vào năm 1990 JSA đã giới thiệu một bộ ký tự DBCS bổ sung được gọi là JIS X0212- 1990 (đôi khi còn gọi là JIS cấp độ 3) với 6067 chữ thêm vào. Với sự thêm vào 5801 chữ Kanji thì chuẩn này có 21 ký tự đặc biệt và 245 chữ Latinh, chữ Kirin, chữ Hy Lạp (hầu hết có các dấu trọng âm như các ký tự của German Umlauts, Pháp, Tây Ban Nha, Đan Mạch).
Cái này cho chúng ta tổng cộng 12156 ký tự chuẩn, được chia thành 3 cấp độ. Nhìn theo khía cạnh này thì JIS X0212-1990 là một chuẩn rất tốt cho hầu hết các hệ thống dùng chỉ những ký tự được định nghĩa bởi chuẩn JIS X0212-19XX, tuy nhiên số lượng từ rất lớn này cần nhiều bộ nhớ và nó cũng không thể cho hiển thị ký tự được dùng bởi SBCS. Do đó để mà hiển thị số lượng từ khổng lồ này chúng tai cần ít nhất là một bộ ký tự 2 byte (DBCS).
Ở môi trường chuẩn 7 (hay 8 bit) chúng ta có thể dùng bảng mã có 127 (hay 255) ký tự. Nó thì đủ cho bộ kí tự ASCII chuẩn và một số cái mở rộng cho mỗi quốc gia nhưng nó không đủ lớn để xử lý hàng ngàn ký tự tượng hình Kanji.Để xử lý một số lượng ký tự rất lớn chúng ta cần mở rộng số bit để lưu thông tin của ký tự. Ở môi trường 7 bit một bước logic là dùng 2 byte 7 bit (tức là 14 bit) để lưu thông tin, cái này sẽ cho chúng ta khả năng lưu trữ lên 214 tức là 16384 ký tự. Nếu chúng ta dùng 2 byte 8bit thì chúng ta có thể lưu đến 216 tức là 65536 ký tự). Vấn đề nảy sinh là làm cách nào để phân biệt giữa ký tự SBCS và ký tự DBCS.
Để mà tiếp tục tương thích với bộ ký tự SBCS cũ, bạn phải tìm một giải pháp để định rõ một byte thật sự là một ký tự SBCS hay là một phần của bộ ký tự DBCS .
Sự chuyển đổi giữa SBCS và DBCS
Đáp lại sự đề cập ở trên, nó thì có khả năng sử dụng cơ chế Shift In/Out để phân biệt giữa SBCS và DBCS. Điều này hoàn toàn có ích trong môi trường 7 bit. Nó cũng có thể được dùng trong một môi trưởng 8 bit. Khả năng có thể khác là trong một môi trường 8 bit nó dùng MSB (Most Significant Big) như là cớ để cho thấy rằng byte này là một ký tự SBCS (MSB=0) hoặc một phần của một ký tự DBCS (MSB=1). Một SBCS có thể thấy sự biểu diễn cùa số nhị phân như 0XXXXXXX và DBCS sẽ là 1XXXXXXX.
Ngày nay hầu hết các hệ thống cỡ vừa hoặc lớn đều dùng một trình tự SI/SO (hay còn gọi là KI /KO) để thay đổi giữa những ký tự SBCS và DBCS. Có một cách khác là JSA cho dãy SI /SO này nhưng đáng tiếc là hầu hết những cửa hàng đại lý phần cứng đã chọn dãy SI /SO khác (thường là giữa 1 và 3 byte).
Đôi khi có 2 dãy SI/KO khác nhau, một cái chuyễn đổi về bộ kí tự JIS Roman, cái còn lại chuyển đổi về bộ kí tư ASCII.
Không chỉ dãy SI/SO (KI/KO) có khác nhau về sự thực thi của bộ kí tự Kana/Kanji mà còn khác nhau về vị trí trong ma trận được xác định bằng hai byte. Ngoài ra một số công ty như IBM thì không dùng chuẩn JIS.
Nếu như bạn nhìn kỹ hơn vào những ma trận này, bạn sẽ nhận ra rằng tất cả các nhà buôn đã thay thế vùng JIS hoặc vùng mở rộng ở những nơi khác nhau. Mặc dù nếu các ma trận có cùng một nơi thì không có nghĩa là sẽ có cùng một kí tự Kanji ở cùng chỗ đó.
Trong thế giới máy PC tiếng Nhật thì Shift JIS là chuẩn cho bộ kí tự. Phiên bản này của bộ kí tự JIS đã được di chuyển đến những nơi khác nhau vì ở vị trí này nó có tểh dùng bộ kí tự 7 bit cũ và DBCS mà không cần có dãy SI/SO ( hoặc KI/KO). Trong Shift JIS tất cả các kí tự 7 bit (SBSC) có MSB là 0, giống như 0XXXXXXX. nếu MSB được bật lên 1 thì byte đó là một phần của kí tự DBCS, giống như 1XXXXXXX 1XXXXXXX. Một ưu điểm của Shift JIS là nó thì dễ dàng chuyển đổi từ mã JIS DBCS sang mã Shift JIS DBCS tương ứng.
Shift JIS and JIS
SJIS là hiển thị hai byte của mã Shift JIS và hai byte JIS của mã JIS. SJIS1 là byte đầu tiên JIS2 là byte thứ hai của mã này. Giá trị của những byte này nằm từ 00Hex đến FFHex
SJIS1 = (JIS1 - 21Hex) / 2 +81Hex
if SJIS1 >= 9FHex then JIS1 = JIS1 + 40Hex
if odd(JIS1) then
begin
SJIS2 = JIS2 - 21Hex + 40Hex
if (SJIS2 >+ 7FHex then SJIS2 = SJIS2 + 1
end
else SJIS2 = JIS2 - 21Hex + 9Fhex
Shift JIS được dùng chủ yếu ở PC và một vài máy chủ. Hầu hết những cửa hàng đại lý thường chuyển đổi những đoạn mã giữa mã của họ và JIS hoặc Shift JIS.
Một sự khác nhau nữa của các bộ kí tự là do người sử dụng định nghĩa những kí tự ở nơi khác nhau trong ma trận 2 byte. Những số đó được gọi là kí tự Gaiji thì khác nhau ở mỗi phiên bản của cửa hàng đại lý. Những kí tự Kaiji này rất cần bởi vì một số tên của người Nhật thì được viết với các kí tự Kanji không có chuẩn.
Ví dụ nếu một công ty bảo hiểm muốn in một hóa đơn với tên của khách hàng thì thông thường sẽ dùng những kí tự Gaiji do người dùng định nghĩa cho mục đích này khi mà tên của khách hàng chứa những kí tự Kanji mà không có sẵn trong JIS.
Unicode và ISO 106-46
Unicode xuất phát từ Xerox Parc. Năm 1991, Apple và các công ty khác đã liên hiệp thành một tổ chức phi lợi nhuận gọi là Unicode Consortium nhằm phát triển, duy trì và thúc đẩy chuẩn Unicode. Unicode Consortium đã phát hành Unicode standard version 1.0 vào năm 1991. Cũng vào thời gian này tổ chức ISO (International Standard Organization ) đã hoàn thành bộ mã tương tự gọi là ISO10646. Xét thấy hai bộ mã như vậy là quá nhiều, Unicode Consortium và ISO đã cộng tác với nhau trong hai năm 1991 – 1992 để hợp nhất. Unicode 1.1 và ISO10646 đều phát hành vào năm 1993.
Năm 1994, Nhật và Trung Quốc bắt đầu sáng tạo bộ mã chuẩn cho quốc gia mình trên cơ sở ISO10646. Bộ mã chuẩn dùng tại Trung Quốc là được gọi là mã quốc tiêu GB13000 (GB: guobiao).
Unicode là bộ mã ký tự có chiều rộng 16 bit, bao gồm tất cả các ký tự dùng phổ biến trong các máy tính hiện nay. Nó bao quát các chữ viết trên thế giới, các chữ ấn loát, ký hiệu kỹ thuật và toán học, hình dạng hình học, dấu chấm câu,… bên cạnh các ngôn ngữ hiện đại, Unicode còn có các cổ ngữ như cổ Hy Lạp, Do Thái (hebrew), Pali, Sanskrit và Nhật ngữ (văn viết).
Ngoài ra còn có một vùng gồm 6500 chổ trống để người sử dụng có thể tạo ra những ký tự riêng cho mình. Unicode standard không phân biệt ký tự theo khía cạnh ngữ nghĩa (semantics) hay phát âm (pronounciation).
Bởi vì Hán tự được vay mượn vào tiếng Nhật và Triều Tiên từ lâu cho nên ba ngôn ngữ này dùng chung với nhau một số chữ tượng hình (ideographs). Unicode consortium lựa chọn thể hiện các chữ tượng hình chung này một lần vì mục đích của Unicode Consortium là mã hóa các ký tự độc lập giữa các ngôn ngữ. Điều này cũng bao quát các ký tự được mã hóa theo chuẩn riêng hiện nay của các nước Trung Quốc, Đài Loan, Nhật, và Triều Tiên (Hàn Quốc).
Unicode không phân biệt âm và nghĩa. Thông qua sự thống nhất của chữ Hán, Unicode ấn định khoảng 21.000 code point đối với các chữ tượng hình thay vì là 120.000 nếu phải xử lý riêng biệt cho các ngôn ngữ Châu Á.
Một số chữ tượng hình nom tương tự nhưng ý nghĩa thì rất khác nhau và có thể có một số nét khác nhau, những chữ như vậy thì có code riêng trong các chuẩn của các nước Châu Á. Có nhiều chữ (như chữ Hán giản thể và phồn thể hoặc Kanji của Nhật) khác nhau về hình dạng nhưng ý nghĩa lại giống nhau thì ở các chuẩn mã quốc gia chúng có code riêng thì ở Unicode chúng cũng có code riêng.
Mặc dù những từ được nhìn thấy trên màn hình máy tính nhưng máy tính chỉ biết được những chuỗi mã, mỗi số chỉ tương ứng với một kí tự duy nhất trên màn hình. Một bộ các kí tự được ánh xạ thành các code point được gọi là bộ kí tự được mã hóa (character set encoding). Một sự đồng bộ để có mã đơn giản của sự thay thế mỗi ký tự trong bảng chữ cái với một con số (a=1, b=2, c=3, …). Bảng mã nổi tiếng ASCII có code point được gán cho những ký tự hoa và thường của các kí tự Latin, các con số, và các ký tự thông dụng thường dùng ở Mỹ. Những chữ khác nhau dùng những cách giải mã khác nhau.
Bảng mã của Châu Á có một khó khăn thường gặp là thường có nhiều hơn một chuẩn cho mỗi ngôn ngữ. Ví dụ như tiếng Nhật có đến 3 chuẩn chính được sử dụng là: SHIFT-JIS, ISO-2022-JP, và J-EUC. Mỗi bảng mã được mã hóa bằng những cách không giống nhau, tuy cùng một kí tự nhưng với mỗi chuẩn khác nhau có code point khác nhau.
Các phần mềm hỗ trợ việc nhập chữ Kana và Kanji.
Có thể hiểu rằng người Nhật không thể xây dựng những bàn phím với hàng ngàn phím để nhập vào những kí tự Kana và Kanji. Vì lý do này mà họ đã dùng nhiều cách khác nhau để nhập vào các kí tự. Thường thì việc nhập được xử lý bằng một chương trình gọi là FEP (Front End Processor – Xử Lý đầu cuối). Chương trình này nhận dữ liệu nhập vào từ người sử dụng và xử lý việc chuyển đổi cần thiết thành mã thích hợp. Phần này giới thiệu và mô tả một vài phần mềm hỗ trợ việc nhập các kí tự tiếng Nhật thông dụng hiện nay.
IME (Input Method Editor)
IME là một ứng dụng cung cấp khả năng nhập hàng ngàn các kí tự khác nhau, đang được sử dụng ở các nước Đông Á, để viết các ngôn ngữ của các nước này mà không cần có những bàn phím riêng biệt.
Phiên bản tiếng Nhật của Microsoft Windows95, Windows98, và Windows NT4 đã có đủ các chức năng Microsoft IME (MSIME). Có thể down load tại trang web
Tuy nhiên MSIME chỉ được thiết kế để chạy trên các phiên bản Windows tiếng Nhật. Còn Microsoft Global IME for Japanese thì mới cho phép nhập các kí tự tiếng Nhật trong các ứng dụng được hỗ trợ như Internet Explorer, Outlook Express, Microsoft Office trong các phiên bản Windows ngôn ngữ khác.
Khởi động phần mềm IME
Trước khi mở phần mềm IME, đầu tiên cần phải mở chương trình muốn nhập văn bản ra (ví dụ như chương trình email chẳng hạn) và làm cho chương trình ở trạng thái active (chương trình ở trạng thái active tức là thanh tiêu đề có màu rõ ở phía trên cửa sổ của nó).
Sau đó nhấn tổ hợp phím ALT bên trái và SHIFT cùng một lúc. Thanh công cụ của IME sẽ xuất hiện trên màn hình, nó như sau :
Chú ý phải mở IME và tắt nó cho mỗi chương trình. Nếu có hai chương trình cùng mở và bạn cũng mở chương trình IME cho mỗi cái thì thanh IME sẽ không xuất hiện khi bạn chuyển đổi trong chương trình thứ hai và xuất hiện lại khi bạn chuyển về chương trình đầu tiên.
Thanh công cụ của IME
Phần này trình bày những phần phổ biến của thanh công cụ IME. Ở mỗi phiên bản Windows khác nhau thanh công cụ sẽ khác nhau và cũng có thể tùy biến bằng cách thêm hoặc bỏ đi các nút.
Toolbar cho phiên bản Windows95/98
Toolbar cho phiên bản WindowsXP
Tắt mở nhanh (Quick On/Off) : nút nhỏ này cung cấp nhanh cách chuyển đổi giữa chế độ nhập trực tiếp và chế độ nhập chữ tiếng Nhật.
Thanh kéo (Drag Tab) : bạn có thể click và kéo ở phần này để di chuyển thanh công cụ đến những vị trí khác nhau trên màn hình.
Chế độ nhập (Input Mode) : chuyển đổi chế độ nhập giữa Kana và Roman.
Chế độ chuyển đổi (Conversion Mode) : cho IME biết cách tìm các từ Kanji tương ứng.
Bàn phím IME (IME Pad) : cung cấp những chức năng khác nhau để nhập kí tự Kanji, bao gồm cả cách “vẽ” kí tự.
Đăng kí từ mới (Register Words) : cho phép thêm những từ mới vào tự điển.
Thuộc tính (Properties) : cho phép thiết lập nhiều đặc điểm hoạt động và sự ưu tiên.
Biên tập từ điển (Edit Dictionary) : cho phép sửa chữa tự điển.
Trợ giúp (Help) : đưa ra các thông tin giúp đỡ bằng tiếng Nhật.
Khóa chế độ (Lock Modes) : bắt buộc IME dùng kí tự Kana hoặc kí tự Roman in hoa
Lựa chọn chế độ nhập
Nhập các kí tự vào IME bằng cách gõ các kí tự Roman. IME có thể tự động chuyển thành Hiragana hoặc Katakana tuỳ thuộc vào chế độ nhập mà đang chọn. Chọn thế độ này bằng cách click vào nút “Input Mode” trên thanh công cụ. Nút này có các chọn lựa như sau :
Hiragana : kí tự được nhập vào thành Hiragana. Trong suốt quá trình nhập vào có thể chuyển kí tự nhập Hiragana thành Kanji hoặc Katakana.
Katakana : kí tự được nhập vào là Katakana. Trong suốt quá trình nhập vào có thể chuyển kí tự nhập Katakana thành Kanji hoặc Hiragana.
Full-Width ASCII : kí tự được nhập vào là full-width ASCII. Đây không giống cách nhập thông thường mà là mã kí tự tiếng Nhật. Nếu gởi một tài liệu chứa những kí tự này cho người khác thì người đó sẽ không thể thấy được chúng trừ khi máy tính của người đó có hỗ trợ font tiếng Nhật.
Half-Width Katakana : kí tự được nhập vào là half-width Katakana. Trong quá trình nhập bạn có thể chuyển từ kí tự nhập Katakana sang Kanji hoặc Hiragana
Half-Width ASCII : kí tự được nhập vào là half-width ASCII. Cách này hoàn toàn khác với cách nhập trực tiếp ở trên bởi vì kí tự nhập vào dùng mã tiếng Nhật và bộ font fixed-width. Nếu gởi tài liệu có chứa những kí tự này cho người khác thì người đó cũng không thay được chúng trừ khi máy tính của người đó có hỗ trợ font tiếng Nhật.
Direct Input : các kí tự được nhập trực tiếp không cần IME. Cách này tương tự như khi tắt IME
Nhập văn bản bằng các kí tự Romaji
Bạn nhập các kí tự vào IME bằng cách nhập Romaji. Nếu nhập chữ ở một trong những chế độ kana thì kí tự sẽ được chuyển thành kí tự Hiragana hoặc Katakana tương ứng khi gõ. Ví dụ khi gõ “nihongo” trong chế độ Hiragana sẽ cho kết quả như sau:
after typing "n":
after typing "i":
after typing "h":
after typing "o":
after typing "n":
after typing "g":
after typing "o":
Có thể gõ phím "backspace" khi gõ sai và muốn sửa nó.
Chú ý rằng có một đường gạch zig-zag dưới chữ được nhập, đường này đánh dấu đoạn văn bản như là “xem trước” tức là nó chưa sẵn sàng nhập vào tài liệu lúc đó. Bạn phải “cho phép” đưa nó dưới dạng Kanji vào tài liệu bằng cách nhấn phím “Enter” sau khi đã gõ xong.
Nếu muốn nhập vào kí tự Kanji thì sau đó cần phải chuyển kí tự Kana được nhập vào sang Kanji trước khi nhấn Enter.
Chú ý khi nhập bằng Romaji
Một số điều cần chú ý khi nhập bằng kí tự Romaji :
Nhớ gõ “ha” khi nhập “wa” trong các trợ tư cho chủ ngử vì trong tiếng Nhật nó được viết bằng chữ “ha” Hiragana.
Nhớ gõ chữ “he” khi nhập chữ “e” trong trợ từ chỉ nơi chốn vì trong tiếng Nhật nó được viết bằng chữ “he” Hiragana.
Gõ chữ “wo” cho trợ từ “o”
Gõ “n” hai lần khi nhập âm “n”. IME có thể giải mã âm đọc “n”, nhưng nếu âm tiếp theo bắt đầu với “n’ thì khi đó bạn sẽ không có kết quả đúng. Ví dụ nếu gõ “konnichiha” sẽ có kết quả sai, để có kết quả đúng thì phải gõ “konnnichiha” : hai chữ n đầu là cho âm “n”, chữ n thứ ba là bắt đầu của chữ “ni”. Tốt nhất là nên tập thói quen nhấn n hai lần khi nhập âm đọc n.
Dùng “du” để nhập kí tự “tsu” (tương tự là “zu” cho “su”), và “di” cho “chi” (“ji” cho “shi”)
Chuyển văn bản nhập sang Kanji
Khi bạn gõ văn bản dùng IME, nó được nhập tạm thời với một đường gạch zig- zag ở dưới. Trước khi nhập vào tài liệu cần chuyển nó sang kí tự Kanji. Nó hoạt động như sau :
watashi ha kaerimasu
Có thể nhấn phím ”Enter” để dòng chữ Hiragana được đưa vào tài liệu. Nhưng nếu muốn từ ”watashi” và “kaeri” thành chữ Kanji thì nhấn ”space bar”, dòng văn bản sẽ thay đổi như sau :
IME sẽ quét đoạn văn bản và thay thế những kí tự Hiragana đó với kí tự Kanji mà nó nghĩ là thích hợp nhất. Nó cũng sẽ thay đường zig - zag thành đường gạch thẳng, cho thấy IME đang ở trong chế độ sửa chữa nơi mà bạn có thể thay đổi đoạn văn bản trước khi đồng ý nhập nó vào tài liệu.
IME sẽ chọn kí tự Kanji mà thích hợp nhất, nếu đúng từ cần chọn thì nhấn phím ”Enter” để đưa vào văn bản.
Nếu không đúng với từ cần chọn, làm như sau :
Xem đường gạch đậm dưới chữ “watashi”, đó là đường gạch cho biết phần của cụm từ nhập có thể thay đổi. Nếu muốn thay đổi cho từ “kaerimasu” thì phải dời đường gạch đậm này sang chữ “kaerimasu” bằng cách nhấn phím mũi tên sang phải, nó sẽ như sau :
Tiếp theo nhấn phím ”space bar”
Một danh sách các từ chọn khác nhau xuất hiện.
Dùng phím mũi tên lên/xuống để lựa chọn chữ Kanji cần nhập và nhấn phím ”Enter”. Kết quả như sau :
Có thể tiếp tục hiệu chỉnh các cụm từ khác trong đoạn văn bản bằng cách di chuyển đường gạch đậm bằng phím mũi tên trái/phải. Khi tất cả đã đúng nhấn ”Enter’ để đưa nó vào tài liệu. Sau đó tiếp tục nhập từ khác vào tài liệu.
Vẽ kí tự Kanji
Khi không biết Romaji của kí tự Kanji để nhập vào, có thể vẽ kí tự và IME sẽ nhận dạng nó. Để thực hiện thao tác này, nhấn nút IME Pad trên thanh công cụ.
Nếu “Soft Keyboard” xuất hiện thì click vào biểu tượng mũi tên trên đầu để chuyển sang bảng vẽ.
Còn nếu bảng vẽ đã có thì click nút “clear” để xóa nó.
Vẽ kí tự trên vùng vẽ nằm phía trái bảng vẽ. Khi bạn vẽ thì phần ở giữa sẽ xuất hiện một số chọn lựa mà IME dự đoán là bạn đang vẽ nó. Nếu vẽ sai click nút ”Revert” để xóa đường vẽ mới nhất hoặc nút ”Clear” để xóa hết toàn bộ chữ đang vẽ.
Nếu để con trỏ lên trên một trong những chữ được IME đưa ra ở giữa bảng vẽ thì IME sẽ hiển thị một hộp thoại cho biết cách đọc của từ này.
Khi tìm thấy kí tự đúng ở phần này thì click vào nó để chèn vào dòng đang nhập trong tài liệu. Đóng bảng vẽ hoặc mở nó lại nếu muốn dùng tiếp.
Song Kiều (TwinBridge ® MultiLingual Series)
TwinBridge là phần mềm đa ngôn ngữ của hãng TwinBridge Software Corp. Hãng này cho ra ba chủng loại : Chinese Partner (cho tiếng Hoa), Japanese Partner (cho tiếng Nhật), và Korea Partner (cho tiếng Hàn). Phần này giới thiệu về Japanese Partner.
Japanese Partner tương thích với các version của Windows như Microsoft Chinese-Windows, Japanese Windows95, Korea Windows và các Windows ngôn ngữ khác.
Ngoài chức năng chính là một bộ gõ cho tiếng Nhật , TwinBridge còn có tiện ích khác :
Biên tập Font (Font Editor) : cho phép tạo chữ mới, xóa bỏ hoặc biên tập, backup và restore các outline font, DBCS TrueType font, system bitmap font trong TwinBridge. Đạêc biệt có thể tạo chữ Hán cổ, chữ Nôm và quẻ Kinh Dịch.
SuperMeta Utility : trong vài các ứng dụng đồ họa, các chữ hai byte của tiếng Nhật không xử lý được, tiện ích này có thể export dữ liệu tiếng Nhật vào clipboard hoặc vào một meta file (.wmf) để các ứng dụng đồ họa có thể import dữ liệu này.
Character Map : dùng để dò tìm một chữ Nhật trong số các internal code các nhau.
Thanh công cụ của TwinBridge
Trạng thái hệ thống (System Status) : click nút sẽ hiện ra Japanese Partner, internal code (nội mã), time, date. Khi không chạm đến nhóm nút này, nó sẽ tự giấu đi chỉ chừa lại nút System Status. Khi chạm mouse đến thì nó sẽ hiện ra.
Menu hệ thống (System Menu) : nút này có menu như sau :
Thiết lập hệ thống (System Setup) : nút này có menu như sau :
Japanese Configuratio
Các file đính kèm theo tài liệu này: