Saturday, May 7, 2016

Bộ gõ chữ Hán thương hiệt

1. Giới thiệu

Khoảng năm 1978, một người Hoa tên Chu Bang Phục 朱邦復 đã đưa ra một cách gõ chữ Hán mà ông đặt tên là Thương Hiệt thâu nhập pháp. Ðó là thành tựu sau 8 năm nghiên cứu của ông.

Theo qui định của Chu Bang Phục, mỗi chữ Hán phồn thể được phân tích tối đa là 5 mã (ứng với 5 phím gõ). Cách phân tích lấy mã này gọi là thủ mã pháp 取碼法 . Thương Hiệt thâu nhập pháp dùng 24 mã (ứng với 24 chữ cái Latin hiện trên 24 phím của keyboard). Số mã này (gọi là tự căn 字根 ) chia thành 4 loại: (1) Triết lý 哲理 , (2) Bút hoạch 筆畫, (3) Nhân thể 人體 , và (4) Tự hình 字形 .

Coding of "倉頡輸入法" 

Về sau, Thương Hiệt thâu nhập pháp được giản hoá thành Tốc Thành thâu nhập pháp 速成輸入法. Với Tốc thành, ta lấy không quá 2 mã (đầu và cuối) của một chữ Hán phồn thể (ứng với 2 phím gõ) là có thể gõ được nó. Thí dụ chữ 載 gõ bằng Thương Hiệt là JIJWJ, nhưng gõ bằng Tốc thành là JJ (lấy mã đầu và mã cuối của Thương Hiệt). Sự khác biệt là: gõ JIJWJ ta có ngay 載 gõ JJ ta phải chọn 載 trong 16 chữ có mã đầu và cuối giống nhau là JJ: 南 , 車 , 載 , 轟 , 輯 , 辜 , 軒 , 宰 , 幹 , 廾 , 斡 , 軯 , 窣 , 窲 , 轋 , 轚 .

Bàn phím Thương hiệt

2. Các phím của bộ gõ

Bộ gõ chia làm 4 nhóm phím:
- Triết lý loại: Âm dương ngũ hành được gán cho 7 phím chữ cái đầu tiên. A (nhật 日), B (nguyệt 月), C (kim 金), D (mộc 木), E (thủy 水), F (hoả 火), G (thổ 土).
Bút hoạch loại: nhóm kí tự gốc xếp theo nét bút.
Nhân thể loại: dựa trên ý nghĩa con người và các bộ phận liên quan như nhân 人, tâm 心, thủ 手, khẩu 口.
Tự hình loại: nhóm kí tự gốc xếp theo hình dạng chữ.

Nhóm Phím Tên Nghĩa chính
Triết lý loại A 日 nhật - 日, 曰
- 日 quay 90° (như trong 巴)
B 月 nguyệt - 目, 冂, 爫, 冖.
- 4 nét trên đầu, đầu trái của: 炙, 然, và 祭.
- 4 nét trên đầu trái của 豹 and 貓.
- 4 nét trên đầu của 骨.
C 金 kim - 金, 八, 儿, ソ, ハ, 丷
- Hai nét giáp chót của: 四, 匹 (儿)
D 木 mộc - 木
- Hai nét đầu của: 寸, 才
- Hai nét đầu của: 也, 皮
E 水 thủy 氵, 又, 氺
F 火 hỏa - 小, 灬
- Ba nét đầu của: 當, 光
G 土 thổ土, 士
Bút hoạch loại H 竹 trúc - 竹
- 4 nét đầu của: 笨, 節 (bộ trúc)
- ㄏ,丿, ノ
I 戈 qua - Nét chấm (、)
- Ba nét đầu của: 床, 庫 (广)
- 厶
J 十 thập 十, 宀
K 大 đại - Nét dạng chữ X: 乂ㄨナ犭疒廴
- Hai nét đầu trong 右 (ナ)
- 疒
L 中 trung - Nét sổ (丨)
- 衤
- 4 nét đầu trong 書, 盡
M 一 nhất - Nét hoành (一)
- 厂, 工
- Nét cuối trong 孑, 刁
N 弓 cung Nét hình cung, móc câu: フ, ク, 乙, 亅,ㄱ 
Nhân thể loại O 人 nhân - Bộ nhân 人
- Hai nét đầu trong: 丘, 乓
- Hai nét đầu trong: 知, 攻, 氣
- Nét cuối trong: 兆
P 心 tâm - Bộ tâm 忄
- Nét thứ hai trong: 心
- 4 nét cuối trong: 恭, 慕, 忝
- 匕, 七, 勹
- Hai nét áp chót trong: 代
Q 手 thủ 手, ヰ,扌, ≠
R 口 khẩu Bộ khẩu 口
Tự hình loại S 尸 thi - 匚
- 2 nét đầu của 己 (コ)
- Nét đầu của 司, 刀
- Nét thứ 3 của: 成, 豕
- 4 nét đầu của: 長, 髟 (E)
T 廿 trấp - Hai nét dọc nối bằng một nét ngang: ㅛ, 卄, 廾, 丱, 业, 丷
- Bộ thảo 艸, 艹
U 山 sơn Ba mặt đóng, mở bên trên: ㄩ, 乚, 屮
V 女 nữ - Một nét móc bên phải, hình chữ V: ㄴ,ㄑ, <, レ
- Ba nét cuối của: 艮, 衣, 長
W 田 điền - Đóng bốn phía, bên trong có nét khác: 囗, 田
- Hai nét đầu của: 母, 毋
Y 卜 bốc -卜 ,ㅏ, 亠
- 辶
- Hai nét đầu trong 斗
Phím trùng / đặc biệt * X 重/難 trùng/nan - (1) Các chữ dễ nhầm lẫn, trùng lặp
- (2) Những chữ khó tách riêng
Kí tự đặc biệt * Z (See note) Các kí hiệu đặc biệt, các dấu chấm câu (như 。,、,「 」,『 』).

3. Qui tắc lấy mã

a. Thứ tự lấy mã

Tự thể chữ Hán chia làm 4 loại hình:

- Tịnh liệt hình 並列形: Các bộ phận chữ đứng song song từ trái qua phải, thí dụ 針﹐ 億 ﹐ 轉 ﹐ 順 ﹐ 謝 .

- Thượng hạ hình 上下形: Các bộ phận chữ nằm song song từ trên xuống dưới, thí dụ 哲 ﹐ 三 ﹐ 變 ﹐ 貪.

- Ngoại nội hình 外內形: Bộ phận ngoài bao lấy bộ phận trong, thí dụ 國 ﹐ 圖 ﹐ 區 ﹐ 間 ﹐ 凶 ﹐ 幽 .

- Liên thể hình 連體形: Các nét bút liên tiếp khó nhận ra trái-phải, trên-dưới, hay ngoài-trong, thí dụ 叢 ﹐ 亞 ﹐ 重 ﹐ 兩 ﹐ 爾.

Cách lấy mã cũng theo thứ tự như khi viết chữ: Trái qua phải, trên xuống dưới, và ngoài vào trong.

Cần chú ý:
– Chữ 巾 có | ở vị trí cao nên lấy nó làm mã đầu rồi đến 冂.
– Chữ 麒 có bộ phận trái và phải bình hành, thì lấy 鹿 làm mã đầu, rồi mới đến 其.
– Chữ có các bộ phận trái-phải và trên-dưới, thì lấy mã từ trái qua phải, rồi mới từ trên xuống dưới.
– Chữ có bộ phận bao vây như 囗 ﹐ 冂 ﹐ ㄩ ﹐ ㄈ thì bộ phận ngoài này được ưu tiên làm mã đầu.
– Chữ liên thể thì lấy tối đa 4 mã theo các nét đầu, nhì, ba, cuối. Thí dụ chữ 叢 lấy mã theo các nét ㅛ丷ㅛ又.

b. Số lượng mã:
Ta lấy tối đa là 5 mã cho một chữ Hán không phải là liên thể tự. Cần nhớ ba khái niệm: Tự căn 字根, tự thủ 字首, và tự thân 字身.

- Tự căn 字根: là 24 chữ Hán ứng với 24 chữ cái Latin trên bàn phím. Ðó là cơ sở xác định mã. Số lượng tối đa 5 mã phân bố: 2 mã cho tự thủ và 3 mã cho tự thân.

- Tự thủ 字首: Chữ Hán không phải là liên thể tự có thể phân tích ra các bộ phận trái-phải, trên-dưới, ngoài-trong. Tự thủ là bộ phận bên trái, hoặc bên trên, hoặc bên ngoài của chữ. Tự thủ là 1 hoặc 2 mã thì được lấy trọn. Nếu phân tích thành nhiều mã thì chỉ lấy mã đầu và cuối cho đúng chuẩn là 2 mã:

Chữ Tự thủ Chữ Tự thủ
禾 HD 谷 CR
言 YR 囗 W
走 GO 丿 L
八 C 風 HI
厭 MK 林 DD

Bốn trường hợp sau cũng xem là tự thủ:
1. Các bộ phận mà tự điển xem là bộ thủ như ㄩ ㄈ ㄏ 疒 癶 尸 戶 廴 走 風 毛 ... cũng được xem là tự thủ.
2. Các bộ phận tuy tự điển không xem là bộ thủ thí dụ như   ... cũng được xem là tự thủ.
3. Các bộ phận như 戊 麻 產 辰 厭 厥 羽 府 鹿 亥 老 包 ... tuy không thể phân ly trên-dưới hoặc trái-phải nhưng để tiện lấy mã thì cũng xem là tự thủ.
4. Chữ liên thể thì mã đầu tiên xem như tự thủ.

- Tự thân 字身: Bất kỳ một chữ Hán nào, bỏ tự thủ ra, phần còn lại gọi là tự thân. Tự thân lấy tối đa là 3 mã. Nếu nó phân tích được thành nhiều mã thì lấy 3 mã là: đầu, nhì, cuối. Thí dụ: Ta thấy chữ 頁 nếu đứng một mình thì mã là MBUC, khi là tự thân thì mã là MBC. Chữ 希 nếu đứng một mình thì mã là KKLB, khi là tự thân thì mã là KKB. Chữ 麗 nếu đứng một mình thì mã là MMBBP, khi là tự thân thì mã là MMP. Xem các thí dụ sau:
Chữ Tự thủ Tự thân Trọn chữ
木 D 古 JR DJR
火 F 卓 YAJ FYAJ
金 C 昔 TA CTA
虫 LI 胡 JRB LIJRB
豆 MT 頁 MBC MTMBC
禾 HD 希 KKB HDKKB
日 A 麗 MMP AMMP

c. Liên thể tự:
Thương Hiệt thâu nhập pháp chia chữ Hán làm hai loại: Liên thể tự và phi liên thể tự. Những chữ phi liên thể thì được lấy tối đa 5 mã (tự thủ 2 mã, tự thân 3 mã) mà ta đã biết ở trên. Liên thể tự là những chữ mà nét bút rối rắm giao liên, khó phân ly thành những bộ phận trái-phải, trên-dưới, hoặc ngoài-trong. Liên thể tự lấy tối đa 4 mã (đầu, nhì, ba, cuối). Thí dụ về liên thể tự:

正 MYLM 央 LBK 兩 MLBO 凸 BSS
焉 MYLF 牙 MVDH 步 YLMH 函 NUE
免 NAHU 商 YCBR 乖 HJLP 無 OTF
叢 TCTE 其 TMMC 頁 MBUC 重 HJWG
也 PD 喪 GRRV 業 TCTD 甚 TMMV
凹 SSU 直 JBMM 世 PT 疌 JLYO

Toát yếu:
- Trước tiên ta phải thuộc 24 tự căn và biến thể.
- Nhìn một chữ Hán ta phân tích ngay nó có phải là liên thể tự không? Nếu đúng, lấy tối đa 4 mã: đầu, nhì, ba, cuối.
- Nếu đó là phi liên thể tự, ta phân ly nó ra tự thủ (2 mã: đầu, cuối) và tự thân (3 mã: đầu, nhì, cuối).

Nguồn:
http://vietsciences2.free.fr/sinhngu/hannom/tuhochanngu/ngoaikhoa/chineseime.htm
https://en.wikipedia.org/wiki/Cangjie_input_method

No comments:

Post a Comment