blogger_polezero_中國文字是當今最先進的文字系統-2 Chinese Character as Super 2-dimensional Code-2

資科人看世界之24

中國文字是當今最先進的文字系統-2

Chinese Character as Super 2-dimensional Code-2

無極 PoleZero

註: 以下內容, 純屬作者一般個人意見,不能視為有法律約束力之專業意見,凡涉及如投資、法律、會計、建築或醫療等受法律規管行業之專業問題，如有疑問請自行向具專業操守之相關專業顧問或從業員查詢

免責條款 DISCLAIMER

-1/2/2014

中文落後一説大有市場

多年前曾聽過一位在某大專院校當初級數學講師的人士說中文不及西方文字先進，例如英文是由左至右書寫，配合人面上橫排的眼睛，閲讀速度比中文快；其次是讀音跟串法一致，音字相通，容易學習；最後還有是西方文字的數字系統，令運算非常方便，亦配合横排文字。雖然心中充滿疑惑，但身為大專講師的說話當然有根據，為了尊師重道，但還是没有質疑。

疑惑第一是中文其實可横可直，彈性更大，數學上來説是多了一個自由度（degree of freedom）；第二是中文繹成英文時，字元數總是多了一個可觀的百份比，讀起來豈不是更慢；至於發音，英文字認識多了便發覺是一派胡言，那些外來字才要命，希臘文，拉丁文，法文，西班牙文，葡萄牙文，意大利文等等，都不是按串字來拼音便可以讀得準確。最後更發現阿拉伯數字原來根本就不是西方人的發明，也不是阿拉伯文字，而是印度人的記數符號。但不能否認，箂布箂兹和牛頓等的西方科學家所發展出來的數學符號及運算表達方式是完全超越前人成就的創新發明。

線性排列架構文字訊息承載能力有限

隨著知識和科技的發展，回頭再想起這番隨口說出來的話，更覺是一派胡言。他的理論，不過是個人的主觀感覺，並非因為他對中文和英文都有相同的造諧並且曾進行過嚴肅的研究比較後得出的結論，這是自小讀「番書」長大的人士常有的通病，當年採用淘汰分流學制，英文成績較好，才有升學的機會，出路亦往往比其他人好，能力高的會分流到英文中學，令人覺得懂英文的人比不懂的要優秀得多，英文中學學生面對中文中學學生便充滿優越感，其實這是分流的結果而不是英文教育的功勞。說閲讀速度，如果是一般的記敍文字，個人經驗還是中文快，想當年借閲金庸的武俠小說，為了在限期前歸還，差不多是以一晚兩本的速度來完成，勉强還能應付到朋友們對小説內容的提問。但自已的中文閲讀速度比英文快很大可能是本身的英文程度太低，還是不敢挑戰英文的優越性。

可是，用一維度線性排列方式（one dimension linear permutation）造字的西方文字，在更高層次的訊息處理上，便愈來愈捉襟見肘，在數學運算中，首先是字元不足，什麽二元幾次方程式當然没有問題，但在一些較大型的數學模型中，變數隨隨便便也有十多二十個，廿六個字母當然不敷應用，勉强用下標subscript來將同一字母重覆使用，例如X1, X2...等等。但這樣子的組合，豈不是等於中文字的二維結構原理（two dimensional architecture ），因為同一數字，放在上標位置及下標位置代表不同含義，跟中文字將部首放在九個位置上代表不同的含義是同一道理，那便是數學上的二維座標排列。在生物及化學名詞上，西方文字更是笨拙得要命，例如有機化合物，中文名詞便比英文名詞簡潔得多，隨便拿醇（日常通稱酒精 alcohol,按分子結構分為甲醇 methanol,乙醇 ethanol,丙醇 propanol 等），苯（benzene),氨（ammonia,作字根為ammino），或酮（ketone ）等做例子，都可見到中文比英文簡潔清晰得多，原因是中文具有極為強大的二維造字功能，用資訊科技術語來説是延展性（extendability)優越，佔用的記憶資源及頻寛更少，英文為了分隔文字，更要在兩字之間插入一個佔據一個字節的空格(space)，有電腦知識的不防計算這些名詞的中英文字節數目便清楚。

有機化合物分類
A Alicyclic compound Aliphatic compound Alisiaquinone Alkane Alkene Allocryptopine Aminoketone Anhalamine Anhalonidine Aurantiomide Avicularin Aviculin B Bechgaard salt Biomolecule Bottromycin Bridged compounds Bromofluorocarbon C Carbene 2-Carbomethoxytropinone Carboxylic acid Covalent organic framework Cylindrocyclophanes D Delsoline Diazonium compound E Erinacine Ethylenediamine pyrocatechol Explosophore	F Fluorenylidene Fumitremorgin G Golm Metabolome Database H Half sandwich compound Hericenone Hexaethyl tetraphosphate Hydrogenated starch hydrosylate Hydroxamic acid I In-Methylcyclophane Inducer K Ketone L Ladderane Liriodenine List of organic salts M MassBank (database) O Oreobeiline Organic matter Organic peroxide Organic superconductor Organosulfate Orthoacetic acid Oxalyldihydrazide Oxime	P Perfluorobutanesulfonyl fluoride Perfluorodecyltrichlorosilane Peroxide Persistent carbene Polycyclic compound Polyethylene Succinate S Shearinine Spectral Database for Organic Compounds Spiropyran Sulfite ester T Thiol Thiourea (2,4,6-Trimethylphenyl)gold V Venturamide Vermixocin Volatile organic compound X Xestoquinone

其實說是中文的生化名詞不太準確，應該說是漢字，因為不少是日本人引入西方科技時創造的。日本人曾有一段時間考慮像韓國和越南一樣放棄漢字而改用拼音文字，可是發覺對原來文化的破壞極大，終於没有實行，改為利用原有漢字或創造一些新漢字來翻譯新的科技文字。所以從宏觀一些的角度來看，中文字應該是整個漢字文化的一個主要部份，中文字的存亡，關係到整個漢字文化的存亡，一種文字無論如何先進，没有一個強大的政治經濟文化實體當載體，便無法繼續生存發展，不說埃及和巴比倫文字，兩者都已經隨著原來的民族被征服，毁滅或没落而失傳，就算是拉丁文(Latin)，雖然曾經在羅馬帝國和教廷的強大影嚮力下一度成為歐洲最普及的文字，牛頓和箂布箂兹等科學家的科學文獻很多都用拉丁文發表，現在已經成了死文字，除了教廷的文獻外，只會在法律事務中偶然使用，行外人說是用死人文字來嚇唬活人，行內人則説是死文字不會有新意義可避免混淆。所以中文字和漢字的長處只是先天條件，没有後天的營養注入和一個強大的文化實體當寄主，便難逃死亡的命運，成為没有人懂的死文字，而且肯定會死得比拉丁文更徹底，因為中文更難懂。過去中國百多年的衰落，便令韓國和越南拋棄了漢字。

向詆毁中文者挑機還漢字一個公道

别人要捨棄漢字，是出於短視和功利，誰叫這個「老大」變成「老大衰」，無法保護小的，樹倒猢猻散，要留也留不下。但中國人中，竟亦有不少人要捨棄漢字，那些中不成英不就的小學雞崇洋憤青的意見當然不值一哂，但貌似很科學的理由，例如那位數學講師所説的中文不適合科技的表達和運算便很能騙倒一些人云亦云的人，由於挺中文的大都是學文史哲出身，除了訴諸承傳，民族大義和文學書法藝術外，涉及到科技那邊的辯論便不懂應對，經常輸得一塌糊塗，到現時為止，都不大見有人從科技角度提出理由來支持中文，因為學科技的人都無法避開英文，尖端科技的論文，更是以英文為主，給人的感覺便是科技和西方文字是不可分割的。懂科技的，除了像陳之藩教授，張系國先生那類文理雙絕的少數人外，對文字多數没有太多認識和感情，擅用文字亦不等如懂文字學，結果讓那些胡説八道的謬論有機會大行其道，在下唯有勉為其難出來挑機（嗆challenge），解釋為什中文才是最屈機（即最牛supreme）的文字，有什麽人看到又認同的便口耳相傳，誰是原創者不要緊，在下不會說是抄襲侵權索賠償，還漢字的地位一個公道是地球人的責任。

資訊科技不兼容中文的謬誤

文字在數學角度來看是一種符號系統(notation system)，在資訊科技來說是一種編碼系統（code system），當電腦還在發展初階時，由於開發機構大都位於英語文化地區，他們是不是没有普世觀念不清楚，但没有能力去熟悉世界所有的文字則可以肯定，電腦就是設計給那些懂英語的人士用的，親疏有别得很，一點也不普世，閣下要使用電腦便要學習英文，所以令人以為中文亦不兼容資訊科技。 analog to digital conversion 要知道當初不兼容的原因，得要從電腦處理資訊的基本原理説起：現代資訊科技革命由二進制的運用開始，從前的模擬（analogue）記錄傳送模式，是由聲音和影像自然訊號（signal）的紀錄傳送開始，訊號強弱對應聲音或光線強弱，簡單地轉換成另一種可還原的記錄模式，屬於連續性資訊（continuous data)，對內容的準確還原要求，起始標準很低，因為人的容忍度高，對雜訊造成噪音和雪花，只要能識别便算紀錄傳送成功，但隨著時間過去，要求便逐漸提高，尤其是在文本資料（textual information）那類非連貫資訊（discrete data）的記錄和傳送，例如電腦程式（program code）或文件（document），失真和訊號衰減問題便不能容忍，因為程式原代碼（program code），那怕是一個錯誤，整個系統的運作便會崩潰。重要文件，同樣無法容忍內容出現錯誤。對連貫性的模擬訊號進行除錯理論上根本不可能，因為連貫性資訊理論上有無限多，如果不是可以按公式還原的有序資訊（ordered information），例如正弦餘弦那類三角函數的訊號，任何無序訊號的複製，都不過是近似複製值（approximation value ），不過取様的密度越高，便越接近原來的資訊，就好像用多邊形來模擬圓形一樣，邊的數目越高便越近似圓形，有人以為模擬式訊號也是連貫訊號，不必受取樣密度限制，那是對記錄和收發儀器的物理性質不了解所引致的誤解，任何儀器在輸入和輸出之間都有反應的延滯和慣性，反應越快慣性越低，記錄或收發便越準確，好像速記員做速記，速度慢的便會省略了一些細節，那是為什麽頻率越高的電波能攜帶更多訊號的原因。

有限取樣訊號更勝無限模擬訊號

科學家靈機一觸，既然連續的原始訊號不能百份百還原，而非連貫的資訊應用卻越來越多，倒不如將原始的連續無限訊號變成不連貫（discrete）的有限訊號，簡單來說，就是用多邊形來模擬圓滑曲線，只要多邊形的密度高得令人類感觀不能察覺便可以，但這種簡約後的訊號在記錄收發過程中仍有出錯可能，強約訊號的數值如果只是用普通的方式將數值記錄，傳送，接收和還原，仍很大可能跟原始資料有差異，要達到百份百準確，那便須要用數學原理加入除錯機制（error handling algorithm）。

除錯機制，人與人溝通時都會很自然地採用，例如接收的一方重覆一遍對方說話來求證便是除錯的一種方法，在加減運算中，一種最常用的除錯驗算方法便是將最小那一位的數字加起來看最小那位數字是不是和結果吻合（sum of digits ）。雖然理論上，除錯機制還是達不到百份之一百的準確度，但將錯誤限制在百萬、千萬甚至萬萬份之一的機率是可能的，接著科學家發現記錄，傳送，接收，還原及除錯在二進制的環境下執行是最有效率的，結果多邊形的訊號進一步簡化成波幅相同的方波，訊號只有1（high ）和0（low）兩種，電腦採用二進制便成為共識，人類習慣使用的十進制數字會先行轉換成二進制數字，0至63,換算成二進制是6位數字，0至127是7 位數，0至255是8位數。在光碟上，普遍採用的除錯碼(Error Correction Code, ECC) 是里德-所羅門碼（Reed–Solomon codes）,，Compact CD 便有2層(layer)的除錯碼，可以矯正每碟內不超過 4,000bit 或 2mm 的錯誤，Data CD 和 DVD 的容錯能力更高．

八位元字節只兼容拼音文字

由於英文字母（alphabet 包括大小寫共52個），數字（共10個），加上其他常用符號，128個二進制數字已經能全部對應，所以美國政府最初為了統一電腦的訊號來方便訊息交換，利用7位二進制數字來代表英文中的所有字符，那便是1967年發表的第一代ASCII（American Standard Code for Information Interchange，美國訊息交換標準代碼），後期發覺不敷應用，便擴充成8位數字共可代表256個英文字符的EASCII（Extended American Standard Code for Information Interchange，美國擴充訊息交換標準代碼），就算是轉換成其他的歐洲拼音文字，256 個字符亦非常足够，結果在硬件設計上，都是以八位元（8bit）一字節（byte ）做資訊的基本單位，並且成為早期的資訊交換標準，每一個字符在電子訊號來説是一串方波，1和零用高低電位代表，與模擬訊號不同，採用二進制數碼記錄傳送的訊號，不必考慮波幅大小，只用考慮有或無，然後將八位訊號換成對應字符便可以。

ASCII CODE TABLE

DEC	OCT	HEX	BIN	Symbol	HTML Number	HTML Name	Description
0	0	0	0	NUL			Null char
1	1	1	1	SOH			Start of Heading
2	2	2	10	STX			Start of Text
3	3	3	11	ETX			End of Text
4	4	4	100	EOT			End of Transmission
5	5	5	101	ENQ			Enquiry
6	6	6	110	ACK			Acknowledgment
7	7	7	111	BEL			Bell
8	10	8	1000	BS			Back Space
9	11	9	1001	HT			Horizontal Tab
10	12	0A	1010	LF			Line Feed
11	13	0B	1011	VT			Vertical Tab
12	14	0C	1100	FF			Form Feed
13	15	0D	1101	CR			Carriage Return
14	16	0E	1110	SO			Shift Out / X-On
15	17	0F	1111	SI			Shift In / X-Off
16	20	10	10000	DLE			Data Line Escape
17	21	11	10001	DC1			Device Control 1 (oft. XON)
18	22	12	10010	DC2			Device Control 2
19	23	13	10011	DC3			Device Control 3 (oft. XOFF)
20	24	14	10100	DC4			Device Control 4
21	25	15	10101	NAK			Negative Acknowledgement
22	26	16	10110	SYN			Synchronous Idle
23	27	17	10111	ETB			End of Transmit Block
24	30	18	11000	CAN			Cancel
25	31	19	11001	EM			End of Medium
26	32	1A	11010	SUB			Substitute
27	33	1B	11011	ESC			Escape
28	34	1C	11100	FS			File Separator
29	35	1D	11101	GS			Group Separator
30	36	1E	11110	RS			Record Separator
31	37	1F	11111	US			Unit Separator
32	40	20	100000				Space
33	41	21	100001	!	!		Exclamation mark
34	42	22	100010	"	"	"	Double quotes (or speech marks)
35	43	23	100011	#	#		Number
36	44	24	100100	$	$		Dollar
37	45	25	100101	%	%		Procenttecken
38	46	26	100110	&	&	&	Ampersand
39	47	27	100111	'	'		Single quote
40	50	28	101000	(	(		Open parenthesis (or open bracket)
41	51	29	101001	)	)		Close parenthesis (or close bracket)
42	52	2A	101010	*	*		Asterisk
43	53	2B	101011	+	+		Plus
44	54	2C	101100	,	,		Comma
45	55	2D	101101	-	-		Hyphen
46	56	2E	101110	.	.		Period, dot or full stop
47	57	2F	101111	/	/		Slash or divide
48	60	30	110000	0	0		Zero
49	61	31	110001	1	1		One
50	62	32	110010	2	2		Two
51	63	33	110011	3	3		Three
52	64	34	110100	4	4		Four
53	65	35	110101	5	5		Five
54	66	36	110110	6	6		Six
55	67	37	110111	7	7		Seven
56	70	38	111000	8	8		Eight
57	71	39	111001	9	9		Nine
58	72	3A	111010	:	:		Colon
59	73	3B	111011	;	;		Semicolon
60	74	3C	111100	<	<	<	Less than (or open angled bracket)
61	75	3D	111101	=	=		Equals
62	76	3E	111110	>	>	>	Greater than (or close angled bracket)
63	77	3F	111111	?	?		Question mark
64	100	40	1000000	@	@		At symbol
65	101	41	1000001	A	A		Uppercase A
66	102	42	1000010	B	B		Uppercase B
67	103	43	1000011	C	C		Uppercase C
68	104	44	1000100	D	D		Uppercase D
69	105	45	1000101	E	E		Uppercase E
70	106	46	1000110	F	F		Uppercase F
71	107	47	1000111	G	G		Uppercase G
72	110	48	1001000	H	H		Uppercase H
73	111	49	1001001	I	I		Uppercase I
74	112	4A	1001010	J	J		Uppercase J
75	113	4B	1001011	K	K		Uppercase K
76	114	4C	1001100	L	L		Uppercase L
77	115	4D	1001101	M	M		Uppercase M
78	116	4E	1001110	N	N		Uppercase N
79	117	4F	1001111	O	O		Uppercase O
80	120	50	1010000	P	P		Uppercase P
81	121	51	1010001	Q	Q		Uppercase Q
82	122	52	1010010	R	R		Uppercase R
83	123	53	1010011	S	S		Uppercase S
84	124	54	1010100	T	T		Uppercase T
85	125	55	1010101	U	U		Uppercase U
86	126	56	1010110	V	V		Uppercase V
87	127	57	1010111	W	W		Uppercase W
88	130	58	1011000	X	X		Uppercase X
89	131	59	1011001	Y	Y		Uppercase Y
90	132	5A	1011010	Z	Z		Uppercase Z
91	133	5B	1011011	[	[		Opening bracket
92	134	5C	1011100	\	\		Backslash
93	135	5D	1011101	]	]		Closing bracket
94	136	5E	1011110	^	^		Caret - circumflex
95	137	5F	1011111	_	_		Underscore
96	140	60	1100000	`	`		Grave accent
97	141	61	1100001	a	a		Lowercase a
98	142	62	1100010	b	b		Lowercase b
99	143	63	1100011	c	c		Lowercase c
100	144	64	1100100	d	d		Lowercase d
101	145	65	1100101	e	e		Lowercase e
102	146	66	1100110	f	f		Lowercase f
103	147	67	1100111	g	g		Lowercase g
104	150	68	1101000	h	h		Lowercase h
105	151	69	1101001	i	i		Lowercase i
106	152	6A	1101010	j	j		Lowercase j
107	153	6B	1101011	k	k		Lowercase k
108	154	6C	1101100	l	l		Lowercase l
109	155	6D	1101101	m	m		Lowercase m
110	156	6E	1101110	n	n		Lowercase n
111	157	6F	1101111	o	o		Lowercase o
112	160	70	1110000	p	p		Lowercase p
113	161	71	1110001	q	q		Lowercase q
114	162	72	1110010	r	r		Lowercase r
115	163	73	1110011	s	s		Lowercase s
116	164	74	1110100	t	t		Lowercase t
117	165	75	1110101	u	u		Lowercase u
118	166	76	1110110	v	v		Lowercase v
119	167	77	1110111	w	w		Lowercase w
120	170	78	1111000	x	x		Lowercase x
121	171	79	1111001	y	y		Lowercase y
122	172	7A	1111010	z	z		Lowercase z
123	173	7B	1111011	{	{		Opening brace
124	174	7C	1111100	\|	\|		Vertical bar
125	175	7D	1111101	}	}		Closing brace
126	176	7E	1111110	~	~		Equivalency sign - tilde
127	177	7F	1111111				Delete

EXTENDED ASCII CODE TABLE

DEC	OCT	HEX	BIN	Symbol	HTML Number	HTML Name	Description
128	200	80	10000000	€		€	Euro sign
129	201	81	10000001
130	202	82	10000010	‚		&sbquo;	Single low-9 quotation mark
131	203	83	10000011	ƒ		&fnof;	Latin small letter f with hook
132	204	84	10000100	„		&bdquo;	Double low-9 quotation mark
133	205	85	10000101	…		…	Horizontal ellipsis
134	206	86	10000110	†		&dagger;	Dagger
135	207	87	10000111	‡		&Dagger;	Double dagger
136	210	88	10001000	ˆ		&circ;	Modifier letter circumflex accent
137	211	89	10001001	‰		&permil;	Per mille sign
138	212	8A	10001010	Š		&Scaron;	Latin capital letter S with caron
139	213	8B	10001011	‹		&lsaquo;	Single left-pointing angle quotation
140	214	8C	10001100	Œ		&OElig;	Latin capital ligature OE
141	215	8D	10001101
142	216	8E	10001110	Ž			Latin captial letter Z with caron
143	217	8F	10001111
144	220	90	10010000
145	221	91	10010001	‘		‘	Left single quotation mark
146	222	92	10010010	’		’	Right single quotation mark
147	223	93	10010011	“		“	Left double quotation mark
148	224	94	10010100	”		”	Right double quotation mark
149	225	95	10010101	•		•	Bullet
150	226	96	10010110	–		–	En dash
151	227	97	10010111	—		—	Em dash
152	230	98	10011000	˜		&tilde;	Small tilde
153	231	99	10011001	™		™	Trade mark sign
154	232	9A	10011010	š		&scaron;	Latin small letter S with caron
155	233	9B	10011011	›		&rsaquo;	Single right-pointing angle quotation mark
156	234	9C	10011100	œ		&oelig;	Latin small ligature oe
157	235	9D	10011101
158	236	9E	10011110	ž			Latin small letter z with caron
159	237	9F	10011111	Ÿ		ÿ	Latin capital letter Y with diaeresis
160	240	A0	10100000				Non-breaking space
161	241	A1	10100001	¡	¡	¡	Inverted exclamation mark
162	242	A2	10100010	¢	¢	¢	Cent sign
163	243	A3	10100011	£	£	£	Pound sign
164	244	A4	10100100	¤	¤	¤	Currency sign
165	245	A5	10100101	¥	¥	¥	Yen sign
166	246	A6	10100110	¦	¦	¦	Pipe, Broken vertical bar
167	247	A7	10100111	§	§	§	Section sign
168	250	A8	10101000	¨	¨	¨	Spacing diaeresis - umlaut
169	251	A9	10101001	©	©	©	Copyright sign
170	252	AA	10101010	ª	ª	ª	Feminine ordinal indicator
171	253	AB	10101011	«	«	«	Left double angle quotes
172	254	AC	10101100	¬	¬	¬	Not sign
173	255	AD	10101101				Soft hyphen
174	256	AE	10101110	®	®	®	Registered trade mark sign
175	257	AF	10101111	¯	¯	¯	Spacing macron - overline
176	260	B0	10110000	°	°	°	Degree sign
177	261	B1	10110001	±	±	±	Plus-or-minus sign
178	262	B2	10110010	²	²	²	Superscript two - squared
179	263	B3	10110011	³	³	³	Superscript three - cubed
180	264	B4	10110100	´	´	´	Acute accent - spacing acute
181	265	B5	10110101	µ	µ	µ	Micro sign
182	266	B6	10110110	¶	¶	¶	Pilcrow sign - paragraph sign
183	267	B7	10110111	·	·	·	Middle dot - Georgian comma
184	270	B8	10111000	¸	¸	¸	Spacing cedilla
185	271	B9	10111001	¹	¹	¹	Superscript one
186	272	BA	10111010	º	º	º	Masculine ordinal indicator
187	273	BB	10111011	»	»	»	Right double angle quotes
188	274	BC	10111100	¼	¼	¼	Fraction one quarter
189	275	BD	10111101	½	½	½	Fraction one half
190	276	BE	10111110	¾	¾	¾	Fraction three quarters
191	277	BF	10111111	¿	¿	¿	Inverted question mark
192	300	C0	11000000	À	À	À	Latin capital letter A with grave
193	301	C1	11000001	Á	Á	Á	Latin capital letter A with acute
194	302	C2	11000010	Â	Â	Â	Latin capital letter A with circumflex
195	303	C3	11000011	Ã	Ã	Ã	Latin capital letter A with tilde
196	304	C4	11000100	Ä	Ä	Ä	Latin capital letter A with diaeresis
197	305	C5	11000101	Å	Å	Å	Latin capital letter A with ring above
198	306	C6	11000110	Æ	Æ	Æ	Latin capital letter AE
199	307	C7	11000111	Ç	Ç	Ç	Latin capital letter C with cedilla
200	310	C8	11001000	È	È	È	Latin capital letter E with grave
201	311	C9	11001001	É	É	É	Latin capital letter E with acute
202	312	CA	11001010	Ê	Ê	Ê	Latin capital letter E with circumflex
203	313	CB	11001011	Ë	Ë	Ë	Latin capital letter E with diaeresis
204	314	CC	11001100	Ì	Ì	Ì	Latin capital letter I with grave
205	315	CD	11001101	Í	Í	Í	Latin capital letter I with acute
206	316	CE	11001110	Î	Î	Î	Latin capital letter I with circumflex
207	317	CF	11001111	Ï	Ï	Ï	Latin capital letter I with diaeresis
208	320	D0	11010000	Ð	Ð	Ð	Latin capital letter ETH
209	321	D1	11010001	Ñ	Ñ	Ñ	Latin capital letter N with tilde
210	322	D2	11010010	Ò	Ò	Ò	Latin capital letter O with grave
211	323	D3	11010011	Ó	Ó	Ó	Latin capital letter O with acute
212	324	D4	11010100	Ô	Ô	Ô	Latin capital letter O with circumflex
213	325	D5	11010101	Õ	Õ	Õ	Latin capital letter O with tilde
214	326	D6	11010110	Ö	Ö	Ö	Latin capital letter O with diaeresis
215	327	D7	11010111	×	×	×	Multiplication sign
216	330	D8	11011000	Ø	Ø	Ø	Latin capital letter O with slash
217	331	D9	11011001	Ù	Ù	Ù	Latin capital letter U with grave
218	332	DA	11011010	Ú	Ú	Ú	Latin capital letter U with acute
219	333	DB	11011011	Û	Û	Û	Latin capital letter U with circumflex
220	334	DC	11011100	Ü	Ü	Ü	Latin capital letter U with diaeresis
221	335	DD	11011101	Ý	Ý	Ý	Latin capital letter Y with acute
222	336	DE	11011110	Þ	Þ	Þ	Latin capital letter THORN
223	337	DF	11011111	ß	ß	ß	Latin small letter sharp s - ess-zed
224	340	E0	11100000	à	à	à	Latin small letter a with grave
225	341	E1	11100001	á	á	á	Latin small letter a with acute
226	342	E2	11100010	â	â	â	Latin small letter a with circumflex
227	343	E3	11100011	ã	ã	ã	Latin small letter a with tilde
228	344	E4	11100100	ä	ä	ä	Latin small letter a with diaeresis
229	345	E5	11100101	å	å	å	Latin small letter a with ring above
230	346	E6	11100110	æ	æ	æ	Latin small letter ae
231	347	E7	11100111	ç	ç	ç	Latin small letter c with cedilla
232	350	E8	11101000	è	è	è	Latin small letter e with grave
233	351	E9	11101001	é	é	é	Latin small letter e with acute
234	352	EA	11101010	ê	ê	ê	Latin small letter e with circumflex
235	353	EB	11101011	ë	ë	ë	Latin small letter e with diaeresis
236	354	EC	11101100	ì	ì	ì	Latin small letter i with grave
237	355	ED	11101101	í	í	í	Latin small letter i with acute
238	356	EE	11101110	î	î	î	Latin small letter i with circumflex
239	357	EF	11101111	ï	ï	ï	Latin small letter i with diaeresis
240	360	F0	11110000	ð	ð	ð	Latin small letter eth
241	361	F1	11110001	ñ	ñ	ñ	Latin small letter n with tilde
242	362	F2	11110010	ò	ò	ò	Latin small letter o with grave
243	363	F3	11110011	ó	ó	ó	Latin small letter o with acute
244	364	F4	11110100	ô	ô	ô	Latin small letter o with circumflex
245	365	F5	11110101	õ	õ	õ	Latin small letter o with tilde
246	366	F6	11110110	ö	ö	ö	Latin small letter o with diaeresis
247	367	F7	11110111	÷	÷	÷	Division sign
248	370	F8	11111000	ø	ø	ø	Latin small letter o with slash
249	371	F9	11111001	ù	ù	ù	Latin small letter u with grave
250	372	FA	11111010	ú	ú	ú	Latin small letter u with acute
251	373	FB	11111011	û	û	û	Latin small letter u with circumflex
252	374	FC	11111100	ü	ü	ü	Latin small letter u with diaeresis
253	375	FD	11111101	ý	ý	ý	Latin small letter y with acute
254	376	FE	11111110	þ	þ	þ	Latin small letter thorn
255	377	FF	11111111	ÿ	ÿ	ÿ	Latin small letter y with diaeresis

中文字常用字簡體約四千個，國標碼有6,763個；繁體字約七千個，台灣資策會頒佈的中文通用字集大五碼有萬多個。在八位 keyboard layout 元為資訊單位的電腦上如何編碼，初期茫無頭緒。輸入也是問題，在七十年代微型個人電腦革命出現前，基本上電腦應用屬於高端客户的大型工具，普通人没有機會接觸，電腦鍵盤由打字機鍵盤(QWERTY Keyboard)加上一些電腦專用符號改成，蘋果電腦將電腦帶入個人應用範圍後，隨著 IBM 的加入競爭，最通用是 XT 和AT 系列演變而來的101 及 104鍵盤，到 Wintel 成為個人電腦主流，鍵盤基本上是104鍵的視窗系統用鍵盤或它的愆生款式；但無論如何，鍵盤與中文輸入完全没有任何的關連，所以單是中文的輸入問題，便令當時不少人更振振有詞地認為中文不能配合科技發展，那位數學講師隨口説出的話，便是在這様的背景下出現的。

- 未完 -

http://blog.um-gallery.net

Site menu:

Welcome to the official blog of Uncle Ming's Gallery

資科人看世界之24

中國文字是當今最先進的文字系統-2

Chinese Character as Super 2-dimensional Code-2

免責條款 DISCLAIMER

歡迎光臨 Welcome to UM Bloggers

博客網誌Bloggers' Blog:

小傳 Biography

｜版權公告｜免責條寬｜私隱政策｜

http://blog.um-gallery.net

Site menu:

Welcome to the official blog of Uncle Ming's Gallery

資科人看世界之24

中國文字是當今最先進的文字系統-2

Chinese Character as Super 2-dimensional Code-2

免 責條款 DISCLAIMER

歡迎光臨 Welcome to UM Bloggers

博客網誌Bloggers' Blog:

小傳 Biography

｜版權公告 ｜免責條寬｜私隱政策｜

免責條款 DISCLAIMER

｜版權公告｜免責條寬｜私隱政策｜