資科人看世界之24
-1/2/2014
中文落後一説大有市場
多年前曾聽過一位在某大專院校當初級數學講師的人士說中文不及西方文字先進,例如英文是由左至右書寫,配合人面上橫排的眼睛,閲讀速度比中文快;其次是讀 音跟串法一致,音字相通,容易學習;最後還有是西方文字的數字系統,令運算非常方便,亦配合横排文字。雖然心中充滿疑惑,但身為大專講師的說話當然有根 據,為了尊師重道,但還是没有質疑。
疑惑第一是中文其實可横可直,彈性更大,數學上來説是多了一個自由度(degree of freedom);第二是中文繹成英文時,字元數總是多了一個可觀的百份比,讀起來豈不是更慢;至於發音,英文字認識多了便發覺是一派胡言,那些外來字才 要命,希臘文,拉丁文,法文,西班牙文,葡萄牙文,意大利文等等,都不是按串字來拼音便可以讀得準確。最後更發現阿拉伯數字原來根本就不是西方人的發明, 也不是阿拉伯文字,而是印度人的記數符號。但不能否認,箂布箂兹和牛頓等的西方科學家所發展出來的數學符號及運算表達方式是完全超越前人成就的創新發明。
線性排列架構文字訊息承載能力有限
隨著知識和科技的發展,回頭再想起這番隨口說出來的話,更覺是一派胡言。他的理論,不過是個人的主觀感覺,並非因為他對中文和英文都有相同的造諧並且曾進 行過嚴肅的研究比較後得出的結論,這是自小讀「番書」長大的人士常有的通病,當年採用淘汰分流學制,英文成績較好,才有升學的機會,出路亦往往比其他人 好,能力高的會分流到英文中學,令人覺得懂英文的人比不懂的要優秀得多,英文中學學生面對中文中學學生便充滿優越感,其實這是分流的結果而不是英文教育的 功勞。說閲讀速度,如果是一般的記敍文字,個人經驗還是中文快,想當年借閲金庸的武俠小說,為了在限期前歸還,差不多是以一晚兩本的速度來完成,勉强還能 應付到朋友們對小説內容的提問。但自已的中文閲讀速度比英文快很大可能是本身的英文程度太低,還是不敢挑戰英文的優越性。
可是,用一維度線性排列方式(one dimension linear permutation)造字的西方文字,在更高層次的訊息處理上,便愈來愈捉襟見肘,在數學運算中,首先是字元不足,什麽二元幾次方程式當然没有問題, 但在一些較大型的數學模型中,變數隨隨便便也有十多二十個,廿六個字母當然不敷應用,勉强用下標subscript來將同一字母重覆使用,例如X1, X2...等等。但這樣子的組合,豈不是等於中文字的二維結構原理(two dimensional architecture ),因為同一數字,放在上標位置及下標位置代表不同含義,跟中文字將部首放在九個位置上代表不同的含義是同一道理,那便是數學上的二維座標排列。在生物及 化學名詞上,西方文字更是笨拙得要命,例如有機化合物,中文名詞便比英文名詞簡潔得多,隨便拿醇(日常通稱酒精 alcohol,按分子結構分為甲醇 methanol,乙醇 ethanol,丙醇 propanol 等),苯(benzene),氨(ammonia,作字根為ammino),或酮(ketone )等做例子,都可見到中文比英文簡潔清晰得多,原因是中文具有極為強大的二維造字功能,用資訊科技術語來説是延展性(extendability)優越, 佔用的記憶資源及頻寛更少,英文為了分隔文字,更要在兩字之間插入一個佔據一個字節的空格(space),有電腦知識的不防計算這些名詞的中英文字節數目 便清楚。
有機化合物分類 |
||
A Alicyclic compound Aliphatic compound Alisiaquinone Alkane Alkene Allocryptopine Aminoketone Anhalamine Anhalonidine Aurantiomide Avicularin Aviculin B Bechgaard salt Biomolecule Bottromycin Bridged compounds Bromofluorocarbon C Carbene 2-Carbomethoxytropinone Carboxylic acid Covalent organic framework Cylindrocyclophanes D Delsoline Diazonium compound E Erinacine Ethylenediamine pyrocatechol Explosophore |
F Fluorenylidene Fumitremorgin G Golm Metabolome Database H Half sandwich compound Hericenone Hexaethyl tetraphosphate Hydrogenated starch hydrosylate Hydroxamic acid I In-Methylcyclophane Inducer K Ketone L Ladderane Liriodenine List of organic salts M MassBank (database) O Oreobeiline Organic matter Organic peroxide Organic superconductor Organosulfate Orthoacetic acid Oxalyldihydrazide Oxime |
P Perfluorobutanesulfonyl fluoride Perfluorodecyltrichlorosilane Peroxide Persistent carbene Polycyclic compound Polyethylene Succinate S Shearinine Spectral Database for Organic Compounds Spiropyran Sulfite ester T Thiol Thiourea (2,4,6-Trimethylphenyl)gold V Venturamide Vermixocin Volatile organic compound X Xestoquinone |
其實說是中文的生化名詞不太準確,應該說是漢字,因為不少是日本人引入西方科技時創造的。日本人曾有一段時間考慮像韓國和越南一樣放棄漢字而改用拼音文
字,可是發覺對原來文化的破壞極大,終於没有實行,改為利用原有漢字或創造一些新漢字來翻譯新的科技文字。所以從宏觀一些的角度來看,中文字應該是整個漢
字文化的一個主要部份,中文字的存亡,關係到整個漢字文化的存亡,一種文字無論如何先進,没有一個強大的政治經濟文化實體當載體,便無法繼續生存發展,不
說埃及和巴比倫文字,兩者都已經隨著原來的民族被征服,毁滅或没落而失傳,就算是拉丁文(Latin),雖然曾經在羅馬帝國和教廷的強大影嚮力下一度成為歐洲最普及的文
字,牛頓和箂布箂兹等科學家的科學文獻很多都用拉丁文發表,現在已經成了死文字,除了教廷的文獻外,只會在法律事務中偶然使用,行外人說是用死人文字來嚇
唬活人,行內人則説是死文字不會有新意義可避免混淆。所以中文字和漢字的長處只是先天條件,没有後天的營養注入和一個強大的文化實體當寄主,便難逃死亡的
命運,成為没有人懂的死文字,而且肯定會死得比拉丁文更徹底,因為中文更難懂。過去中國百多年的衰落,便令韓國和越南拋棄了漢字。
向詆毁中文者挑機 還漢字一個公道
别人要捨棄漢字,是出於短視和功利,誰叫這個「老大」變成「老大衰」,無法保護小的,樹倒猢猻散,要留也留不下。但中國人中,竟亦有不少人要捨棄漢字,那 些中不成英不就的小學雞崇洋憤青的意見當然不值一哂,但貌似很科學的理由,例如那位數學講師所説的中文不適合科技的表達和運算便很能騙倒一些人云亦云的 人,由於挺中文的大都是學文史哲出身,除了訴諸承傳,民族大義和文學書法藝術外,涉及到科技那邊的辯論便不懂應對,經常輸得一塌糊塗,到現時為止,都不大 見有人從科技角度提出理由來支持中文,因為學科技的人都無法避開英文,尖端科技的論文,更是以英文為主,給人的感覺便是科技和西方文字是不可分割的。懂科 技的,除了像陳之藩教授,張系國先生那類文理雙絕的少數人外,對文字多數没有太多認識和感情,擅用文字亦不等如懂文字學,結果讓那些胡説八道的謬論有機會 大行其道,在下唯有勉為其難出來挑機(嗆challenge),解釋為什中文才是最屈機(即最牛supreme)的文字,有什麽人看到又認同的便口耳相 傳,誰是原創者不要緊,在下不會說是抄襲侵權索賠償,還漢字的地位一個公道是地球人的責任。
資訊科技不兼容中文的謬誤
文字在數學角度來看是一種符號系統(notation system),在資訊科技來說是一種編碼系統(code
system),當電腦還在發展初階時,由於開發機構大都位於英語文化地區,他們是不是没有普世觀念不清楚,但没有能力去熟悉世界所有的文字則可以肯定,
電腦就是設計給那些懂英語的人士用的,親疏有别得很,一點也不普世,閣下要使用電腦便要學習英文,所以令人以為中文亦不兼容資訊科技。
要知道當初不兼容的原因,得要從電腦處理資訊的基本原理説起:現代資訊科技革命由二進制的運用開始,從前的模擬(analogue)記錄傳送模式,是由聲
音和影像自然訊號(signal)的紀錄傳送開始,訊號強弱對應聲音或光線強弱,簡單地轉換成另一種可還原的記錄模式,屬於連續性資訊
(continuous
data),對內容的準確還原要求,起始標準很低,因為人的容忍度高,對雜訊造成噪音和雪花,只要能識别便算紀錄傳送成功,但隨著時間過去,要求便逐漸提
高,尤其是在文本資料(textual information)那類非連貫資訊(discrete
data)的記錄和傳送,例如電腦程式(program
code)或文件(document),失真和訊號衰減問題便不能容忍,因為程式原代碼(program
code),那怕是一個錯誤,整個系統的運作便會崩潰。重要文件,同樣無法容忍內容出現錯誤。對連貫性的模擬訊號進行除錯理論上根本不可能,因為連貫性資
訊理論上有無限多,如果不是可以按公式還原的有序資訊(ordered
information),例如正弦餘弦那類三角函數的訊號,任何無序訊號的複製,都不過是近似複製值(approximation value
),不過取様的密度越高,便越接近原來的資訊,就好像用多邊形來模擬圓形一樣,邊的數目越高便越近似圓形,有人以為模擬式訊號也是連貫訊號,不必受取樣密
度限制,那是對記錄和收發儀器的物理性質不了解所引致的誤解,任何儀器在輸入和輸出之間都有反應的延滯和慣性,反應越快慣性越低,記錄或收發便越準確,好
像速記員做速記,速度慢的便會省略了一些細節,那是為什麽頻率越高的電波能攜帶更多訊號的原因。
有限取樣訊號更勝無限模擬訊號
科學家靈機一觸,既然連續的原始訊號不能百份百還原,而非連貫的資訊應用卻越來越多,倒不如將原始的連續無限訊號變成不連貫(discrete)的有限訊
號,簡單來說,就是用多邊形來模擬圓滑曲線,只要多邊形的密度高得令人類感觀不能察覺便可以,但這種簡約後的訊號在記錄收發過程中仍有出錯可能,強約訊號
的數值如果只是用普通的方式將數值記錄,傳送,接收和還原,仍很大可能跟原始資料有差異,要達到百份百準確,那便須要用數學原理加入除錯機制(error
handling algorithm)。
除錯機制,人與人溝通時都會很自然地採用,例如接收的一方重覆一遍對方說話來求證便是除錯的一種方法,在加減運算中,一種最常用的除錯驗算方
法便是將最小
那一位的數字加起來看最小那位數字是不是和結果吻合(sum of digits
)。雖然理論上,除錯機制還是達不到百份之一百的準確度,但將錯誤限制在百萬、千萬甚至萬萬份之一的機率是可能的,接著科學家發現記錄,傳送,接收,還原
及除錯在二進制的環境下執行是最有效率的,結果多邊形的訊號進一步簡化成波幅相同的方波,訊號只有1(high
)和0(low)兩種,電腦採用二進制便成為共識,人類習慣使用的十進制數字會先行轉換成二進制數字,0至63,換算成二進制是6位數字,0至127是7
位數,0至255是8位數。在光碟上,普遍採用的除錯碼(Error Correction Code, ECC)
是里德-所羅門碼(Reed–Solomon codes),,Compact CD 便有2層(layer)的除錯碼,可以矯正每碟內不超過
4,000bit 或 2mm 的錯誤,Data CD 和 DVD 的容錯能力更高.
八位元字節只兼容拼音文字
由於英文字母(alphabet
包括大小寫共52個),數字(共10個),加上其他常用符號,128個二進制數字已經能全部對應,所以美國政府最初為了統一電腦的訊號來方便訊息交換,利
用7位二進制數字來代表英文中的所有字符,那便是1967年發表的第一代ASCII(American Standard Code for
Information
Interchange,美國訊息交換標準代碼),後期發覺不敷應用,便擴充成8位數字共可代表256個英文字符的EASCII(Extended
American Standard Code for Information
Interchange,美國擴充訊息交換標準代碼),就算是轉換成其他的歐洲拼音文字,256
個字符亦非常足够,結果在硬件設計上,都是以八位元(8bit)一字節(byte
)做資訊的基本單位,並且成為早期的資訊交換標準,每一個字符在電子訊號來説是一串方波,1和零用高低電位代表,與模擬訊號不同,採用二進制數碼記錄傳送
的訊號,不必考慮波幅大小,只用考慮有或無,然後將八位訊號換成對應字符便可以。
ASCII CODE TABLE
DEC | OCT | HEX | BIN | Symbol | HTML Number | HTML Name | Description |
0 | 0 | 0 | 0 | NUL | � | Null char | |
1 | 1 | 1 | 1 | SOH |  | Start of Heading | |
2 | 2 | 2 | 10 | STX |  | Start of Text | |
3 | 3 | 3 | 11 | ETX |  | End of Text | |
4 | 4 | 4 | 100 | EOT |  | End of Transmission | |
5 | 5 | 5 | 101 | ENQ |  | Enquiry | |
6 | 6 | 6 | 110 | ACK |  | Acknowledgment | |
7 | 7 | 7 | 111 | BEL |  | Bell | |
8 | 10 | 8 | 1000 | BS |  | Back Space | |
9 | 11 | 9 | 1001 | HT | 	 | Horizontal Tab | |
10 | 12 | 0A | 1010 | LF | 
 | Line Feed | |
11 | 13 | 0B | 1011 | VT |  | Vertical Tab | |
12 | 14 | 0C | 1100 | FF |  | Form Feed | |
13 | 15 | 0D | 1101 | CR | 
 | Carriage Return | |
14 | 16 | 0E | 1110 | SO |  | Shift Out / X-On | |
15 | 17 | 0F | 1111 | SI |  | Shift In / X-Off | |
16 | 20 | 10 | 10000 | DLE |  | Data Line Escape | |
17 | 21 | 11 | 10001 | DC1 |  | Device Control 1 (oft. XON) | |
18 | 22 | 12 | 10010 | DC2 |  | Device Control 2 | |
19 | 23 | 13 | 10011 | DC3 |  | Device Control 3 (oft. XOFF) | |
20 | 24 | 14 | 10100 | DC4 |  | Device Control 4 | |
21 | 25 | 15 | 10101 | NAK |  | Negative Acknowledgement | |
22 | 26 | 16 | 10110 | SYN |  | Synchronous Idle | |
23 | 27 | 17 | 10111 | ETB |  | End of Transmit Block | |
24 | 30 | 18 | 11000 | CAN |  | Cancel | |
25 | 31 | 19 | 11001 | EM |  | End of Medium | |
26 | 32 | 1A | 11010 | SUB |  | Substitute | |
27 | 33 | 1B | 11011 | ESC |  | Escape | |
28 | 34 | 1C | 11100 | FS |  | File Separator | |
29 | 35 | 1D | 11101 | GS |  | Group Separator | |
30 | 36 | 1E | 11110 | RS |  | Record Separator | |
31 | 37 | 1F | 11111 | US |  | Unit Separator | |
32 | 40 | 20 | 100000 |   | Space | ||
33 | 41 | 21 | 100001 | ! | ! | Exclamation mark | |
34 | 42 | 22 | 100010 | " | " | " | Double quotes (or speech marks) |
35 | 43 | 23 | 100011 | # | # | Number | |
36 | 44 | 24 | 100100 | $ | $ | Dollar | |
37 | 45 | 25 | 100101 | % | % | Procenttecken | |
38 | 46 | 26 | 100110 | & | & | & | Ampersand |
39 | 47 | 27 | 100111 | ' | ' | Single quote | |
40 | 50 | 28 | 101000 | ( | ( | Open parenthesis (or open bracket) | |
41 | 51 | 29 | 101001 | ) | ) | Close parenthesis (or close bracket) | |
42 | 52 | 2A | 101010 | * | * | Asterisk | |
43 | 53 | 2B | 101011 | + | + | Plus | |
44 | 54 | 2C | 101100 | , | , | Comma | |
45 | 55 | 2D | 101101 | - | - | Hyphen | |
46 | 56 | 2E | 101110 | . | . | Period, dot or full stop | |
47 | 57 | 2F | 101111 | / | / | Slash or divide | |
48 | 60 | 30 | 110000 | 0 | 0 | Zero | |
49 | 61 | 31 | 110001 | 1 | 1 | One | |
50 | 62 | 32 | 110010 | 2 | 2 | Two | |
51 | 63 | 33 | 110011 | 3 | 3 | Three | |
52 | 64 | 34 | 110100 | 4 | 4 | Four | |
53 | 65 | 35 | 110101 | 5 | 5 | Five | |
54 | 66 | 36 | 110110 | 6 | 6 | Six | |
55 | 67 | 37 | 110111 | 7 | 7 | Seven | |
56 | 70 | 38 | 111000 | 8 | 8 | Eight | |
57 | 71 | 39 | 111001 | 9 | 9 | Nine | |
58 | 72 | 3A | 111010 | : | : | Colon | |
59 | 73 | 3B | 111011 | ; | ; | Semicolon | |
60 | 74 | 3C | 111100 | < | < | < | Less than (or open angled bracket) |
61 | 75 | 3D | 111101 | = | = | Equals | |
62 | 76 | 3E | 111110 | > | > | > | Greater than (or close angled bracket) |
63 | 77 | 3F | 111111 | ? | ? | Question mark | |
64 | 100 | 40 | 1000000 | @ | @ | At symbol | |
65 | 101 | 41 | 1000001 | A | A | Uppercase A | |
66 | 102 | 42 | 1000010 | B | B | Uppercase B | |
67 | 103 | 43 | 1000011 | C | C | Uppercase C | |
68 | 104 | 44 | 1000100 | D | D | Uppercase D | |
69 | 105 | 45 | 1000101 | E | E | Uppercase E | |
70 | 106 | 46 | 1000110 | F | F | Uppercase F | |
71 | 107 | 47 | 1000111 | G | G | Uppercase G | |
72 | 110 | 48 | 1001000 | H | H | Uppercase H | |
73 | 111 | 49 | 1001001 | I | I | Uppercase I | |
74 | 112 | 4A | 1001010 | J | J | Uppercase J | |
75 | 113 | 4B | 1001011 | K | K | Uppercase K | |
76 | 114 | 4C | 1001100 | L | L | Uppercase L | |
77 | 115 | 4D | 1001101 | M | M | Uppercase M | |
78 | 116 | 4E | 1001110 | N | N | Uppercase N | |
79 | 117 | 4F | 1001111 | O | O | Uppercase O | |
80 | 120 | 50 | 1010000 | P | P | Uppercase P | |
81 | 121 | 51 | 1010001 | Q | Q | Uppercase Q | |
82 | 122 | 52 | 1010010 | R | R | Uppercase R | |
83 | 123 | 53 | 1010011 | S | S | Uppercase S | |
84 | 124 | 54 | 1010100 | T | T | Uppercase T | |
85 | 125 | 55 | 1010101 | U | U | Uppercase U | |
86 | 126 | 56 | 1010110 | V | V | Uppercase V | |
87 | 127 | 57 | 1010111 | W | W | Uppercase W | |
88 | 130 | 58 | 1011000 | X | X | Uppercase X | |
89 | 131 | 59 | 1011001 | Y | Y | Uppercase Y | |
90 | 132 | 5A | 1011010 | Z | Z | Uppercase Z | |
91 | 133 | 5B | 1011011 | [ | [ | Opening bracket | |
92 | 134 | 5C | 1011100 | \ | \ | Backslash | |
93 | 135 | 5D | 1011101 | ] | ] | Closing bracket | |
94 | 136 | 5E | 1011110 | ^ | ^ | Caret - circumflex | |
95 | 137 | 5F | 1011111 | _ | _ | Underscore | |
96 | 140 | 60 | 1100000 | ` | ` | Grave accent | |
97 | 141 | 61 | 1100001 | a | a | Lowercase a | |
98 | 142 | 62 | 1100010 | b | b | Lowercase b | |
99 | 143 | 63 | 1100011 | c | c | Lowercase c | |
100 | 144 | 64 | 1100100 | d | d | Lowercase d | |
101 | 145 | 65 | 1100101 | e | e | Lowercase e | |
102 | 146 | 66 | 1100110 | f | f | Lowercase f | |
103 | 147 | 67 | 1100111 | g | g | Lowercase g | |
104 | 150 | 68 | 1101000 | h | h | Lowercase h | |
105 | 151 | 69 | 1101001 | i | i | Lowercase i | |
106 | 152 | 6A | 1101010 | j | j | Lowercase j | |
107 | 153 | 6B | 1101011 | k | k | Lowercase k | |
108 | 154 | 6C | 1101100 | l | l | Lowercase l | |
109 | 155 | 6D | 1101101 | m | m | Lowercase m | |
110 | 156 | 6E | 1101110 | n | n | Lowercase n | |
111 | 157 | 6F | 1101111 | o | o | Lowercase o | |
112 | 160 | 70 | 1110000 | p | p | Lowercase p | |
113 | 161 | 71 | 1110001 | q | q | Lowercase q | |
114 | 162 | 72 | 1110010 | r | r | Lowercase r | |
115 | 163 | 73 | 1110011 | s | s | Lowercase s | |
116 | 164 | 74 | 1110100 | t | t | Lowercase t | |
117 | 165 | 75 | 1110101 | u | u | Lowercase u | |
118 | 166 | 76 | 1110110 | v | v | Lowercase v | |
119 | 167 | 77 | 1110111 | w | w | Lowercase w | |
120 | 170 | 78 | 1111000 | x | x | Lowercase x | |
121 | 171 | 79 | 1111001 | y | y | Lowercase y | |
122 | 172 | 7A | 1111010 | z | z | Lowercase z | |
123 | 173 | 7B | 1111011 | { | { | Opening brace | |
124 | 174 | 7C | 1111100 | | | | | Vertical bar | |
125 | 175 | 7D | 1111101 | } | } | Closing brace | |
126 | 176 | 7E | 1111110 | ~ | ~ | Equivalency sign - tilde | |
127 | 177 | 7F | 1111111 |
|
 | Delete |
EXTENDED ASCII CODE TABLE
DEC | OCT | HEX | BIN | Symbol | HTML Number | HTML Name | Description |
128 | 200 | 80 | 10000000 | € | € | € | Euro sign |
129 | 201 | 81 | 10000001 | ||||
130 | 202 | 82 | 10000010 | ‚ | ‚ | ‚ | Single low-9 quotation mark |
131 | 203 | 83 | 10000011 | ƒ | ƒ | ƒ | Latin small letter f with hook |
132 | 204 | 84 | 10000100 | „ | „ | „ | Double low-9 quotation mark |
133 | 205 | 85 | 10000101 | … | … | … | Horizontal ellipsis |
134 | 206 | 86 | 10000110 | † | † | † | Dagger |
135 | 207 | 87 | 10000111 | ‡ | ‡ | ‡ | Double dagger |
136 | 210 | 88 | 10001000 | ˆ | ˆ | ˆ | Modifier letter circumflex accent |
137 | 211 | 89 | 10001001 | ‰ | ‰ | ‰ | Per mille sign |
138 | 212 | 8A | 10001010 | Š | Š | Š | Latin capital letter S with caron |
139 | 213 | 8B | 10001011 | ‹ | ‹ | ‹ | Single left-pointing angle quotation |
140 | 214 | 8C | 10001100 | Œ | Œ | Œ | Latin capital ligature OE |
141 | 215 | 8D | 10001101 | ||||
142 | 216 | 8E | 10001110 | Ž | Ž | Latin captial letter Z with caron | |
143 | 217 | 8F | 10001111 | ||||
144 | 220 | 90 | 10010000 | ||||
145 | 221 | 91 | 10010001 | ‘ | ‘ | ‘ | Left single quotation mark |
146 | 222 | 92 | 10010010 | ’ | ’ | ’ | Right single quotation mark |
147 | 223 | 93 | 10010011 | “ | “ | “ | Left double quotation mark |
148 | 224 | 94 | 10010100 | ” | ” | ” | Right double quotation mark |
149 | 225 | 95 | 10010101 | • | • | • | Bullet |
150 | 226 | 96 | 10010110 | – | – | – | En dash |
151 | 227 | 97 | 10010111 | — | — | — | Em dash |
152 | 230 | 98 | 10011000 | ˜ | ˜ | ˜ | Small tilde |
153 | 231 | 99 | 10011001 | ™ | ™ | ™ | Trade mark sign |
154 | 232 | 9A | 10011010 | š | š | š | Latin small letter S with caron |
155 | 233 | 9B | 10011011 | › | › | › | Single right-pointing angle quotation mark |
156 | 234 | 9C | 10011100 | œ | œ | œ | Latin small ligature oe |
157 | 235 | 9D | 10011101 | ||||
158 | 236 | 9E | 10011110 | ž | ž | Latin small letter z with caron | |
159 | 237 | 9F | 10011111 | Ÿ | Ÿ | ÿ | Latin capital letter Y with diaeresis |
160 | 240 | A0 | 10100000 |   | | Non-breaking space | |
161 | 241 | A1 | 10100001 | ¡ | ¡ | ¡ | Inverted exclamation mark |
162 | 242 | A2 | 10100010 | ¢ | ¢ | ¢ | Cent sign |
163 | 243 | A3 | 10100011 | £ | £ | £ | Pound sign |
164 | 244 | A4 | 10100100 | ¤ | ¤ | ¤ | Currency sign |
165 | 245 | A5 | 10100101 | ¥ | ¥ | ¥ | Yen sign |
166 | 246 | A6 | 10100110 | ¦ | ¦ | ¦ | Pipe, Broken vertical bar |
167 | 247 | A7 | 10100111 | § | § | § | Section sign |
168 | 250 | A8 | 10101000 | ¨ | ¨ | ¨ | Spacing diaeresis - umlaut |
169 | 251 | A9 | 10101001 | © | © | © | Copyright sign |
170 | 252 | AA | 10101010 | ª | ª | ª | Feminine ordinal indicator |
171 | 253 | AB | 10101011 | « | « | « | Left double angle quotes |
172 | 254 | AC | 10101100 | ¬ | ¬ | ¬ | Not sign |
173 | 255 | AD | 10101101 | ­ | ­ | Soft hyphen | |
174 | 256 | AE | 10101110 | ® | ® | ® | Registered trade mark sign |
175 | 257 | AF | 10101111 | ¯ | ¯ | ¯ | Spacing macron - overline |
176 | 260 | B0 | 10110000 | ° | ° | ° | Degree sign |
177 | 261 | B1 | 10110001 | ± | ± | ± | Plus-or-minus sign |
178 | 262 | B2 | 10110010 | ² | ² | ² | Superscript two - squared |
179 | 263 | B3 | 10110011 | ³ | ³ | ³ | Superscript three - cubed |
180 | 264 | B4 | 10110100 | ´ | ´ | ´ | Acute accent - spacing acute |
181 | 265 | B5 | 10110101 | µ | µ | µ | Micro sign |
182 | 266 | B6 | 10110110 | ¶ | ¶ | ¶ | Pilcrow sign - paragraph sign |
183 | 267 | B7 | 10110111 | · | · | · | Middle dot - Georgian comma |
184 | 270 | B8 | 10111000 | ¸ | ¸ | ¸ | Spacing cedilla |
185 | 271 | B9 | 10111001 | ¹ | ¹ | ¹ | Superscript one |
186 | 272 | BA | 10111010 | º | º | º | Masculine ordinal indicator |
187 | 273 | BB | 10111011 | » | » | » | Right double angle quotes |
188 | 274 | BC | 10111100 | ¼ | ¼ | ¼ | Fraction one quarter |
189 | 275 | BD | 10111101 | ½ | ½ | ½ | Fraction one half |
190 | 276 | BE | 10111110 | ¾ | ¾ | ¾ | Fraction three quarters |
191 | 277 | BF | 10111111 | ¿ | ¿ | ¿ | Inverted question mark |
192 | 300 | C0 | 11000000 | À | À | À | Latin capital letter A with grave |
193 | 301 | C1 | 11000001 | Á | Á | Á | Latin capital letter A with acute |
194 | 302 | C2 | 11000010 | Â | Â | Â | Latin capital letter A with circumflex |
195 | 303 | C3 | 11000011 | Ã | Ã | Ã | Latin capital letter A with tilde |
196 | 304 | C4 | 11000100 | Ä | Ä | Ä | Latin capital letter A with diaeresis |
197 | 305 | C5 | 11000101 | Å | Å | Å | Latin capital letter A with ring above |
198 | 306 | C6 | 11000110 | Æ | Æ | Æ | Latin capital letter AE |
199 | 307 | C7 | 11000111 | Ç | Ç | Ç | Latin capital letter C with cedilla |
200 | 310 | C8 | 11001000 | È | È | È | Latin capital letter E with grave |
201 | 311 | C9 | 11001001 | É | É | É | Latin capital letter E with acute |
202 | 312 | CA | 11001010 | Ê | Ê | Ê | Latin capital letter E with circumflex |
203 | 313 | CB | 11001011 | Ë | Ë | Ë | Latin capital letter E with diaeresis |
204 | 314 | CC | 11001100 | Ì | Ì | Ì | Latin capital letter I with grave |
205 | 315 | CD | 11001101 | Í | Í | Í | Latin capital letter I with acute |
206 | 316 | CE | 11001110 | Î | Î | Î | Latin capital letter I with circumflex |
207 | 317 | CF | 11001111 | Ï | Ï | Ï | Latin capital letter I with diaeresis |
208 | 320 | D0 | 11010000 | Ð | Ð | Ð | Latin capital letter ETH |
209 | 321 | D1 | 11010001 | Ñ | Ñ | Ñ | Latin capital letter N with tilde |
210 | 322 | D2 | 11010010 | Ò | Ò | Ò | Latin capital letter O with grave |
211 | 323 | D3 | 11010011 | Ó | Ó | Ó | Latin capital letter O with acute |
212 | 324 | D4 | 11010100 | Ô | Ô | Ô | Latin capital letter O with circumflex |
213 | 325 | D5 | 11010101 | Õ | Õ | Õ | Latin capital letter O with tilde |
214 | 326 | D6 | 11010110 | Ö | Ö | Ö | Latin capital letter O with diaeresis |
215 | 327 | D7 | 11010111 | × | × | × | Multiplication sign |
216 | 330 | D8 | 11011000 | Ø | Ø | Ø | Latin capital letter O with slash |
217 | 331 | D9 | 11011001 | Ù | Ù | Ù | Latin capital letter U with grave |
218 | 332 | DA | 11011010 | Ú | Ú | Ú | Latin capital letter U with acute |
219 | 333 | DB | 11011011 | Û | Û | Û | Latin capital letter U with circumflex |
220 | 334 | DC | 11011100 | Ü | Ü | Ü | Latin capital letter U with diaeresis |
221 | 335 | DD | 11011101 | Ý | Ý | Ý | Latin capital letter Y with acute |
222 | 336 | DE | 11011110 | Þ | Þ | Þ | Latin capital letter THORN |
223 | 337 | DF | 11011111 | ß | ß | ß | Latin small letter sharp s - ess-zed |
224 | 340 | E0 | 11100000 | à | à | à | Latin small letter a with grave |
225 | 341 | E1 | 11100001 | á | á | á | Latin small letter a with acute |
226 | 342 | E2 | 11100010 | â | â | â | Latin small letter a with circumflex |
227 | 343 | E3 | 11100011 | ã | ã | ã | Latin small letter a with tilde |
228 | 344 | E4 | 11100100 | ä | ä | ä | Latin small letter a with diaeresis |
229 | 345 | E5 | 11100101 | å | å | å | Latin small letter a with ring above |
230 | 346 | E6 | 11100110 | æ | æ | æ | Latin small letter ae |
231 | 347 | E7 | 11100111 | ç | ç | ç | Latin small letter c with cedilla |
232 | 350 | E8 | 11101000 | è | è | è | Latin small letter e with grave |
233 | 351 | E9 | 11101001 | é | é | é | Latin small letter e with acute |
234 | 352 | EA | 11101010 | ê | ê | ê | Latin small letter e with circumflex |
235 | 353 | EB | 11101011 | ë | ë | ë | Latin small letter e with diaeresis |
236 | 354 | EC | 11101100 | ì | ì | ì | Latin small letter i with grave |
237 | 355 | ED | 11101101 | í | í | í | Latin small letter i with acute |
238 | 356 | EE | 11101110 | î | î | î | Latin small letter i with circumflex |
239 | 357 | EF | 11101111 | ï | ï | ï | Latin small letter i with diaeresis |
240 | 360 | F0 | 11110000 | ð | ð | ð | Latin small letter eth |
241 | 361 | F1 | 11110001 | ñ | ñ | ñ | Latin small letter n with tilde |
242 | 362 | F2 | 11110010 | ò | ò | ò | Latin small letter o with grave |
243 | 363 | F3 | 11110011 | ó | ó | ó | Latin small letter o with acute |
244 | 364 | F4 | 11110100 | ô | ô | ô | Latin small letter o with circumflex |
245 | 365 | F5 | 11110101 | õ | õ | õ | Latin small letter o with tilde |
246 | 366 | F6 | 11110110 | ö | ö | ö | Latin small letter o with diaeresis |
247 | 367 | F7 | 11110111 | ÷ | ÷ | ÷ | Division sign |
248 | 370 | F8 | 11111000 | ø | ø | ø | Latin small letter o with slash |
249 | 371 | F9 | 11111001 | ù | ù | ù | Latin small letter u with grave |
250 | 372 | FA | 11111010 | ú | ú | ú | Latin small letter u with acute |
251 | 373 | FB | 11111011 | û | û | û | Latin small letter u with circumflex |
252 | 374 | FC | 11111100 | ü | ü | ü | Latin small letter u with diaeresis |
253 | 375 | FD | 11111101 | ý | ý | ý | Latin small letter y with acute |
254 | 376 | FE | 11111110 | þ | þ | þ | Latin small letter thorn |
255 | 377 | FF | 11111111 | ÿ | ÿ | ÿ | Latin small letter y with diaeresis |
中文字常用字簡體約四千個,國標碼有6,763個;繁體字約七千個,台灣資策會頒佈的中文通用字集大五碼有萬多個。在八位元為資訊單位的電腦上如何編碼,
初期茫無頭緒。輸入也是問題,在七十年代微型個人電腦革命出現前,基本上電腦應用屬於高端客户的大型工具,普通人没有機會接觸,電腦鍵盤由打字機鍵盤(QWERTY Keyboard)加上
一些電腦專用符號改成,蘋果電腦將電腦帶入個人應用範圍後,隨著 IBM 的加入競爭,最通用是 XT 和AT 系列演變而來的101 及 104鍵盤,到 Wintel
成為個人電腦主流,鍵盤基本上是104鍵的視窗系統用鍵盤或它的愆生款式;但無論如何,鍵盤與中文輸入完全没有任何的關連,所以單是中文的輸入問題,便令
當時不少人更振振有詞地認為中文不能配合科技發展,那位數學講師隨口説出的話,便是在這様的背景下出現的。