首页 为什么是“龙的传人”? 信箱:1131376436@qq.com T: 13671606831 《译龙风云》 |
英语是“一维文字”,汉字是“二维文字” 黄佶 1,英语是一维的,而汉字是二维的 英语仅通过水平方向的字母变化传递信息,例如“one”和“two”,而汉字可以在垂直方向通过笔划的变化,传递不同的信息,例如“一”和“二”。 在电脑中,每一个英文字母需要一个字节(byte)来代表,因此,一个单词中包含的字母越多,占用的字节数也越多。不幸的是,学过英语的人都知道,一个英语单词的含义越复杂,单词中包含的字母也越多,例如我的专业:metallurgy(冶金学)。这个英语单词在电脑里需要十个字节来存储。而它对应的汉语“冶金学”只占用六个字节,因为一个汉字不论多么复杂,含义多么丰富,只需要两个字节来代表。根本原因就在于汉字来自“图画”(象形文字),是一种“二维文字”。 归纳起来可以这么说:汉字是二维文字,在同样的“宽度”中,包含了较多的信息,因为它在“高度”方向也可以变化,也可以携带信息。在印刷品中可以看得很清楚,汉语的字体稍大,但是表达同样含义的句子较短;而英语的字体可以稍小,但是行数较多,页面上很多空间用于行的分隔。 汉语拼音化,实际上是把汉语从“二维文字”改造成“一维文字”。也许从这个角度讨论汉字改造问题会有新的思路? 2,汉字的“二维”信息被预先存储在电脑里了 参加汉字通讯的电脑,预先都会安装汉化平台,例如中文 windows。安装汉化平台时,我们实际上已经把汉字的二维信息存储在电脑里了。电脑接受到两个字节后,会自动地、迅速地把这两个字节还原成它们对应的那个汉字。 也就是说,在汉字的传输过程中,有很大一部分信息根本不需要传输。汉字虽然书写困难,但是传输汉字时并非传输它的写法,而是仅仅传输它的代码。它的写法早已在安装汉化平台时就已经输入电脑了,代码到达接受方电脑时,电脑自动地给它们“对号入座”。 我在这里创造一个新词:“字节文字”。字节文字的基本特征是用不同的数字组合来代表文字。例如当我们把代表“冶金学”这三个汉字的六个字节,从左到右顺序排列,我们就得到了对应“冶金学”的“字节文字”。 我们在电脑上输入汉字后,电脑随即把汉字转化成“字节文字”加以存储。 实际上,从方便书写、方便输入、方便存储、方便传输等方面考虑,把汉字从“象形文字”改造成“字节文字”比改造成“拼音文字”更加合理。“字节文字”还可以彻底解决汉字的同音字问题,而这是汉字拼音化遇到的最大问题。 然而,文字的最主要功能是供人类识别,拼音文字以发音帮助阅读者识别,象形文字以形象帮助阅读者识别,而字节文字只能靠预先死记硬背存储在大脑中的记忆识别,因此非常难以掌握。所以“字节文字”没有被人类用于相互交流,而是用于擅长死记硬背的电脑。 3,技术的进步具有根本性质的影响 电脑因为预先存储汉字的二维信息而减少了汉字占用的存储空间和传输带宽。 电脑的存储器(内存和硬盘)越来越便宜,预先存储更多的东西已经成为可能,例如字组(汉字输入的联想功能)、汉字字形(汉字自动识别——OCR)等等。 电脑的处理能力越来越大,原来不可能的事情现在已经可以实现了,而且成本很低,能够普及。例如手写汉字识别,语音识别等。 即将到来的传输线路带宽突破性的拓宽,不仅将使文字型文件(文件大小在 100 Kbyte 以内)的传输不再成为问题,而且图象文件(文件大小在 1 Mbyte 以内)的全球传输也可在瞬间完成,传输瓶颈将上移到音频和视频文件(文件大小在 1 Gbyte 量级)。 这一切都应该在文字改革研究者的视野里。 当年电脑的发明者为了节约两个字节的存储空间,而省略年份的前两位,结果造成后人全球大战千年虫。 为了克服眼前的一个小困难,而给后人留下一个大麻烦,肯定不会是大家希望发生的事情吧。 网上有一则幽默说,在解决千年虫问题时,应该再增加一位,以免我们的后人大战“万年虫”。虽然是笑话,但充分证明说笑话的人有着常人所没有的高瞻远瞩。 |
黄佶,1999年10月19日于上海 相关链接: |
(返回顶部) 返回首页 QQ互动群:417754415 主编黄佶信箱:1131376436@qq.com Tel:13671606831 |