人类语言与人工智能

作者:苏诚忠  于 2024-7-16 12:36 发表于 最热闹的华人社交网络--贝壳村

通用分类:文史杂谈

最近一段时间,萝卜快跑占据了大众的视野。以此带来的失业恐惧引发争议。过去,一直传说的AI将取代人类工作似乎已经到了眼前。不过,在我看来,问题没有那么简单。为什么这样说呢?回顾一下历史,电脑翻译的历史从上个世纪五十年代就开始了,当时是因为美苏两国大国争霸。这两国都在这上面投资。但是,直到今天,电脑依然不能取代人脑的翻译。最近的历史也能看出,什么元宇宙,量子电脑,区块链,人脑与电脑连接等等,每月都在出现新名词,但都是昙花一现,实际的东西在哪里?真正起作用的只有星链卫星系统。换句话说,还是物理上的进展,不需要过多的解释,一目了然。
人工智能被说得天花乱坠,但是,至今,人类能够用得上的,依然是人脑的辅助设备。我相信,在语言学没有重大突破以前,它不会变成人类的主宰。我说这话的根据是,人类至今没能认清自己语言的各种特性。连自己都不知道是如何相互传递思想的,凭什么预测电脑就能做到?
人工智能如果能够产生思想,那么,一个关键问题来了:这个思想是用什么语言来表达和传递的?动物可以有简单的语言。那也是它们相互之间,多年磨合形成的。人工智能,理论上就是一台电脑,它们需要大量的互动,像人类一样,才可能有自己的语言。否则,只能使用人类语言来完成。如果使用的是人类语言,那么,是英语还是汉语?一般人的回答都是英语,但本文恰恰是用汉语告诉大家,这个想法是有缺陷的。因为,汉语是最适应于人类的语言,而英语,相对来说适应机械。
信息科技出现在西方的根本原因,是在电子技术出现之前,许多西方的大思想家认识到,思想的边界,就是语言的边界。或者说,思想能够交流或者被记忆,实际上是语言在起决定性的作用。因此,所有的知名大学,都有一个语言学系。所有西方的哲学家,从柏拉图到维特根斯坦都对语言学进行过深入的探讨。唯独在中国的典籍中很难找到语言学的内容。我只在道德经的第一章中看到过对语言的研究。但是,由于古文用字过于简练,许多研究道德经的人都用道家思想解释那一段文字。
我在前面日志中谈到过,如果用西方的数学逻辑进行评估,汉语应该是最适合人类使用的语言。这种观点来自莱布尼兹的许多成果。我们知道,他第一个发明了二进位数的运算方法。直到今天,电脑使用的所有运算,都是建立在这个基础之上的。他同時也是第一个发明了机械计算机的人。在电脑出现以前,所有的会计系统,使用的都是机械计算机。有趣的是,莱布尼兹的机械计算机使用的是十进位数,为什么呢?这就是我认为汉语比拼音语言适合人类的根据。使用二进位数,经过一次组合能够得到四个结果,2X2=4,但是十进位数一次组合能得到100个结果,10X10=100。这里要引进一个概念,载义符号。一个符号含有一个具体的意思,就称为载义符号。高电压和低电压是两个符号,它们没有任何意思,直到人类将低压赋予了0的意思,把高压赋予了1的意思以后,高、低电压就成为了载义符号。同样从1到10这十个符号都被人类赋予了意思,所以都可以称为载义符号。基本载义符号多,由它们组合出的载义符号就成倍地增加,但是,abcdefg这些符号,没有具体的意思,它们不是载义符号,可称作无意义符号。只相当于汉字的横竖撇捺等等。正是由于字母不是载义符号,所以,莱布尼兹用它们代表数学上的未知数(我们目前使用的很多数学符号,都是莱布尼兹发明的)。而每个汉字都是载义符号,相当于英语的单词。我们说过,汉语由于四声的关系,声音种类是英语的四倍以上,因此,可以给更多的单音赋予意思,成为载义符号。而拼音文字,没有使用四声,所以声音种类少,只能给声音的组合赋予意思。就是这一点点的差别,造成了今天英语需要二百万单词才能表达整个互联网上的意思,而汉语,只需要四千左右的汉字,就能表达相同的意思。
这里要解释一下,意思是怎样形成的。进入有记载的历史以后,每一个新的载义符号的形成,都是由其他几个已知的载义符号,形成一个句子来解释的。最好的例证就是词典,或者字典上对某一单词或汉字的解释,按照习惯,应该由一个句子来完成。汉语每个字只需要一个声音,两个字才两个声音,而目前,拼音语言中,多数单词都由两至三个声音(不是音节)组成的,这样一来,汉语的词汇就非常方便地,将解释它的那句话,化简成单词。比如,最近新出的一个单词“延毕”意思是延迟毕业。如果翻译成英语就是:delayed graduation。读起来太长了。英语为了读起来方便,尤其是交谈或者演说的时候能够缩短时间,因此,就需要发明一个新的单词,这个新单词的要求是:不与其他单词冲突,而且使用的声音最好在两至三个之间。也就是说,英语用增加记忆的方法缩短表达的时间。而汉语,由于使用的声音种类多,不需要这个记忆,只要联想就够了。此外,由于总体来说,声音种类多的汉语在表达同样内容的适合,使用的声音比英语少,而每一个声音消耗的时间,大约在0.25秒,因此,当两种语言在心里说的时候,汉语做需要的时间短。心里说的过程,就是思维的过程,因此,用汉语思维比英语快。这一点,赵元任在他的《语言问题》中已经提到过。但是,作为物理学教授的他,依然无法用数学方法计算出来具体快了多少。他也只是定性地叙述了一遍,把问题留给了后代的数学家。也许不久后人工智能可以用统计的方法给出数值。这个数值非常重要,假设它是1.1,那就等于说你思维和学习的时间,等于别人花费1.1 或者1/1.1的时间,也就是说,选择快速的语言,相当于多/少活了十分之一的学习和思维生命。因此我认为,汉语是最适合人脑的语言。这也是为什么莱布尼兹虽然发明来二进位数,但是却要使用十进位的计算机。我们说,汉语是最适合人类使用的语言,是相对于机械语言而言。对于机械语言来说,载义符号越少越好,高低两种电压是一切语言中,最小数量的载义符号;或者说,如果只有一个符号,根本无法形成语言。因此,01语言最适应于机械操作。汉语则是最适合人脑的语言,而英语存在于两者之间。你可以把电脑的输入与输出看成是键盘,计算机通过01进行的,英语的语音是通过数百个声音进行的,而汉语是通过上千个声音进行的。
苏联曾经一度希望发明一种三进位的电子计算机,后来发现,由于电压很难稳定下来,太容易出错,最后作罢。人脑与电脑的电压不同,人脑能够区分几千种不同的声音,不会出错。由此可以获得启发,如果电脑使用的不是电压输入或运算,而是声音,或者光,那么,是否会大大加速过程呢? 从这些案例能够知道,基本的单音载义符号越多,由它们组成的词汇表就越大。比如,四千汉字,如果每两个汉字组成一个单词的话,能够组成一千六百万个单词,这些单词,通过自己的联想,就能理解并记忆。而英语的单词,由于几乎没有单音的载义符号,而它也希望快速的表达和思维,因此,必须不断的发明新的单词作为载义符号。这使得人们大大的增加了需要记忆的困难。电脑如果能够达到普通人的思维水平,至少是要输入四千汉字后,它能理解由这些汉字组成的一千六百万单词的意思都是什么?莱布尼兹非常理解这个道理,他曾经根据汉语的思路,提出,全人类任何语言中,只需要有一百个最基本的载义符号,就能用它们推导出任何需要的单词。但是,按照汉语的经验,却是需要四千汉字才能推导出任意多的单词。莱布尼兹没有注意到的是四声的作用。莱布尼兹的想法除了受到汉语的影响,也受到亚里士多德的影响。亚里士多德曾经提出过一种“义语言”Semantics。它的结构就类似汉语。不是用字母组合后再赋予意思,而是每个基本符号带有意思,并用意思来组成新的意思。亚里士多德的灵感来自哪里,书上没有记载,但是,我认为,极有可能是来自古埃及的象形文字。因为,古希腊的很多哲学家都曾经到埃及留学过。当年的埃及对于希腊而言,就如今天中国的人眼中的欧美。
从语言学的角度看问题,如果连人类语言表达都还没能摸清楚是怎么回事,何来的人工智能?可悲的是,中国也有语言大学,那里面学的其实都是从西方语言学中翻译的内容。西方人不懂什么是声调,也不能像中国人一样,透彻的理解组义语言,你跟他们学,那不是问道于盲吗?再说,中国人为什么要使用西方教材?因为当年鲁迅,钱玄同,陈独秀,毛泽东都相信,汉字不灭,中国必亡。他们都带有对汉语的偏见。掌权以后就成了一种政治正确。再往下挖,就会发现,这几个人当中,凡是留过学的,去的都是日本。因为当年去日本留学便宜,可便宜没好货。日本人当年正在脱亚入欧,一来他们想要否定中国文化,二来,日语中,没有声调,他们虽然曾经引进过汉字,但是体会不出四声在语言中的妙用。因此,教出来的留学生们,回国就杀向了汉字。这些人的徒孙,就是当今各大学的教授。加上如今的学术氛围,他们能教出什么内容就不言而喻了。所以,中国的学术永远都没有自己的主心骨,永远都是看着别人的发展追赶。5G没追上,大飞机,没心脏,航母,出洋相。永远是以己所短,追人之所长,就不能发挥一下自己的长处吗?
我坚信,人工智能如果仅靠英语来发展,最大的可能就是,永远都理解不了人类的语言,更弄不清机械语言。只有经过拼音文字与汉语的对比研究后,也许能够最终理解人类语言。有了这种研究,才有可能理解人工智能的语言。否则,任何没有理论根据的巧合,都会被媒体夸大成的重大突破,仅仅是 为了抓人眼球,蹭流量而已。真正的道理是有数学根据,简洁,明瞭的解释,那些越解释越糊涂的理论,最终会使发明者自己陷入迷茫的境地。
上面说过,各大学都曾经有过语言系,当年也都是像今天这样,经过媒体不断炒热一个话题,消失后,再炒热另一个话题。每个话题的兴起都是一堆的论文,成果,等到学费,学位,地位拿到后,不了了之。到了今天,情况依然没变,只不过增加了一层电脑迷雾而已。乔姆斯基的《自生语法》虽然不了了之,但是他对电脑的看法我却很是认同,在他看来人工智能,就是一个海市蜃楼,人类语言学过不了关,电脑语言也休想。乔老爷很明白当年那场闹剧的来龙去脉。在这一点上,他是行家,骗不了他。用理工科的符号解释哲学上的语言,恐怕没那么容易。当年柏拉图就提出,寻找一种能使人不说谎话的语法。但是,经过千百万人的努力,直到今天,这种语法也没有被发明出来。人们看到的是一个个政治骗子在后世制定的各种语法规则中游刃有余。


高兴

感动

同情

搞笑

难过

拍砖

支持

鲜花

评论 (0 个评论)

facelist doodle 涂鸦板

您需要登录后才可以评论 登录 | 注册

关于本站 | 隐私政策 | 免责条款 | 版权声明 | 联络我们 | 刊登广告 | 转手机版 | APP下载

Copyright © 2001-2013 海外华人中文门户:倍可亲 (http://www.backchina.com) All Rights Reserved.

程序系统基于 Discuz! X3.1 商业版 优化 Discuz! © 2001-2013 Comsenz Inc. 更新:GMT+8, 2024-7-16 12:37

倍可亲服务器位于美国圣何塞、西雅图和达拉斯顶级数据中心,为更好服务全球网友特统一使用京港台时间

返回顶部