中文小说网

繁体版 简体版
中文小说网 > 我靠打爆学霸兑换黑科技 > 第1868章 如何翻译外星文

第1868章 如何翻译外星文(2 / 4)

信息熵越低的语言,文字理解学习起来更容易,但相同长度的文本能表达的信息量也越少,可以理解为更费口舌更费笔墨但不费脑子,沟通效率更低。

例如英文的一阶信息熵大约是4比特,汉字一阶信息熵大约是9.6比特,不同文本样本和不同建模得出的计算值会略有误差,但差距之大显而易见。

实际生活中最直观的例子,就是同样内容的文本,例如产品说明书或者联合国文件,就会出现汉字篇幅更短的情况。

第五代星际语言翻译器,在之前几代升级的模块上进行全面加强和改错。

传递信号的模块换上了最顶尖的,精度强度都上了一个台阶,造价上了十个台阶,好在这种和外星人沟通的东西也不用考虑量产成本,价格完全无所谓。

又加入了更多的初次接触信息种类,更灵敏的ai模型。

同时神童们在做第五代版本时,再度深入研究了语言信息熵,之前研究的语言只是现有使用的国际主流语言,这次神童们研究了历史上的古语言演变过程,并尝试自创信息熵更高或更低的新语言。

宋河看神童们的研究手册时,震惊于研究的细致深入程度。

有据可查的二百多种不同历史时期的语言,神童们分工合作都吃透了,得出大量数据详实的结论,这帮智商逼近二百的孩子,为了一个当时毫无实用价值的课堂小任务,业余时间自学成才变成了一堆古语言专家。

全球曾经出现过的主流语言里,信息熵的冠亚军分别是繁体汉语文言和东瀛候文,其中文言文不同历史时期的熵变化也做了排序,《尚书》时代的信息熵和《史记》时代的信息熵差别已经很大了。

最初神童们认为,很大概率外星文明的语言也会出现类似的变化,随着历史时期改变,出现信息熵减弱,从信息熵更高的《尚书》减小为《史记》,从信息熵更高的繁体减小为简体。

包括东瀛候文,是从汉语文言先演变成变体汉文,最后才演变成东瀛候文,整个演变过程也是信息熵不断减小的过程。

研究到这一步,神童们觉得外星文明的语言信息熵可能也会较低,毕竟星际文明的历史大概率会比人类历史更长。

但这一结论只存在了一个周末就被推翻了,神童们立马又得出了完全不一样的结论。

推翻老结论的原因主要有三点。

第一,为什么汉语演变时间比其他国际常用语言长的多,信息熵却是最高的,而不是随着时间降到所有语言的最低?

第二,经过多种算法做文本压缩实验,

『加入书签,方便阅读』