Tuesday, April 26, 2016

刘周岩:华语对现代文明的贡献有多大

华语全世界母语人数最多的语言,在中国媒体的报道中,它似乎也是老外最热衷学习的语言。华语的地位真有中国人想象的那么高吗?

据新华社报道,截至 2014 年 3 月,全球华语学习人数已超过一亿。孔子学院开遍世界、各国中小学生争相学华语的报道也屡见于国内媒体。似乎今天谁不学华语,谁就要落后于时代。看起来,华语已随着中国国力的提升成为除英语外世界上最重要的语言。

可事实真的如此吗?

用户多未必影响大

判断语言影响力的常见标准,是使用这种语言的人数和使用这种语言的国家的国力,按照这两个标准,华语是当之无愧的世界第二语言。

▍华语是世界上母语人数第一的语言,有近 14 亿母语使用者,远大于第二位的六亿母语者的印地-乌尔都语,第三到五位分别是英语、阿拉伯语、西班牙语(图片来源:华盛顿邮报)



从使用人数来讲,华语是当之无愧的第一大语言。若是考虑国家经济实力(按 GDP 计算),虽不及英语国家总和,但也稳坐第二位。

2003-2010 年间 GDP 按照语言的比例分布,华语仅次于英语,且占比逐年上升

不过,母语者人数和 GDP,不能直接表征语言本身的信息价值和传播情况。GDP 衡量的是国家经济情况,用它推测该国的语言影响力,实际上是假设了语言与经济情况之间存在正相关性,但这个前提本身并未得到确证。

按照语言自身的标准,华语在“信息产量”上也是绝对的前二。例如期刊文章发表量和互联网信息量,华语都是仅次于英文的世界第二语言。不过这两个标准的问题在于,它们表征的仅仅是信息规模而非“信息质量”

那么,有没有一种数据,既能反映某种语言产出的信息规模,又可以体现信息的质量,甚至是与其他语言之间的关系呢?有,这就是书籍翻译量

在各种不同形式的信息载体中,正规出版的纸质书籍往往是较高质量的信息内容,大大过滤了垃圾信息。各种语言间互相翻译的书籍,更是一种二次过滤,因为只有具备较高价值或需求的书籍才会被翻译成其他语言。由此,不同语言的书籍翻译输出和输入数字,可以直观地反映高质量信息的流动、传播方向,以及不同语言在人类知识生产中的地位。

▍《圣经》不仅是最畅销的书籍,也是被翻译成最多语言的书籍。人类文明中越重要的书籍会被翻译成越多种语言

国际联盟从 1932 年开始就收集各国翻译图书的数据,后来这个任务交由联合国教科文组织负责,建立了世界书籍翻译数据库(UNESCO Index Translationum)。各国政府向联合国教科文组织提供正规出版物中翻译著作的信息,1979 年起的数据都已经完成电子化,可以线上检索。

如果以书籍翻译量作为评判标,华文再也不是世界前二了。根据 2012 年截取的数据(此数据自 1979 年起记录,后文未加特别注明的“翻译量”“翻译排名”等均指这一部分数据),人类社会一共出版大约两百万种翻译书籍(不考虑印数,同一本书的不同译本分别计算)。

其中由华文翻译成外文的书籍一万三千余种,由外文翻译成华文的六万三千余种,合计七万六千种左右,这一数字位于全部语言的第十四位。不仅远远不及英、德、法等语言,也不及许多小语言如丹麦语、捷克语等。

翻译总量前二十的语言,华语仅位列第十四位

翻译数据库所涉及到的超过一千种语言,非常明显地分为四个梯队:

第一梯队是唯一的超核心语言,即英文,全部翻译书籍中约 60%是由英文译出或译为英文;

第二梯队是两个核心语言,德文和法文,各 20%的翻译书籍由它们译出或译入;

第三梯队是五个区域性核心语言,分别是西班牙文、俄文、日文、荷兰文、意大利文,由其中一种语言译出或译入的比例在 5-10%之间;

第四梯队是所有其他语言,即边缘性语言,全部翻译书籍中由其中任意一种语言译出或译入均小于 5%(所有百分比加和应为 200%,因为一本书涉及翻译出与翻译入两种语言,被计算两次)。

由华文译出或译入的书籍,只占人类社会全部翻译书籍的 3%,华文属于第四梯队的边缘性语言。

十三亿人的信息孤岛

翻译规模仅仅是一个方面,另一方面是各语言之间互相翻译的“通道”。全球语言之间的翻译构成一种网络结构,如同高速公路、铁路网,翻译量只能显示“通车量”,在这个网络中的位置以及和其他节点的连接情况决定了这种语言与其他语言的互通程度。

MIT Media Lab 基于这个翻译数据库构建了全球语言网络结构,并计算了每种语言的特征向量中心性(Eigenvector Centrality)。特征向量中心性是网络中某个节点重要性的度量,与这个节点和其他节点的连接权重成正相关。谷歌(Google)的页面排名计算即是基于特征向量中心性。我们可以将这个值称为“语言中心性指数”。


基于世界书籍翻译数据的全球语言网络结构。中文是下方的橙色圈“ZHO”。圈的大小表示语言中心性指数;圈的颜色表示语系;连线粗细表示翻译量

各种语言的中心性指数排名,华语位于第二十位

在全球语言网络中,英文处于绝对的中心位置,是信息交互的枢纽,其中心性指数高达 0.90,法文以 0.30 居第二位,德语以 0.26 与法文同处第二梯队。第三梯队中,意大利文借由其在欧洲语言中的重要地位,尤其是和英文、法文、德文的良好信息交互,以 0.09 的中心性位列第三梯队的首位,但按照书籍翻译量排名意大利只是第三梯队的第五。和意大利文情况相反的是日文,因为日文与欧洲语言的信息交互较弱,其中心性指数排名低于翻译量排名。

华语的中心性指数如何呢?很不幸,比按照翻译数量的排名还低,仅以 0.014 的特征向量中心性位于第二十位,这说明中文处在语言网络中的边缘位置。中文与英文、日文两种语言互相翻译较多,而与其他几种主要欧洲语言的翻译则相对较少。中文某种程度上也是一个“区域枢纽”,蒙文、藏文等高度依赖于中文,但这些语言本身即处于世界语言结构非常边缘的位置。

以中文为关注焦点的结构示意图。中文直接与英文相连,此外与日文、韩文联系也较紧密,其他一些语言类似蒙文、藏文等则需要依靠中文作为信息中转枢纽

以英文为关注焦点的结构示意图。英文作为核心中枢,与绝大多数重要语言建立了直接的、大量的信息交互

如果以交通网来比喻语言网络,英文就是北京,是四通八达的核心枢纽,德语、法文是上海、广州等全国性枢纽,日文是区域性枢纽如西安,华文则是西宁,而蒙文、藏文等则是德令哈、刚察。

信息流动更类似于航空而非公路,每一次连接都需要巨大成本,所以不是按照最短距离,而是按照最少连接次数的原则进行传递信息。但不是任意两点之间都可以连接,一个节点只能和上级中枢或周围节点连接。

二十世纪初,中文在世界语言网络中的位置更边缘。鲁迅翻译凡尔纳小说时,即是按日译本译成中文,日译本则是由英译本译出,英译本根据法文原文译出。这样一个法文-英文-日文-中文的途径,非常好的展示了英文作为核心中枢以及日文作为区域中枢的作用

 ▍鲁迅翻译的凡尔纳小说版本

当然,今天华文世界已经有许多直接根据法文原文译出的凡尔纳作品,但是,更小众的信息或是其他边缘性语言的信息想要进入华文世界,仍然要借助其他枢纽的中转,最主要的就是英文枢纽。

所以,虽然华文有着最多的使用人数,占据了世界第二位的 GDP,但在全球语言信息网络中,处于信息的孤岛,外面的信息进来不易,华文世界的信息想传递出去也不易。与华语类似的这种体量大但信息交互性差的语言,还有阿拉伯语。

位置取决于对人类文明的贡献

既然华文有如此多的使用人数,现今中国的国力也不容小觑,那为什么华文仍处在全球语言网络的边缘位置?

究其根本,是中国的文化影响力过低导致了华文的边缘性。

对于上面的判断,有没有什么可以验证的数据呢?有。

MIT 将他们计算出的语言中心性指数与各类数据进行拟合,发现与 Human Accomplishment 中提供的人类知名人士(1800-1950 年)数量存在高度相关性,确定系数 R 平方达 0.858。
语言中心性指数与 Human Accomplishment 提供的知名人士数量的拟合结果,呈高度正相关


Human Accomplishment 中的“知名人士列表”由查尔斯·默里制作,通过计算百科全书、学科史书籍中某人出现的次数和描述篇幅等,得出人物知名度指数。不计商人、政治家、明星等,只记科学家、艺术家、哲学家,故可认为是学者共同体所公认的“人类知识创造者”。

按照国家和语言排序的 1800-1950 年间知名人士数量,由查尔斯·默里统计。语言根据国家文化背景有加权计算,所以出现非整数

在这份知名人士列表中,英语、德语、法语使用者位列前三,这三种语言也同样是目前世界知识体系中最核心的三种语言,处于信息网络的核心。

近现代以来,中国人(或称“华文使用者)对人类整体知识的贡献非常小,是导致华文处于知识网络边缘地位的根本原因。另外,知识产出与语言影响力之间不是单向的因果关系,当语言影响力提升后,也会反过来促进使用该语言的人更容易地向外传播乃至创造知识。

同样可以佐证这一点的是,涉及到华文的翻译书籍中,翻译入华文与由华文翻译出的比例为 4.7:1(翻译入 62,650 种,翻译出 13,337 种)。翻译入远多于翻译出,说明这种语言是一种文化弱势语言,接受外来文化程度大于向外输出文化。

与此形成鲜明对比的是英文,英文的翻译入与翻译出比例为 1:8.4(翻译入 146,294 种,翻译出 1,225,237 种)。由英文翻译为其他语言的书籍远远多于由其他语言翻译为英文的书籍,说明英文是一种向外输出知识和文化的强势语言。

实际上,英文是唯一一种翻译出远大于翻译入的语言(不算拉丁语等死语言)。第二梯队的德文、法文,第三梯队中的意大利文、俄文,它们的翻译入与翻译出大体持平,其他的所有语言几乎都是翻译出显著小于翻译入,而翻译入的源语言主要就是英文。

在这已不算多的文化输出中,古代和所谓“传统”文化仍然占据了华文文化输出的一大部分。1979 年以来被翻译最多的前三位中文作家分别是老子、孙子和孔子,都是古人。2004-2014 年间,日本出版的由中文译出的书籍中,最多的是文学作品,其次分别是中医类书籍和中国传统艺术类书籍。
1979 年以来被翻译为外文最多的中文作家,分别是老子、孙子、孔子、鲁迅、高行健,前三位都是古人


文化输出能力弱导致华文译为外文的书籍少,那么华文在翻译其他语言书籍方面如何呢?即便原创能力欠佳,若是由外文翻译为华文的书籍足够丰富,那么倘若华文是你唯一掌握的语言,也可以获取人类知识的多数内容了。

遗憾的是这样的愿望也无法达成。

由外文翻译入的数量,华文也只排第十三位。且不论欧洲各语言,看一看我们的近邻日本。与华文一样,日文是文化弱势语言,翻译入与翻译出比例为 4.9:1(翻译入 130,893,翻译出 26,921)。不过,日文翻译入的绝对数量远大于华文,是华文的 2.1 倍,位于全部语言的第五位。

日本的翻译事业起步于明治维新时期,其时翻译了大量西文著作,中国人则借助日文书籍了解西方。甲午战争后中国人大量翻译日文书籍,1896-1911 年间翻译日文书籍 958 种,远远超出同期翻译西文书籍数量。二战后日本出现了第二个翻译高峰,而中国的翻译事业则因为政治环境的原因受到很大局限。八十年代后,中国翻译引入外文书籍的速度大大提升,近年来每年出版的翻译图书已逾万种。

目前,美国成功学大师戴尔·卡耐基的作品,是华文世界输入最多的西方文明成果(207 种译本)。








This is a guest post from physbook team, and protected under CC BY-NC-SA 3.0 License. Unless otherwise stated in the comment text, without author(s) written permission, please specify: Reprinted from Physbook (RSS)/转自飛思播客 (RSS) with the article's link (Please do not change the Title. Remain the link same at least because we could make changes on the content in further updates otherwise you will be responsible to the mistake you spread to readers) OR Trackback in the comment "[...]quotes/引用[...]" with your article part and link FOR reproducing or using the whole or any part of the content.
Leia Mais

歡迎Wlcom

分享是主旋律,,工具类总结,tips and derivations that will make it easier for me to perform the various tasks im faced with. These notes cover a wide range such as data analysis utilities (details see my site tags). this site is mainly used to help me clarify/sumarize/debug/backup/refactor/organize my thoughts,我的生产力解放,不用把更多的时间赔上,and capture my interests with time savingmay helpful to you literally we turn to a grp blog and collaboration,,,, on the other hand, i strongly suggest to subscribe inside a rss reader rather than refresh the website each time,,,alternatively, you can subscribe as podcast inside like itunes if you wanna download media contains ,,, also the microblog site is a complement to our website. - @Musibolun

For Commenters: To enter in LaTeX in comments, use $latex $ (without the < and > signs, of course; in fact, these signs should be avoided as they can cause formatting errors). Related Posts Plugin for WordPress, Blogger...