互联网是人类历史上最大的信息库,是全世界人民交流的促进者,是获得教育、参与和改变世界的途径。但40多亿人还没有获得这一巨大的全球资源。
根据联合国的统计,2015年有三分之一的用户第一次上网。但是,要让下一个十亿用户上线,可能要比之前的十亿用户难得多。贫困、技术、偏远人口和语言障碍是全球连接和网络参与的严重障碍。
在这些因素中,网络语言表达的缺失可能是提高互联网参与度的最大障碍。
互联网仍然以英语语言内容为主,网络语言的引入与现实世界的差距越来越大。
这个图表最好地概括了这种情况,它表明网络的语言划分与线下世界的语言使用者数量无关。
这个问题可能比任何技术障碍都要严重:如果你的语言中的内容非常少,那么快速的宽带连接就没有任何意义。
让下一个十亿人上网
互联网接入的增长正在放缓。似乎下一个重要的里程碑——拥有40亿互联网用户——在2020年之前无法实现。
这部分是因为它已经到达最容易的人群。下一批上线的人群将分布在农村和偏远地区。他们会比已经上线的人穷,会说一些世界上比较异域的语言。这就在他们之间设置了很多障碍,互联网参与其中,其中只有一种语言表达。
目前,世界上7000多种语言中只有一小部分以有意义的方式在网上呈现:可能不到总数的5%。根据联合国教科文组织的统计,网上大约有300种语言。
但是,即使是在线的数百种语言也没有按比例表示。相反,包括英语、俄语和德语在内的一些主要语言占主导地位。虽然大部分人都说了,但是中文还是有少数人在线。人口基数较大的其他语言,如印地语和阿拉伯语,在这些语言的在线内容数量方面没有得到很好的体现。
互联网的某些部分在语言上比其他部分更加多样化。谷歌搜索可以处理世界上大约350种语言,脸书正在增加更多的语言,Twitter的容量在2012年至2015年间增加了一倍多。
这些平台仍然只能以相对较少的世界语言呈现内容。虽然互联网可能以我们从未见过的方式连接人类,但一些平台上语言变异的相对缺乏对参与构成了威胁。LinkedIn是世界上主要的商业网络平台之一,它只能处理大约24种语言。全球最大的交易平台阿里巴巴只有十几个。
那么,怎样才能让世界其他地方都上网呢?我们将忽略世界上估计数十亿人,他们可能是功能性文盲,只关注那些目前识字的人。在语言方面,内容需要大大扩展,以使互联网在语言上与世界上大多数有文化的人相关。
根据脸书2015年的研究,如果我们想让世界上80%的人口都能使用维基百科,它所编写的语言数量需要从52种增加到92种。在40个新版本中提供最受欢迎的10万页维基百科语言显然是一个巨大的项目。
但问题比“仅仅”将10万个维基百科页面增加到40种新语言要复杂得多。对于很多地区无法接触到拉丁字符的用户来说,域名系统(DNS)本身的结构带来了挑战。互联网最初并不是为了多语言而设计的,DNS只是用来支持字符az、AZ、0-9和连字符。升级DNS以支持世界主要语言中的数十万个字符并不容易。
虽然可以上网的廉价基础手机越来越受欢迎,但许多可用的廉价手机可能无法满足某些语言的需求。
迎合一个小的语言基础可能不划算——尤其是那些人口不多的语言基础。虽然有25亿人使用印地语,而且根据新兴市场的标准,他们中的许多人都具有很高的收入水平,但能够处理印地语字符的智能手机只是最近才出现。那些人口基数更小,人口更穷的语言,希望在哪里?
在线语言多样性的重要性
出于许多原因,为所有语言的使用者提供在线资源是非常重要的。拥有一种主要的交流资源,而这种资源只能在一种更大的世界语言中获得,这可能会对更小、更晦涩的语言构成威胁,这些语言正处于严重濒危状态。
根据Ethnologue,估计有1,519种世界语言处于危险之中,915种被列为“消亡”。随着最后一位母语者的去世,世界每年会失去六种语言。语言视野狭隘的互联网对语言多样性构成了威胁,互联网可能会帮助晦涩的语言使用者保持他们的语言,只有在他们能够容纳的情况下。
以母语上网也将成为网上参与的主要动力。
如果没有母语提供的内容,许多目前不上网的人可能看不到上网的价值。对于较贫困的社区来说尤其如此,因为获取可能是一个严重的财务问题。对于受教育程度低或与世隔绝的人来说尤其如此,他们可能只会说当地语言。
获取母语资源对于掌握新技术也很重要。脸书国际化和本地化总监Iris Orriss表示,如果网站内容以母语提供,用户更有可能在网站上完成注册。这可能是因为如果他们使用自己的语言,他们更有可能理解完成注册过程的说明。
世界语言的在线表达仍然至关重要。虽然对于较大的少数民族语言来说这可能更容易,但我们可能会发现在互联网上添加新的语言群体越来越困难。许多因素将成为他们参与的障碍,包括技术和资金方面的考虑。显然,互联网要反映人类真实的语言图景,还有很长的路要走。
