由于身在外地,但又实在不想错过一次我特别想参与的活动,所以我今晚写了这篇帖子,给翻译技术沙龙第十六次活动抛个砖。这篇帖子的目的是想说一说我对“众包翻译”的理解。
一、这是不是众包?
@译无止境老曹 发了一条微博:咱也谈谈#众包#:受某石油企业委托对近几年深水/超深水钻完井方面论文做调研。昨天我找到14000篇相关文章标题/摘要/出处/关键词,有1万页。我要先把标题摘出来再继续筛选——先交给1个排版员办这事,她花1小时弄了1500篇;之后她找其他5个排版员合作,1小时全部搞定。这就是众包的威力了。
我把他的“众包”流程画了一个图,便于大家理解:
这是不是众包?这是不是“众包翻译”?
老曹的众包流程示意图
接下来我们开始讨论问题。问题是:上面的工作模式是不是众包?是第一个排版员个人的“分包”行为吗?
还有几个问题需要大家思考:众包应该是免费的吗?那图书翻译的众包算众包吗?难道是参与分包的人多了就算众包了吗?
二、四个小案例
我们再举一个例子:星期一老师布置了一个5000字的翻译作业,要求星期天晚上24点提交。
小明到了周六突然意识到还没有开始翻译,于是做了一件事:他到自己平时经常混迹的字幕翻译志愿者QQ群里把自己的悲惨经历诉说了一下,询问有谁愿意帮他完成这个作业,于是有10个人联系他。于是小明立刻把作业分成10份,发给了这10个人,每个人收到了一个500字的Word文档,然后开始翻译了。2小时后小明陆续收到了这10个人的译文,拿到之后他做了一些统一修改,然后在星期天早上一早就发给了老师,是全班第一个交了作业的。
小黑周六一早也意识到自己还有5000字没有翻译,于是他做了一件事:他到猪八戒网站上发了一个任务,1000字20块,试译100字。5000字的稿件晚上24点前交。任务发出去后1小时,他陆续收到10个人的试译,他觉得有5个人不错,于是每个人分给了1000字。4小时后他陆续收到了所有人的返稿。第二天早上他睡了个懒觉,起来之后立刻交了作业,成为班里第二个交了作业的人。他总共花费了100元。
小蓝周日一大早起床后才意识到自己还有5000字的翻译作业没做,他慌了,晚上24点就要交作业了啊!于是他找到一个网站,把自己的作业原文传了上去,这个网站把他的原文分成了50句,每句平均10个字。这个网站有几个激励措施:你给别人免费翻译了10个字,别人就会免费给你翻译10个字;每翻译1个字就会获得10个积分;别人帮你翻译1个字你需要支付他1个积分;翻译的任务多了,有机会被项目经理相中,发放付费的任务;自己上传的稿件自己翻译是没有积分的,但是发布后别人会给予评论;等等一大堆激励机制。就是这样一个网站,他发布后10分钟,立刻收到了所有句子的译文,有的译文甚至还有多个译文,译文下方还有评论。小蓝一看基本上没有什么问题,于是也交了,成为班里第三个交了作业的人。由于他平时经常在网上帮助别人翻译,积累了不少积分,这次他花了自己5000个积分。
小水到了周日也发现自己没有做翻译作业,于是他找了几位之前一直合作翻译图书的译员朋友帮他翻。他把原文上传到Google Translator Toolkit上,然后给10位同学发了邮件,告知这个文件的地址。这10位同学陆续登录到Google Translator Toolkit上,由于这个工具可以实时看到其他人的工作进展,所以看到哪句话没有翻译,他的这些同学就去翻译。由于每个句子都有机器翻译的的译文,半个小时后,所有的句子都翻译完了,小水的朋友还意犹未尽,互相做起了审校,看着不顺眼的译文就去修改以下,于是又花费了半个小时。1个小时后这个稿件翻译完成,小水也顺利提交了译文,成为第四个交了作业的人。
三、谁的译文质量更高?
老师看到这四个译文,你们猜谁的译文质量更高?
- 质量
其实,仅凭目前我提供的这些信息,很难判断谁的译文质量最高,因为再好的流程如果没有好译员质量都会出现问题。但是,大家仔细观察上面四个案例,会隐隐约约觉得小蓝或小水的译文可能是最好的,因为只有他们的译文是多人互相审校过的。至于谁的最好,不好说。 时间
我们再来看时间,谁的是最快的?从我案例里给出的虚拟时间来看,小蓝的时间是最快的,用时10分钟 其次是小水的,用时1小时。5月份我做过一个实验(http://weibo.com/2498891990/B3yrKuvDT),通过基于Google Translator Toolkit的实验发现,450字的文章由5个人翻译时,真正用到翻译和互校的时间约为30分钟,也就是说:5个人半小时能翻译450字,即5个人1小时能翻译900字,即10个人1小时能翻译1800字。如果我没算错的话,在所有参与人对流程和工具熟练的话,虽然目前的实验数据显示10个人1小时的翻译速度还太低,但我相信10个人1小时翻译5000字应该是没有问题的。而其他三个案例给出的时间大家也可以根据自己的翻译时间来估计一下,看我给出的虚拟时间是否可信。(在上一版中此处时间估算有误,已更正。2014/08/03 8:00)假定我四个案例的时间都没有太大的误差,那么可以说,小蓝是最快的,其次是小水的1小时,然后是小黑的2小时,最后是小蓝的4.5小时。
- 成本
从金钱成本上看,小黑是唯一花了钱的,小蓝花了靠自己做翻译赚的积分,而小水和小名都是靠朋友支持,花的是友谊,以后可能是要还的,比如请人吃饭,或者免费帮别人做事情。从沟通成本上看,唯有小蓝几乎没有与参与人做什么一对一的沟通,而其他三个人都要在翻译的某个阶段与之做一对一的沟通。
好了,分析完这个案例后,我们再思考一个问题:这四个人谁在众包?
四、什么是“众包”?他们是不是“众包”
我们先看一下众包的定义:群众外包(英语:crowdsourcing)是互联网带来的新的生产组织形式。《连线》(Wired)杂志记者Jeff Howe于2006年发明的一个专业术语,用来描述一种新的商业模式,即企业利用互联网来将工作分配出去、发现创意或解决技术问题。通过互联网控制,这些组织可以利用志愿员工大军的创意和能力——这些志愿员工具备完成任务的技能,愿意利用业余时间工作,满足于对其服务收取小额报酬,或者暂时并无报酬,仅仅满足于未来获得更多报酬的前景。尤其对于软件业和服务业,这提供了一种组织劳动力的全新方式。(http://zh.wikipedia.org/wiki/众包)
我们拆分一下,得到几个关键点:
- 有互联网基因,任务通过互联网分配
- 志愿利用业余时间
- 暂无报酬,或小额报酬
打眼一看以上四个人都是通过网络找到了愿意利用业余时间帮他翻译的人,有些有报酬、有些没报酬。所以可以说,以上四种情景都是“众包”。
五、什么又是“众包翻译”?
但是,都是既然都是众包,谁是真正的众包翻译?
在当今的互联网时代,谁的技术融合程度最高?我们首先排除第一个人小明,因为他整个过程都是靠人工和QQ。小黑运用了威客平台,这个平台是普适的,任何业务都可以使用这个平台,所以小黑并没有真正使用众包翻译技术。至于小水和小蓝,我曾经写过一段文字(http://weibo.com/2498891990/B3whqEnW3),用来区分协作翻译和众包翻译:
协作翻译:将一篇待翻译的稿件传到一个网页中,5个译员全都能通过这个网页看到稿件内容,并在网页里翻译分配给自己的段落,大家共享术语库、翻译记忆库、参考资料等资源,可以在网页中的聊天窗口聊天。项目经理也可以在这个网页中查看每个人的翻译进度,与每位译员沟通。
众包翻译:将一篇待译的稿件分成5份,单独发给5个译员,5个译员独立翻译,项目经理组织协调5个人使用的术语库、翻译记忆库、参考资料等资源。
如果从我之前写的这段话来看,只有小蓝才是“众包翻译”,小水是一个团队的协作翻译。我的这个区分应该会引起一部分争论,但这不要紧,我们来分析以下小蓝的众包翻译有什么优势。
从之前的案例分析来看:小蓝的译文质量可能是最高的,或者是质量相对靠前的;小蓝是耗时最快的;小蓝是沟通成本最低的。
写到这里,我想大家心里应该对众包翻译的前景比较明朗了,我们整个语言服务行业所追求无非就是:耗时短、成本低、质量高的译文。
接下来大家可以再思考一下,为什么在小蓝那个案例中小蓝可以做到耗时短、成本低、质量高?
我提出几点我的看法供大家参考:
- 真正融入了互联网思维
- 真正采用了先进的计算机技术,尤其是计算机辅助翻译技术
- 真正融合了有效激励机制
- ......
接下来,期待大家在翻译技术沙龙第十六次活动有所收获,真正去讨论众包翻译的发展趋势!