查看原文
其他

行业科普 | 识别人工翻译/机器翻译的“火眼金睛”?

The following article is from 国际翻译动态 Author 唐蕊


(图片来源:https://slator.com/researchers-see-promising-direction-auto-detection-human-vs-machine-translation/)

PART

NO.1


自2016年神经机器翻译(NMT)横空出世以来,许多公司一直吹嘘机器翻译(MT)几乎堪比人类水平。诚然,机器翻译的质量不断提高(尽管在各语言及各领域之间并不均衡),但在许多情况下,只有人工翻译(HT)专家在环(expert-in-the-loop)翻译才能奏效。
把人工翻译译文从机器翻译中筛选出来只会变得越来越困难,尤其是机器翻译如今被用来创建一些源文本。在这一领域,荷兰格罗宁根大学(University of Groningen)的研究人员发现了开发所谓“分类器”的机会,这是一种用少量特定任务的标记数据进行微调的单语或多语语言模型
在2023年5月一篇题为《多语言环境下人类翻译及神经机器翻译的自动识别》(Automatic Discrimination of Human and Neural Machine Translation in Multilingual Settings)的论文中,作者Malina Chichirau、Rik van Noord和Antonio Toral考虑了多语言环境下的分类器。
他们发现,使用来自多种源语言的训练数据可以提高单语及多语分类器的准确性。
研究人员从国际机器翻译大会(Workshop on Machine Translation,WMT)新闻共享任务中,挑选非英语源文本及其相应的英语人工翻译(HT)和机器翻译(MT)用于创建数据集。单语分类器只用纯英语数据进行训练,而多语分类器则用源文本及其英语译文进行训练。
与单语分类器相比,多语分类器在识别人工翻译或机器翻译方面准确率更高,这表明分类器显然受益于能接触到源句。
用德语、俄语和中文进行的实验还表明,多源语言的训练可以提升分类器在其他语言上的表现。



PART

NO.2 


  大有前途的方向


作者写道,“然而,合并来自不同源语言的训练数据其效果似乎正在减弱,因为只有将这三种语言作为训练数据结合起来才能获得最佳分数。”“尽管如此,鉴于即使只有少量的额外训练数据(中文只有1756个训练实例)也能提高性能,我们认为这是未来工作中很有前途的一个方向。”

该小组还发现,在文档层面的文本上对句级模型进行微调是有效的,最好是用文档而不是用句子来训练模型。以这种方式进行微调,使得准确性最高而标准偏差最低,这表明分类器更稳定。
研究人员写道,展望未来,随着文本生成继续融入机器翻译,区分原文和译文可能会变得更加困难。因此,这一系列研究,下一个合乎逻辑的步骤将会是:做出能将文本识别为原始文本、人工翻译文本或机器翻译文本的分类器。
原文网址:https://slator.com/researchers-see-promising-direction-auto-detection-human-vs-machine-translation/
声明:本公众号转载此文章是出于传播行业资讯、洞见之目的,如有侵犯到您的合法权益,请致信:chongchong@lingotek.cn,我们将及时调整处理。谢谢支持!


-END-

本文转载自:国际翻译动态
转载编辑:Pickey


关注我们,获取更多资讯!

往期回顾

行业动态1. 行业动态 | ChatGPT时代翻译技术教育创新论坛成功举行
2. 行业动态 | 中国历史文化对外译介与国际传播专家论坛暨新时代新技术背景下高级翻译人才培养研讨会在延安召开
3. 论坛预告 | 精彩“剧透”,先睹为快!邀您共赴“2023小牛翻译论坛”4. 公益活动 | ChatGPT口笔译技术应用与实战沙龙
行业洞见
  1. 行业观察 | 王海涛:加强翻译技术标准化建设,支撑行业高质量发展
  2. 行业观察 | 宁静老师:长缨在手,敢缚苍龙
  3. 行业法规 | 生成式人工智能服务管理暂行办法
  4. 精彩回顾 | 王华树:基于GPT的翻译技术应用模式创新


行业技术
  1. 技术应用 | 翻译时,如何轻松筛选特定用户修改的译文
  2. 技术应用 | 高质量翻译的秘诀:掌握术语管理的三个阶段
  3. 行业科普 | AI与本地化配音:不只是炒作
  4. 技术科普 | SaaS本地化:挑战、 益处和最佳实践
  5. 行业技术 | LLMs能否替代人工评价作为对话生成质量的评估器?

精品课程
  1. ChatGPT提示工程(Prompt Eng.)实践工作坊
  2. 精品课程 | 2023年暑期翻译技术实战研修班
  3. 精品课程 | GPT+:翻译、技术与语言学习工作坊
  4. 最后1天!实习证明、翻译项目,尽在四周暑期口笔译实习实践竞赛营!
  5. 一天一块钱,承包全年全方位语言服务知识学习!

资源干货
  1. 资源宝库| 语言服务行业50个常用术语概念及解释
  2. 双语干货 | 李强在第十四届夏季达沃斯论坛开幕式上的致辞
  3. 双语干货 中华人民共和国对外关系法
  4. 双语干货 | 谢锋大使向中美媒体发表讲话
  5. 资源宝库|译者用“典”,多多益善——精选31款在线词典

招聘就业1. 招聘快报 | 英文广告投放
2. 招聘快报 | 第三届翻译技术教育研究院校园大使招募3. 向AI提问,这个新职业火了4. 就业信息 | 啥是文档工程师?5. 招聘快报|年薪17万起!国企石化招聘英语翻译



继续滑动看下一个
语言服务行业
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存