当前位置: 首页 » 资讯 » 科技 » 正文

全球科技频道:ChatGPT的翻译能力有多强?

放大字体  缩小字体 发布日期:2023-11-01  来源:美国维克森林大学文理学院  作者:付晓灵
核心提示:从最近火热的 ChatGPT 上,我们可以发现 GPT(Generative Pre-trained Transformer)模型在处理自然语言处理中的很多任务中均取

从最近火热的 ChatGPT 上,我们可以发现 GPT(Generative Pre-trained Transformer)模型在处理自然语言处理中的很多任务中均取得了很好的效果, 尤其它的机器翻译效果让人大为震撼。下面就简要谈谈ChatGPT的机译效果。

ChatGPT模型通常被用来执行单向语言模型任务,但是通过将源语言和目标语言交替输入模型,我们可以使用它来进行机译。我们需要使用Transformers库和Tokenizer类将源语言和目标语言转换为模型可以处理的张量格式,并在模型的输出层添加一个新的全连接层以创建机译模型。

ChatGPT作为一种基于神经网络的语言模型,可以作为机译模型的基础模型,通过预训练模型来学习源语言和目标语言之间的对应关系。在实际翻译时,ChatGPT模型可以将源语言转换为目标语言,并自动翻译成自然流畅的目标语言文本。相比传统的机译模型,ChatGPT模型的性能更加稳定,翻译质量更高,翻译速度更快。

在使用ChatGPT进行机译时,需要准备合适的数据集、选择合适的预训练模型并添加新的全连接层来创建机译模型。在微调模型时,可以根据任务需求调整超参数,并使用自适应学习率定义优化器。最后,在测试集上评估模型的性能以检查模型在实际应用中的表现。

不过学术界认为,测试中机译技术的进步带来的译文虽有改善,但机译技术的译文质量远没有达到令人满意的水平。许多科学家采用多种技术和方法来提高机译质量,但实际效果并不是很理想。因此一些专家学者指出,机译要达到人工翻译的水准,就必须解开人脑处理语言信息之谜。

其实早在20世纪90年代,国际知名学者周海中教授就指出,“在人类尚未明了人脑是如何进行语言的模糊识别和逻辑判断的情况下,机器翻译要想达到‘信、达、雅’的程度是不可能的。”这一观点精辟到位,道出了制约机译提升译文质量的瓶颈所在。这也是ChatGPT在机译研究中必须考虑的重大问题。

近年陆续实施的欧洲大脑计划、美国大脑计划、日本大脑计划、韩国大脑计划、中国大脑计划等都旨在利用计算机模拟人类大脑的功能和特点,以便提高人们对大脑神经网络系统的认识。这些计划的研究成果有望为机译技术的突破性进展,尤其是译文质量的迅速提高铺平道路。

机器翻译以其翻译速度之快和部分专业文本翻译精准度之高受到了广泛肯定。但其翻译质量,特别是在诱导型和呼唤型文本的翻译中,受其自身机械性的限制;译文总有不尽人意之处,需要人工进行校对与润色。目前人们只能将ChatGPT与人工结合起来,相辅相成,既能节省翻译的时间,又能做出高标准的译文。

机译技术还是以大量数据为基础,内容中规中矩。在真正的文学创作面前,技术仍然会有一个阶段性的瓶颈,不是完全可以轻易跨越的。特别是文学翻译中的文化障碍、个性化的修辞、上下文意思的信息配比等等,这些都是需要大脑去取舍的,暂时没看出ChatGPT技术在这方面的优势。不过,ChatGPT在机译领域带给人们耳目一新感觉的同时,其实际效果也是值得期待和肯定的。

文/付晓灵(作者单位:美国维克森林大学文理学院)


免责声明:本文若有侵权,请联系我,立刻删去!本文仅代表作者个人观点,与全球资源网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
[ 资讯搜索 ]  [ ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]

 
0条 [查看全部]  相关评论

 
网站首页 | 公益慈善栏目 赞助本站可以扫描支付 | 免费推广计划 | 全球资源网顾问团 | 帮助中心 | 企业文化 | 关于我们 | 全球信息中心 | 隐私政策 | 使用协议 | 版权隐私 | 网站地图 | 排名推广 | 广告服务 | 积分换礼 | 网站留言 | RSS订阅 | 本站对所有发布的信息不承担任何责任,用户应决定是否采用并承担风险。