91在线资源一区二区三区,人妻无码三区四区视频在线,久久无码碰碰人妻精品,床上色APP下载免费版

中文
搜索

如何提升大語(yǔ)言模型的譯后編輯能力

發(fā)布時(shí)間: 2024年05月31日瀏覽量:
馬里蘭大學(xué)的Dayeon Ki和Marine Carpuat在他們的研究中指出,通過(guò)外部質(zhì)量反饋指導(dǎo)大語(yǔ)言模型(LLM)可以提升機(jī)器翻譯譯后編輯(MTPE)的能力。



研究方法

外部反饋的應(yīng)用:不依賴(lài)模型自我生成的反饋,研究者使用外部反饋來(lái)指導(dǎo)LLM改進(jìn)翻譯。


開(kāi)放模型的使用:研究中使用了開(kāi)源的LLaMA-2模型,而不是像GPT-3.5或PaLM-2等這樣的閉源模型。


并且研究者考慮到了兩種指導(dǎo)語(yǔ)言模型編輯機(jī)器翻譯錯(cuò)誤注釋的策略:提示和用指令微調(diào)。首先,他們使用不同形式的反饋,以不同的粒度提示LLaMA-2模型。



研究采用了三種反饋形式:

一般性反饋:不提供具體細(xì)節(jié),沒(méi)有具體指令,只是提示模型改進(jìn)初始翻譯。


基于評(píng)分的反饋:提供一個(gè)從0到100的單一MQM評(píng)分,反映初始翻譯的總體質(zhì)量。


細(xì)粒度反饋:提供具體且詳細(xì)的錯(cuò)誤注釋?zhuān)赡馨ㄥe(cuò)誤范圍、錯(cuò)誤類(lèi)型和嚴(yán)重程度。這種反饋可以由人工或者自動(dòng)注釋工具進(jìn)行。




研究發(fā)現(xiàn)

在中英、英德和英俄三個(gè)語(yǔ)言對(duì)上,研究發(fā)現(xiàn)使用反饋提示LLM進(jìn)行翻譯編輯可以持續(xù)提高機(jī)器翻譯和譯后編輯質(zhì)量。盡管細(xì)粒度反饋在改進(jìn)輸出方面作用有限,但接下來(lái)他們用細(xì)粒度的錯(cuò)誤注釋對(duì)LLaMA-2模型進(jìn)行了微調(diào),研究者發(fā)現(xiàn)微調(diào)帶來(lái)了“額外的性能提升”。不僅如此,細(xì)調(diào)后的模型不僅能修復(fù)特定錯(cuò)誤,還能增強(qiáng)目標(biāo)語(yǔ)言的自然性。



未來(lái)展望

通過(guò)這些結(jié)果,研究者發(fā)現(xiàn):編輯后的MT輸出不需要最大的專(zhuān)有LLM模型,可以用較小的開(kāi)源模型來(lái)完成。他們計(jì)劃進(jìn)一步探索如何創(chuàng)建一個(gè)可以自動(dòng)評(píng)估任何MT輸入的工作流程,并決定是否有必要進(jìn)行后期編輯以及如何進(jìn)行后期編輯,以及確定使用最合適的反饋機(jī)制。此外,他們還希望進(jìn)一步探索如何最大限度地減少對(duì)人工注釋的依賴(lài),因?yàn)椤按笠?guī)模獲取人工注釋的成本很高”。



研究者計(jì)劃進(jìn)一步探索創(chuàng)建一個(gè)自動(dòng)評(píng)估MT輸入并決定是否需要后編輯的工作流程,同時(shí)尋找最合適的反饋機(jī)制以盡可能減少對(duì)人工注釋的依賴(lài)。


本文來(lái)自slator,由新宇智慧編譯,有刪減。

相關(guān)新聞