人工智能自動(dòng)化如何加速語言質(zhì)量評(píng)估
在2024年6月的SlatorCon Remote活動(dòng)中,Phrase的首席執(zhí)行官Georg Ell博士與首席產(chǎn)品官Simone Bohnenberger-Rich博士共同向與會(huì)者深入介紹了在本地化語言質(zhì)量評(píng)估(LQA)領(lǐng)域,人工智能自動(dòng)化所帶來的顯著成果。他們?cè)敿?xì)回答了關(guān)于如何將人工智能有效集成至各類產(chǎn)品,以及通過自動(dòng)化能夠?qū)崿F(xiàn)的具體優(yōu)勢(shì)等問題。
為了深入探討這一主題,Slator向Ell博士詢問了Phrase在幫助客戶應(yīng)對(duì)內(nèi)容生成和本地化方面,尤其是在大規(guī)模操作中的變化時(shí)所采取的策略。
Ell博士解釋說,目前,內(nèi)容生成方式的演變以及人工智能在推動(dòng)這些變化中所起的作用,已經(jīng)引起了人們的廣泛關(guān)注。他特別指出,這些變化包括在互聯(lián)網(wǎng)上實(shí)時(shí)傳輸?shù)暮A繑?shù)據(jù),以及為每個(gè)用戶定制的高度個(gè)性化內(nèi)容。據(jù)他估計(jì),大約有20%的本地化客戶已經(jīng)開始采用自動(dòng)化技術(shù),這是因?yàn)樗麄兤惹行枰獞?yīng)對(duì)不斷增長(zhǎng)的內(nèi)容量,并最終實(shí)現(xiàn)超自動(dòng)化。
在談到大規(guī)模內(nèi)容處理時(shí),Bohnenberger-Rich博士提到,當(dāng)前關(guān)于人工智能的炒作正在改變?nèi)藗儗?duì)本地化成本的預(yù)期,使得人們期望能夠以更低的成本完成更多的工作。她警告說:“有時(shí),我們會(huì)看到本地化團(tuán)隊(duì)的預(yù)算被削減,因?yàn)樗麄冨e(cuò)誤地認(rèn)為生成式人工智能會(huì)自然而然地降低成本。這就是我所說的‘盲目熱情’?!?
她進(jìn)一步指出,團(tuán)隊(duì)最終會(huì)認(rèn)識(shí)到,要實(shí)現(xiàn)真正的自動(dòng)化、降低成本并有效解決實(shí)際問題,僅僅依靠生成式人工智能和大型語言模型(LLM)是不夠的。
Phrase的首席產(chǎn)品官闡釋了公司如何“基于工作流組件和高級(jí)分析組件的功能,來實(shí)施大型語言模型和人工智能,從而創(chuàng)造最大的價(jià)值。這將為用戶提供大量關(guān)于他們能做什么以及何時(shí)進(jìn)行操作的智能信息。”
針對(duì)本地化過程中質(zhì)量保證(QA)環(huán)節(jié)的復(fù)雜性,Bohnenberger-Rich博士還詳細(xì)介紹了Phrase在QA方面的關(guān)鍵創(chuàng)新,這些創(chuàng)新有助于簡(jiǎn)化流程并減少不必要的人工干預(yù)。
她強(qiáng)調(diào),要改變決定人工干預(yù)QA的方式,就需要從對(duì)主題或語言對(duì)難度的主觀假設(shè),轉(zhuǎn)變?yōu)閷?duì)質(zhì)量水平的自動(dòng)化和系統(tǒng)化評(píng)估。她解釋說,Phrase的質(zhì)量性能評(píng)分(Phrase QPS)正是能夠完成這一任務(wù)的重要工具之一。
此外,她還談到了確保自動(dòng)化QA流程在不同規(guī)模上都能保持一致性表現(xiàn)的重要性。她解釋說,自動(dòng)化這樣一個(gè)高度主觀的過程,需要通過嚴(yán)格的一致性來消除主觀性。同時(shí),產(chǎn)品還需要透明地展示低質(zhì)量和高質(zhì)量的標(biāo)準(zhǔn),以便客戶能夠理解人工智能做出特定決策的原因。
在談到語言服務(wù)提供商(LSP)的機(jī)遇時(shí),Ell博士指出,翻譯公司可以通過實(shí)施自動(dòng)化來增加收入,并幫助客戶實(shí)現(xiàn)更多內(nèi)容的本地化。他認(rèn)為,LSP可以作為技術(shù)合作伙伴,因?yàn)樵S多買家在決定人工智能本地化自動(dòng)化的方向時(shí)缺乏必要的知識(shí)。
Ell博士強(qiáng)調(diào),需要將語言行業(yè)視為一個(gè)生態(tài)系統(tǒng)的一部分,例如Phrase這樣的語言技術(shù)公司。在這個(gè)生態(tài)系統(tǒng)中,LSP所擁有的數(shù)據(jù)和專家資源可以幫助改進(jìn)LLM。他認(rèn)為,“將這兩者結(jié)合在一起是解鎖大型語言模型價(jià)值的關(guān)鍵,因?yàn)槟阈枰獙⑺鼈兌ㄖ频教囟ǖ挠美??!?
他還補(bǔ)充說,在處理大量數(shù)據(jù)時(shí),某些商業(yè)模式將需要進(jìn)行調(diào)整,以適應(yīng)在更短時(shí)間內(nèi)完成更多工作的需求,包括確定何時(shí)進(jìn)行人工干預(yù)以進(jìn)行質(zhì)量檢查。同時(shí),他表示,LSP將有多種方式來實(shí)現(xiàn)這些變革。
最后,在談到順序QA循環(huán)的終結(jié)時(shí),Bohnenberger-Rich博士解釋了如何在眾多不同的QA循環(huán)中實(shí)現(xiàn)多個(gè)QA類別的自動(dòng)化。她提到,在利用高質(zhì)量翻譯記憶庫等資源來訓(xùn)練和微調(diào)LLM時(shí),人們已經(jīng)認(rèn)識(shí)到,某些QA類別是可以信賴地實(shí)現(xiàn)適當(dāng)自動(dòng)化的,但這完全取決于具體的用例。
她補(bǔ)充說,在考慮到每個(gè)用例的具體需求時(shí),QA過程的部分環(huán)節(jié)將實(shí)現(xiàn)不同程度的自動(dòng)化。她將這一過程描述為從用例出發(fā)——即需要解決的問題——然后反向工作,以在流程中分配自動(dòng)化步驟。
她總結(jié)道:“客戶可以根據(jù)他們的用例和需求,來決定他們希望在速度、可擴(kuò)展性和自動(dòng)化方面取得多大的進(jìn)展,以及他們更傾向于為哪種類型的資產(chǎn)設(shè)置異常循環(huán)。”
在Phrase,團(tuán)隊(duì)已經(jīng)認(rèn)真考慮了客戶反饋,并對(duì)QPS模型進(jìn)行了微調(diào),Ell博士補(bǔ)充道。在他看來,理想情況下——也許就在不久的將來——一個(gè)自動(dòng)化的QA系統(tǒng)將能夠?yàn)榭蛻籼峁└嗟倪x擇權(quán),使他們能夠根據(jù)具體的用例和內(nèi)容類型來選擇更加嚴(yán)格或更加靈活的QA方式。