正如我們在上一篇文章中提到的,清理我們最大和最老的一個客戶機的翻譯內存(TM)是一項需要使用Xbench和隨后的報告的任務,我們將其導入到Excel電子表格中,最后選擇Olifant來編輯TM。TM有數(shù)千個片段,Xbench報告了超過16000個不一致。這是一項需要很多小時的工作,但我們成功了,我們會告訴你怎么做。
我們的excel電子表格在眼前,tm顯示在olifant中,是時候統(tǒng)一不一致了。由于執(zhí)行任務的人對客戶非常了解,在大多數(shù)情況下,他知道什么是最好的選擇,但每當出現(xiàn)疑問時,他就能夠與負責項目的經(jīng)理進行協(xié)商,而經(jīng)理又反過來與客戶進行協(xié)商。
要在翻譯記憶庫內存中輸入更改,只需在olifant中執(zhí)行“find and replace”(ctrl+h),在相應的框中粘貼“non-preferred”和“preferred”版本(只是給它們命名,因為并不總是有不正確的選項),然后進行適當?shù)姆峙?。更換。盡管有替代一切的選擇,但在這種情況下,它并不是一種能夠提供很大信心的實現(xiàn)更改的方法。有時,需要修改的部分由兩個或三個單詞組成,這些單詞也作為句子的一部分出現(xiàn)在另一個實例中,如果不分析每個實例而替換所有內容,可能會導致輸入錯誤。
與幾乎所有程序一樣,olifant還提供了匹配大寫字母、匹配整個單詞和使用正則表達式的選項。最后一個選項在查看圖表時非常有用。由于客戶在技術行業(yè)工作,其許多文本都充滿了數(shù)字:尺寸、數(shù)量、容量等。
同時,由于格式問題,每個數(shù)字都位于標記之間是很常見的,這使得很難區(qū)分哪些數(shù)字對應于作為標記一部分的數(shù)字。為了解決這些問題,我們在it團隊的幫助下使用正則表達式。
因此,由于項目經(jīng)理、語言學家、IT部門和客戶之間的合作,我們成功地完成了清理TM的任務,正如我們之前所說的,這項任務應該不時地完成,以避免用過時的片段填充TM。