德國人工智能研究中心(DFKI)正在支持人類語言項目,這是一項長期和大規(guī)模的歐洲研究,開發(fā)和創(chuàng)新項目,其雄心勃勃的科學目標是到2030年深度自然語言理解。
預計自然語言處理(NLP)的進展將能夠解決歐洲多語言設置的諸多挑戰(zhàn)。因此,該項目旨在成為歐盟旗艦項目,這是一項科學驅(qū)動的研究計劃,運行時間約為10年,總預算約為10億歐元。
根據(jù)歐盟網(wǎng)站,未來與新興(FET)旗艦項目匯集了大量研究機構(gòu),不能由一個委員會或單一成員國承擔。
DFKI高級研究員Georg Rehm博士鼓勵歐盟各組織為宣傳提供支持信。
“發(fā)起這種類型和范圍的人類語言項目 – 大規(guī)模和長期 – 的想法是幾年前在歐洲議會歐洲多語種和語言平等研討會上誕生的,”Rehm告訴Slator。
“那時我們剛剛發(fā)布了META-NET白皮書系列的主要發(fā)現(xiàn),即21種歐洲語言面臨數(shù)字滅絕的危險。這意味著超過20種歐洲語言,大多數(shù)揚聲器數(shù)量較少的語言,無法在線完全使用。并非所有服務都以這些語言提供,并且并非所有服務都能夠在內(nèi)部處理這些語言的內(nèi)容,“他解釋說。
不幸的結(jié)局將是我們所謂的“數(shù)字語言滅絕”
這意味著支持的語言遠遠少于使用更多發(fā)言者的語言,例如馬耳他語,立陶宛語或冰島語,它們將在線使用更大的語言,英語就是最好的例子。
“不幸的結(jié)局將是我們所謂的’數(shù)字語言滅絕’,”他進一步解釋道。
未來證明我們所有的語言
Rehm澄清說,不僅DFKI正在推動人類語??言項目,而且還有許多不同的利益相關者 – 從研究中心到大學,再到受影響語言社區(qū)的成員,翻譯公司以及越來越大的公司。
“所有這些利益相關者不僅有興趣實現(xiàn)我們的關鍵科學目標,到2030年深度自然語言理解,尤其是提供平衡的技術基礎,以便我們能夠在未來證明我們所有的語言,并確保我們可以在網(wǎng)上使用它們很多年,“他說。
到目前為止,他表示最近發(fā)布的關于歐盟項目DFKI的支持信的呼吁得到了前所未有的熱情。
“真的很棒。這些信件一直在涌入!“他說。
一個項目成為歐盟FET旗艦項目需要什么?雷姆說,需要政治意愿來推動這樣一個大型項目。布魯塞爾的政治家和行政人員需要確信,這種規(guī)模的投資對歐洲社會,歐洲工業(yè)和歐洲研究都有意義。
“根據(jù)我們于2018年2月20日提交的提案,我們正試圖進行預備項目。該準備項目的目標是與整個社區(qū)共同開發(fā)歐盟旗艦項目的關鍵組成部分:研究路線圖,治理結(jié)構(gòu),統(tǒng)一愿景,整體設置,“他說。
真的很棒。這些信件一直在涌入!
毫無疑問,這是一個長期的過程。 Rehm表示,DFKI的職責是協(xié)調(diào)這個準備項目,并確保該聯(lián)盟提供一個成熟的,經(jīng)過深思熟慮的,可持續(xù)的歐盟旗艦概念,讓整個社區(qū)贊同并支持。
雄心勃勃的科學目標
Rehm解釋說,通過NLP,研究人員可以識別命名實體,匯總文檔,并將用一種語言編寫的文本翻譯成另一種語言。但是,在一天結(jié)束時,它仍然只是簡單的處理。
“典型的NLP管道或系統(tǒng)缺乏的是對語言的真實,深刻的理解。這不是一個新概念,自然語言理解的概念已經(jīng)存在了幾十年。我們相信,我們的領域現(xiàn)在能夠成功地解決下一步,從簡單的處理到對人類語言的實際理解,“他說。
“如果我們能夠?qū)崿F(xiàn)這一突破,那么由此產(chǎn)生的語言技術將在大幅提高準確性,覆蓋范圍,穩(wěn)健性和質(zhì)量方面改變游戲規(guī)則。這就是我們想要帶來的,“他強調(diào)說。