(文章來源:教育新聞網(wǎng))
通信技術(shù)的進步對各種行業(yè)都產(chǎn)生了重大影響,但也許沒有比教育更大的影響了。現(xiàn)在,來自世界各地的任何人都可以現(xiàn)場收聽諾貝爾獎獲得者的演講,也可以通過互聯(lián)網(wǎng)訪問最知名的大學(xué)而獲得學(xué)分。但是,如果聽眾聽不懂講師的語言,將從在線觀看和收聽中獲得的可能的信息丟失。為了解決這個問題,日本奈良科學(xué)技術(shù)學(xué)院(NAIST)的科學(xué)家在日本信息處理學(xué)會(IPSJ SIG-)的自然語言處理特別興趣小組第240次會議上提出了一種新的機器學(xué)習(xí)解決方案。 NL)。
機器翻譯系統(tǒng)使某人以以前從未聽說過的語言向酒店詢問路線變得非常簡單。有時,系統(tǒng)可能會犯出有趣和無辜的錯誤,但總體上實現(xiàn)了連貫的交流,至少對于短時間的交流(通常只有一兩個句子)。如果演示文稿可能持續(xù)一個小時以上,例如學(xué)術(shù)講座,那么它們的魯棒性就差很多。
主持這項研究的NAIST教授中村聰解釋說:“ NAIST有20%的外國學(xué)生,盡管英語課程的數(shù)量在增加,但這些學(xué)生的選擇受到他們?nèi)照Z能力的限制。”Nakamura的研究小組從NAIST獲得了46.5個小時的存檔演講視頻及其轉(zhuǎn)錄和英語翻譯,并開發(fā)了基于深度學(xué)習(xí)的系統(tǒng)來轉(zhuǎn)錄日語演講語音并將其翻譯成英語。在觀看視頻時,用戶會看到與講師的口語相匹配的日語和英語字幕。
有人可能希望理想的輸出是可以通過現(xiàn)場演示進行的同步翻譯。但是,實時翻譯會限制處理時間,從而限制準確性。
他說:“由于我們將帶字幕的視頻保存在檔案中,因此,通過創(chuàng)建處理時間更長的字幕,我們發(fā)現(xiàn)了更好的翻譯。”用于評估的存檔素材包括機器人技術(shù),語音處理和軟件工程的演講。有趣的是,語音識別中的單詞錯誤率與講師語音中的不愉快程度相關(guān)。錯誤率不同的另一個因素是不停頓說話的時間長度。用于訓(xùn)練的語料仍然不足,應(yīng)進一步發(fā)展以進一步改進。
他繼續(xù)說:“日本希望增加其國際學(xué)生,而NAIST則有很大的機會成為這項工作的領(lǐng)導(dǎo)者。我們的項目不僅將改善機器翻譯,還將為日本帶來光明的頭腦。”
(責(zé)任編輯:fqj)
-
通信技術(shù)
+關(guān)注
關(guān)注
20文章
1135瀏覽量
92288 -
翻譯
+關(guān)注
關(guān)注
0文章
47瀏覽量
10795
發(fā)布評論請先 登錄
相關(guān)推薦
評論