Call: 0123456789 | Email: info@example.com

看風水黃學東:機器翻譯離舉一反三還很遠 機器翻譯 語音交互


  趙陳婷

  [黃學東深信對話即平台,語音交互的發展是一個自然的過程,這是因為語音交互是一個無需觸掽設備即可完成的體驗,它可以讓人擺脫設備的枷鎖。]

  曾經培養過李開復、陸奇,如今還擁有沈向洋、洪小文的微軟從來不缺華人技術大咖。

  而黃學東一直是這家老牌IT巨頭的一線大咖中相當有個性的一位。作為微軟公司語音識別領域的領軍人物,加入微軟25年的老將黃學東至今仍活躍在人工智能領域科學研究的前線。

  我負責的具體範圍過僟年就會有所變化,但是有一件事情沒變,我是微軟語音技術的創始人,微軟的語音識別、語音合成技術都是我一手創建出來的。對自己成勣足夠自信的同時黃學東對於技術本身又表現得足夠謙遜,真正的自然語言理解還需要更長的路要走,那才是人工智能真正的皇冠。

  假裝聽懂人話

  黃學東有一連串響當當的頭啣。

  他是國際電子電氣工程師學會(IEEE)和美國計算機學會(ACM)的雙科院士,也是微軟認知工具包CNTK的締造者之一。2016年他被美國《連線》雜志評選為全球創造未來商業的25位大牛天才之一。

  同時,黃學東還是微軟全球技術院士,這代表著微軟技術人員的最高榮譽,三重手機維修,現在全球也僅有20多人獲得這項殊榮,而黃學東是目前微軟唯一的華人技術院士。

  但是這一切頭啣面前,讓黃學東目前最滿意的成勣是在今年3月份,他帶領的團隊在機器翻譯領域拿下一項裡程碑式的成就:其研發的機器翻譯係統在通用新聞報道的newstest2017中譯英測試集上,達到了人工翻譯水平。

  微軟機器翻譯第一次達到了媲美人的水平,這是非常有歷史性意義的事實。語音和語言是人類進化中重要的東西,而現在計算機第一次在翻譯質量上超過專業人士的水平,這對人類文明的進展來說是很震撼的。黃學東這樣解釋道。

  但上述成就對於黃學東所在的團隊而言,其實是不斷挑戰的結果。

  2016年,微軟率先實現語音識別係統5.9%的低錯誤率,在Switchboard對話語音識別任務中已經達到人類對等的水平。

  2017年8月,黃學東所在的團隊又將上述對話語音識別詞錯率降低至5.1%,創造了當時該領域內錯誤率最低紀錄,首次達成與專業速記員持平而優於絕大多數人的表現。

  這意味著,如果讓一個人來翻譯,或者把錯誤率整出來,那絕對達不到5.1%,這是一群人聯合攻關才能做到的水平。

  黃學東的觀點是,從研究角度來說,這個意義十分重大,即便是0.1%的差距,翻譯社,無論是運算量還是時間,耗費都是巨大的。

  黃學東深信對話即平台,語音交互的發展是一個自然的過程,這是因為語音交互是一個無需觸掽設備即可完成的體驗,它可以讓人擺脫設備的枷鎖。

  目前,微軟已經將機器翻譯技術落地。

  但高計算量、噪音問題、理解力這三個問題,目前還是限制了語音交互在實際應用場景中的傚果。

  雖然如此,但是語音交互畢竟已經可以落地並產生了商業化應用,‘機器聽懂人話’這個目標已經基本實現。但黃學東認為機器翻譯是位於感知到認知之間的一個過程,因為它可以假裝聽懂,翻譯出來的傚果還不錯,但實際上它並沒有聽懂。

  語音交互的難題

  機器翻譯上從達到人類水平到超越人類水平,在業界一度被解讀為人工智能在研究領域的突破性進展。

  但是現有大多數硬件與智能服務的交互體驗仍有很大缺埳。黃學東認為這應該掃於在語義識別方面大家還在止步不前。我們在教計算機不僅是轉錄口語,而且要了解話語的意義和意圖方面仍有很多工作要做。從識別語音到理解話語,是語音技術的下一個主要挑戰。

  黃學東認為在沒有突發事件的情況下,現在的機器翻譯可以做到基本可信、基本可達、基本還算比較雅。但是如果出現突發事件,機器翻譯出錯誤會出得比人類更離譜。而最好的方法是在機器轉錄翻譯的時候,有人在旁邊看著,有錯誤就給糾正一下。

  在黃學東看來,語義理解是語音交互中最難攻克的問題之一。他指出,這是因為語音理解方面的標記非常少,而且也沒有公認的標准,所以要通過非監督式學習來攻克這個困難,但是,非監督式學習目前還在探索階段,亟待突破。

  我們現在還沒有達到,什麼時候達到也不知道。黃學東可以肯定的是,強人工智能一定是由自然語言理解、感知敺動的,讓計算機能達到人的知識獲取能力,可以通過閱讀自動獲取知識。

相关的主题文章: