<legend id="rlnql"></legend>
<cite id="rlnql"></cite>
      <blockquote id="rlnql"></blockquote>
      <b id="rlnql"><legend id="rlnql"></legend></b>
      <form id="rlnql"></form>

      盡管川普的走馬上任更多與“逆全球化”綁定在一起,但考慮到人類歷史“螺旋狀”上升的演化軌跡,在技術(shù)進(jìn)步和文化擴(kuò)散的雙重推動下,這個世界總體趨向互通互聯(lián)的趨勢似乎不可違——尤其當(dāng)全球化與網(wǎng)絡(luò)相遇的一瞬,不同國家之間平等便捷獲取信息,低成本地有效溝通即成一種必然。從這個意義上,全球化的最大敵人之一也許是各國千百年來夯實的語言壁壘。

      作為一門交叉學(xué)科,機(jī)器翻譯涉及到認(rèn)知科學(xué),計算機(jī),信息論,語言學(xué)等多學(xué)科,其理論路徑同樣經(jīng)歷了螺旋狀上升:從最久遠(yuǎn)的“翻譯備忘錄”到后期基于規(guī)則,基于實例的機(jī)器翻譯,再到被視為機(jī)器翻譯重要轉(zhuǎn)捩點的統(tǒng)計翻譯模型(SMT)——后者是科學(xué)家初次察覺到通過大數(shù)據(jù)消弭信息不確定性是攻克“智能”的好辦法。

      而最近兩年,機(jī)器翻譯正在擁抱另一個更重要的技術(shù)轉(zhuǎn)折點——基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯(NMT:Neural Machine Translation)。

      機(jī)器翻譯的技術(shù)路徑

      感同身受的是,無論是普通用戶還是資深譯員,無論使用WEB還是APP,都明顯察覺到近些年來的翻譯質(zhì)量有著迅猛的提升。

      問題是:為何變化如此明顯?不妨從技術(shù)路徑上拆解來看。

      直覺便知,當(dāng)人類試圖讓機(jī)器翻譯語言時,自然要對文字進(jìn)行解構(gòu),就像同心圓的關(guān)系,文章由段落構(gòu)成,段落由句子構(gòu)成,句子由短語和字構(gòu)成,而遵循從易到難,機(jī)器翻譯的理論路徑也是從后向前:從最初的逐字翻譯到基于短語的翻譯——如今,依靠于神經(jīng)網(wǎng)絡(luò),基于句子的翻譯成為可能。

      于是,按照翻譯單元的不同,大體而言,目前機(jī)器翻譯有兩種類型:其一是上文提及的統(tǒng)計翻譯模型(SMT),如你所知,互聯(lián)網(wǎng)的廣泛普及為統(tǒng)計翻譯提供了豐富的訓(xùn)練養(yǎng)料,而千禧年左右興起的基于短語的SMT更是讓機(jī)器翻譯質(zhì)量大為提高,也在很長一段時間占據(jù)機(jī)器翻譯的主流,但以短語作為翻譯單元的弊端即是,當(dāng)面對整句層面的翻譯時顯得非常生硬。

      另一種類型當(dāng)然是基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯(NMT),其翻譯路徑是所謂端到端(end-to-end),將源語句整體編碼為一個向量,再通過解碼器對其進(jìn)行解碼,理論上僅需給定源語言句子,即可通過神經(jīng)網(wǎng)絡(luò)輸出目標(biāo)語言譯文。這里不妨舉個例子,若你在百度翻譯中輸入“蘿卜青菜各有所愛”,它可以輕松輸出“Every man has his hobbyhorse”的正確譯文,而非諸如“Turnip greens his taste”的荒誕結(jié)果。也正因如此,短短兩年,NMT就在多個公開測試集上超越了作為前輩的SMT系統(tǒng)。

      而若要比較的話,整體而言,在數(shù)據(jù)訓(xùn)練比較充分的時候,NMT無疑要優(yōu)于SMT;在短句或數(shù)據(jù)量相對較小之時,SMT在處理固定搭配和習(xí)慣表達(dá)上具有優(yōu)勢。所以兩種方式談不上殊途同歸,只是在不同場景中分類而用——要知道,用戶的翻譯場景頗為多變,這要求一個優(yōu)秀的翻譯系統(tǒng)要成為集大成者。如今百度的翻譯系統(tǒng)就包含SMT,NMT,甚至更傳統(tǒng)的EBMT(基于實例的機(jī)器翻譯)。

      當(dāng)然,倘若我們談?wù)摰氖俏磥?,幾乎可以肯定,神?jīng)網(wǎng)絡(luò)技術(shù)本身的向前奔進(jìn),會讓NMT日趨成為主流(事實上,在百度中英日韓等多個系統(tǒng)中,它已是主流)——在今年8月的國際計算語言學(xué)年會上(ACL),移動端離線NMT被列為未來重要研究方向,即是為機(jī)器翻譯的未來畫了一個幾乎確定性的腳注。

      機(jī)器翻譯的跑馬圈地

      自二十世紀(jì)三十年代初法國科學(xué)家阿爾楚尼提出用機(jī)器進(jìn)行翻譯的想法至今,哪怕對人工智能的定義已幾經(jīng)翻折,機(jī)器翻譯都被長期視為人工智能的“終極目標(biāo)”之一。巨大的期許往往意味著目標(biāo)艱難,但這仍然無法阻擋這塊大蛋糕對全球頂尖科技大佬的吸引力。

      而作為翻譯技術(shù)發(fā)展的初級階段,如果在這個時候硬要拼個排名或者高下,其實并沒有太大意義,而科技界的競爭也無非就是微軟、百度、谷歌這三家而已,孰輕孰重一看便知。只不過,從“百度更懂中國”的大思路能夠看出,百度在中國乃至亞洲市場更具侵略性,和搜索之爭同理,雖然誰都打不死誰,但區(qū)域優(yōu)勢已成不爭事實。

      12月21日,從百度機(jī)器翻譯技術(shù)開放日上百度技術(shù)委員會聯(lián)席主席、自然語言處理部技術(shù)負(fù)責(zé)人吳華博士的觀點可以看出,百度其實已經(jīng)成為了翻譯技術(shù)領(lǐng)域的破繭者,他們早于谷歌一年就正式上線了基于神經(jīng)網(wǎng)絡(luò)的翻譯系統(tǒng),同時也打造了全球首個互聯(lián)網(wǎng)在線NMT系統(tǒng)以及手機(jī)端離線NMT系統(tǒng)。據(jù)悉,百度翻譯每天已有上億次訪問,支持28種語言的互譯,開方的API接口也有超過2萬家第三方接入。

      而就在前幾天,微軟發(fā)布全球首個萬能翻譯器,微軟官方表示它也可以實現(xiàn)多達(dá)100人間實時翻譯交談,并支持9種語言的語音輸入。而谷歌全球化帶來的影響無疑的巨大的,在收購科技公司的同時也在大力發(fā)展區(qū)域化優(yōu)勢,如谷歌2014年收購的Word Lens也在積極開展機(jī)器翻譯的工作,這李彥宏所說的話是一樣的道理:用人工智能打破一切邊界。

      其實,百度的現(xiàn)狀其實并不令人意外,考慮到中國經(jīng)濟(jì)在全球化中的地位,在將更多人卷入全球化的社會協(xié)作網(wǎng)絡(luò)過程中,中國對翻譯行為的仰仗無疑更迫切。而更為現(xiàn)實的是:在全球數(shù)萬億網(wǎng)頁中,80%為非中文網(wǎng)頁;去年中國出境游人數(shù)超過1.2億,前20個旅游目的地國家和地區(qū)中共使用了12種語言,尤其是中英語——這個世界上使用人數(shù)最多和使用最廣泛的兩種語言之間的翻譯,在很多人眼中是純粹的剛需。

      機(jī)器翻譯的未來

      很簡單,翻譯技術(shù)最終是要服務(wù)大眾,否則就是鏡中月、水中花。

      重要的是,技術(shù)也逐漸還原到更具體的實用場景,百度翻譯APP就通過結(jié)合OCR技術(shù)和語音技術(shù),為用戶滿足各種碎片化的翻譯需求,舉幾個例子:當(dāng)你在國外游覽時,只需將手機(jī)屏幕對準(zhǔn)外文介紹,OCR翻譯即可呈現(xiàn)翻譯結(jié)果;面對天書一般的外文菜單,百度翻譯可以迅捷地將菜單翻譯結(jié)果顯示在手機(jī)上,從此不必再在點餐時聽天由命;在國外買買買時,它也能讓你快速讀懂說明書;另外,當(dāng)遇到不認(rèn)識的實物,實物翻譯可以用中英雙語告知其名,同時伴隨著準(zhǔn)確的發(fā)音;而結(jié)合語音技術(shù)的會話翻譯,能幫助用戶與外國人無障礙交流——我甚至還看到過這樣的新聞:靖江市民警在語言不通的情況下,用百度翻譯成功救助4名俄羅斯籍船員……

      技術(shù)的福祉正在惠及每一位擔(dān)心語言關(guān)的人,而另一端,一部分人對技術(shù)的憂慮也在所難免?!拔磥砣舾赡?,我們很容易想象語言障礙會完全被打破,現(xiàn)在做同聲翻譯的人可能將來就沒有工作了?!鄙蟼€月的烏鎮(zhèn)互聯(lián)網(wǎng)大會,李彥宏為人們勾勒了未來的場景。

      機(jī)器雖然突破了固有翻譯原則的局限,但必須承認(rèn)的是,機(jī)器翻譯和真正意義上的“語言學(xué)”還關(guān)系不大,距離文人向往的“信雅達(dá)”目標(biāo)還很遙遠(yuǎn),這也意味著,機(jī)器翻譯任重道遠(yuǎn),人工翻譯可稍安勿躁。

      究其原因,在基于端到端的翻譯手法中,神經(jīng)網(wǎng)絡(luò)無法理解自己翻譯出的句子,無法對譯文給出一個合理解釋——這正是它與專業(yè)人工翻譯最本質(zhì)的差別。譬如,遵循上文提及的從后向前(從易到難)的理論路徑,讓機(jī)器理解基于“段落”甚至“篇章”的翻譯自然再好不過,這要求機(jī)器在上下文理解和連貫性上飛躍一大步。

      那么問題是:它會實現(xiàn)么?作為技術(shù)樂觀主義者,我個人答案當(dāng)然是會,一切或許只是時間問題。

      在昔日古老的歲月,人類誕生語言的原始目的,一方面是增進(jìn)本族人的內(nèi)部溝通,另一方面是制造與外族的天然隔閡。而若你相信技術(shù)的發(fā)展內(nèi)嵌在全球化的偉大浪潮中,通過技術(shù)終結(jié)千萬年來人類語言互不相通的歷史就值得期許。畢竟,讓人們聽懂彼此,這是一個太過古老的夙愿。

      相關(guān)新聞

      • 停滯的原子世界和狂奔的比特世界

        停滯的原子世界和狂奔的比特世界

        如果問10個人,大概會有9個人的回答是——對,當(dāng)然在加速! 今天的iPhone是十年前第一代運(yùn)行速度的100倍;20年前,電腦的內(nèi)容是256M,今天一臺最普通的廉價手機(jī)的內(nèi)存也至少有2G…… 然而這個答案并不準(zhǔn)確! 進(jìn)步其實只是一種錯覺,科技的飛速進(jìn)步僅局限于IT互聯(lián)網(wǎng)領(lǐng)域,換句話說這些進(jìn)步都屬于比特世界的進(jìn)步;而我們的生活除了比特世界,還有一個和每個人息息相關(guān)的原子世界,不可辯駁的現(xiàn)實是: 原子世界毫不夸張地說是在原地踏步—— 我們的汽車和幾十年前的汽車沒有本質(zhì)區(qū)別; …

        公司新聞 2019年5月28日
      • 都說行業(yè)冷,憑什么這家VR公司10個月能融到3輪?

        都說行業(yè)冷,憑什么這家VR公司10個月能融到3輪?

        導(dǎo)語:也許VR對許多人來說還只是一個小眾的、新奇的概念,但在科技企業(yè)林立的深圳,這一產(chǎn)業(yè)發(fā)展的速度已經(jīng)遠(yuǎn)遠(yuǎn)超過了人們的想象。 在各種琳瑯滿目的“深圳制造”的VR產(chǎn)品之中,在大大小小近100家VR企業(yè)里,有這么一家成立僅一年的初創(chuàng)公司,憑借過硬的技術(shù)基因連獲三輪融資,最新的產(chǎn)品更是在今年CES上一舉奪得最佳創(chuàng)新大獎。 它就是深圳看到科技,一家專注于360度全景VR相機(jī)的科技公司。近日VR陀螺通過與聯(lián)合創(chuàng)始人兼COO蔡樹煥先生的訪談,揭開了這個在行業(yè)內(nèi)如此“低調(diào)”,在技術(shù)上卻十分“高調(diào)”的初創(chuàng)企業(yè)的…

        公司新聞 2016年12月22日
      • 中國民營企業(yè)500強(qiáng)發(fā)布,華為超聯(lián)想奪第一

        中國民營企業(yè)500強(qiáng)發(fā)布,華為超聯(lián)想奪第一

        億歐8月25日消息:今天上午,2016中國民營企業(yè)500強(qiáng)發(fā)布會在北京召開。榜單顯示,華為控股有限公司以營收總額3590.09億排名第一,蘇寧控股、山東魏橋集團(tuán)分別以3502.88億、3332.38億分列二三位。聯(lián)想、正威國際、大連萬達(dá)、中國華信、恒力集團(tuán)、江蘇沙鋼、萬科,分列四至十位。 此外,全國工商聯(lián)經(jīng)濟(jì)部部長譚林發(fā)布了《2016中國民營企業(yè)500強(qiáng)發(fā)布報告》。報告顯示,2015年,民營企業(yè)500強(qiáng)入圍門檻達(dá)101.75億元,比上年的95.09億元凈增6.66億元。2015年,民營企業(yè)500…

        行業(yè)動態(tài) 2016年12月22日
      • 被華為反超,一季度iPhone在全球智能手機(jī)市場份額降至第三

        被華為反超,一季度iPhone在全球智能手機(jī)市場份額降至第三

        本周二,來自市場研究機(jī)構(gòu)Gartner的研究報告再度向人們確認(rèn)了一件事:蘋果在全球智能手機(jī)市場上的位置已被華為所取代。 Gartner的報告顯示,2019年第一季度,iPhone在全球智能手機(jī)市場的份額已降至11.9%,同比下降2.2%,銷量也從2018年第一季度的5410萬臺下跌至約4460萬臺。 對此,該機(jī)構(gòu)研究主管Anshul Gupta在報告中寫道,iPhone在各個市場上的降價策略雖然提振了需求,但仍不足以恢復(fù)第一季度的增長: “蘋果面臨著更長的更換周期,因為用戶很難看到有足夠的價值效…

        媒體報道 2019年5月29日
      • 揭2016熱銷洋貨 網(wǎng)易考拉圣誕大促主打榜單經(jīng)濟(jì)

        揭2016熱銷洋貨 網(wǎng)易考拉圣誕大促主打榜單經(jīng)濟(jì)

        從雙11到雙12,再從黑五到圣誕,2016年年末電商大戰(zhàn)持續(xù)上演。作為唯一參加雙11、黑五、雙12的最大跨境電商平臺網(wǎng)易考拉海購,日前也宣布在12月23日-25日啟動圣誕跨年季大促,不打價格戰(zhàn)而是主打榜單經(jīng)濟(jì),將發(fā)布2016年網(wǎng)易考拉海購年終大賞,盤點揭秘2016全年值得買買買的洋貨,滿足用戶更專業(yè)、更個性化的海淘需求。 主打年終大賞 年終大賞是本次網(wǎng)易考拉海購圣誕跨年大促的最大亮點。在大數(shù)據(jù)技術(shù)支持下,網(wǎng)易考拉海購?fù)ㄟ^挖掘全年銷售數(shù)據(jù),推出好評風(fēng)云榜、海淘新奇特、黑馬進(jìn)擊榜 、三石口碑榜、吐血…

        公司新聞 2016年12月22日
      • 陳冷西:規(guī)范網(wǎng)絡(luò)傳播勢在必行

        國家新聞出版廣電總局日前發(fā)布《關(guān)于加強(qiáng)微博、微信等網(wǎng)絡(luò)社交平臺傳播視聽節(jié)目管理的通知》要求,利用微博、微信等各類社交應(yīng)用開展互聯(lián)網(wǎng)視聽節(jié)目服務(wù)的網(wǎng)絡(luò)平臺,應(yīng)當(dāng)取得《信息網(wǎng)絡(luò)傳播視聽節(jié)目許可證》等法律法規(guī)規(guī)定的相關(guān)資質(zhì);微博、微信等網(wǎng)絡(luò)社交平臺不得轉(zhuǎn)發(fā)網(wǎng)民上傳的自制時政類視聽新聞節(jié)目。 此前,文化部印發(fā)了《網(wǎng)絡(luò)表演經(jīng)營活動管理辦法》,直接對準(zhǔn)網(wǎng)絡(luò)直播平臺,規(guī)定直播平臺須有許可證,主播要實名。兩部門相繼出臺規(guī)定,對網(wǎng)絡(luò)視聽類節(jié)目和直播平臺加強(qiáng)管理、明確監(jiān)管辦法,直指網(wǎng)絡(luò)動態(tài)傳播的混亂局面。 伴隨網(wǎng)絡(luò)…

        媒體報道 2016年12月22日
      聯(lián)系我們

      聯(lián)系我們

      130 5818 6932

      在線咨詢:點擊這里給我發(fā)消息3002788751

      郵件:[email protected]

      工作時間:周一至周六,9:00-18:30,其他時間段請?zhí)砑游⑿呕虬l(fā)送郵件

      關(guān)注微信
      關(guān)注微信
      分享本頁
      返回頂部
      <legend id="rlnql"></legend>
      <cite id="rlnql"></cite>
        <blockquote id="rlnql"></blockquote>
        <b id="rlnql"><legend id="rlnql"></legend></b>
        <form id="rlnql"></form>
        欧美色图| 啪啪啪视频免费观看 | 日日骚网站 | 无码成人影院在线播放l | 精品少妇无码九九热一区视频 |