单机麻将游戏下载

從“能聽會說”到“能理解會思考”——

智能語音引領人機交互新模式

  邊錄音邊自動轉寫成文字的智能錄音筆,支持中文與58種外語互譯的新一代翻譯機、模仿不同人說話的虛擬主播、供開發者使用的語音開放平臺……在科大訊飛股份有限公司北京總部的人工智能體驗中心,眾多人工智能與語音融合的前沿技術項目令記者大開眼界。

  在即將到來的萬物互聯時代,語音作為人類最自然、最便捷的溝通方式,將會成為所有設備和產品至關重要的入口。業界普遍認為,未來的人機交互將以語音為主、鍵盤和觸摸為輔。

  2017年11月,科技部明確依托科大訊飛建設智能語音國家新一代人工智能開放創新平臺。近年來,隨著智能語音應用場景和手段不斷豐富,國內眾多技術廠商在語音合成、語音識別、自然語言理解等人工智能核心技術領域持續發力。有理由相信,智能語音技術將給人們生活帶來更為深刻的改變。

  語音識別:1小時錄音5分鐘成稿

工作人員在演示可用于大型會議翻譯的訊飛聽見智能會議系統,說一段話,屏幕上同時顯示出中文和英語譯文。記者 姜永斌 攝

  提起科大訊飛,很多人會想到其主打語音輸入特色的“訊飛輸入法”。這款早在2010年就推出的軟件,版本號已經到了第9代。語音輸入速度達到1分鐘400字,并支持多種方言,準確率超過98%。

  在科大訊飛人工智能體驗中心,工作人員安琪向記者演示了包括訊飛輸入法、訊飛聽見、訊飛有聲等在內的多個軟硬件產品。

  “現在我們看到的就是一個離線轉寫設備,叫訊飛聽見智能會議系統,是全球第一款中文語音實時轉寫和多語種實時翻譯的系統……”安琪說了一段話,系統立即在屏幕上輸出準確的中文和翻譯后的英文。

  據介紹,今年全國兩會期間,代表委員們在小組討論中的發言被這套系統“滴水不漏”地記錄下來。以前的小組討論,需配兩三名工作人員,會后重聽錄音是常態。有了“訊飛聽見”,只需配一名工作人員,會后半個小時就能得到準確的會議記錄。

  語音識別就好比“機器的聽覺系統”,能夠把語音信號轉變為相應的文本或命令。安琪介紹,隨著深度學習技術快速發展,科大訊飛在語音識別任務中率先實現規模應用。2015年,在公證人員的見證下,科大訊飛機器語音轉寫準確率首次超過速記員。針對于噪聲環境下語音識別的挑戰,科大訊飛在國際最權威的多通道語音分離和英文識別大賽(2016年CHiME-4和2018年CHiME-5)中,連續兩屆所有場景下均取得了世界第一。

  另一款能快速轉寫錄音的小型設備吸引了記者的注意,這是今年5月新推出的訊飛智能錄音筆。

  “在研發之初,我們經過調研發現,81%的傳統錄音筆用戶真正需要的不是錄音,而是錄音整理出的文字。像記者采訪、會議記錄這些場景,錄完音后都需要及時將文字內容快速整理出。”安琪說,訊飛智能錄音筆在聯網狀態下,1小時的錄音出稿只需5分鐘,中文普通話識別準確率高達98%,真正打通了從錄音到轉寫再到分享以及后端查找編輯的全鏈條服務。

  智能音箱是如今語音識別技術的熱門應用。市場研究機構最新數據顯示,中國已成為全球最大的智能音箱市場,僅今年第一季度銷量就達到1060萬臺。

  通常情況下,每次對智能音箱下指令前,都需要提關鍵詞來喚醒,顯得“不夠智能”。而科大訊飛推出的MORFEI麥克風,內置了AIUI全雙工語音交互解決方案,可以實現一次喚醒、連續問答。其遠場語音識別技術,更是能在5米距離下達到95%以上的喚醒率、93%的識別率。

  同樣受益的還有汽車領域。通過融合語音、視覺等感知技術,分析駕駛行為數據,整合優質內容資源,科大訊飛推出的飛魚智行智能車載交互系統,將語音增強、自然語言理解等技術應用于汽車,并與各場景服務深度結合。

  語音合成:10句話復刻你的聲音

科大訊飛MORFEI麥克風產品原型,搭載4+4雙環結構麥克風,可實現遠場空間全方位拾音。

  “大家好,我是全球首個人工智能多語種虛擬主播小晴。”“Now I will broadcast for you in English.(現在我將用英語為您播報)”流利自然的語言表達、落落大方的神態動作、精準對應的口唇表情,如果不經提醒,記者還真看不出大屏幕中“小晴”的形象和聲音是人工智能合成的。

  據介紹,小晴可以用漢語、英語、日語、韓語等多語種實時播報,在5月底天津召開的第三屆世界智能大會等多個重要會議都“露過臉”。

  虛擬主播背后的技術是語音合成,即將文字變成語音,讓機器“開口說話”。實際應用中,只需將文稿導入虛擬主播系統,就能自動生成新聞播報的視頻,播報的語速、停頓、聲音模板等均可調控,不受人員情緒狀態的影響。

  “語音合成的技術路線主要分為兩類,基于單元挑選的波形拼接語音合成和基于深度學習的參數生成語音合成。”安琪介紹,2018年7月,科大訊飛在國際權威英文語音合成比賽Blizzard Challenge中連續13年蟬聯世界第一,是中英文語音合成自然度指標唯一超過真人說話水平的公司,領先優勢明顯。

  目前,語音合成技術已經在金融、電信、政府部門的自動應答呼叫中心,天氣、交通電話信息查詢,汽車導航以及文本閱讀等方面得到廣泛的應用,但科大訊飛沒有止步于此。2018年1月推出的央視紀錄片《創新中國》,全程利用科大訊飛語音合成技術配音,再現了已故著名配音家李易的聲音。

  沒錯,語音合成可以模仿真人的聲音——只需錄制10句話樣本,大約5分鐘時間,訊飛留聲的深度學習模型就可以訓練出用戶的完整音庫,從而將任意文本轉換為用戶的聲音。

  記者打開“訊飛留聲Lite”微信小程序,體驗了一把“分身特技”。輸出的聲音聽起來不僅做到音色高保真還原,朗讀的語氣、語調、情感也堪比真人。

  在創新技術加持下,偏遠山區的留守兒童、異地戀的情侶、子女在外打拼的空巢老人……這些缺失陪伴的人群,都可以在生活中收獲多一分溫暖。

  認知智能:讓機器能理解會思考

訊飛有聲系統可自動朗讀新聞和文本,支持不同類型聲音。記者 姜永斌 攝

  眾所周知,人工智能的發展經歷了運算智能、感知智能、認知智能三個階段。運算智能,即快速計算和記憶存儲能力;感知智能,即視覺、聽覺、觸覺等感知能力;認知智能,就是讓機器具備學習推理和決策的能力。

  “當我們掌握了語音和語言工具,我們就找到了一把通往認知智能的鑰匙。”科大訊飛輪值總裁胡郁表示,能“聽”、會“說”之后,智能語音將進化為“能理解會思考”。

  如今,國內許多出租車司機都能用手機上的翻譯軟件,輕松和外國人溝通;中國游客借助智能翻譯設備,也可以輕松搞定國外道路路牌、餐館菜單和超市購物;在不少國際會議上,機器翻譯干脆直接扮演現場同聲傳譯角色……安琪告訴記者,機器翻譯近年來大幅進步的原因,在于新興的神經機器翻譯技術(NMT)取代了以統計模型為基礎的統計機器翻譯技術(SMT)。

  據介紹,神經機器翻譯的“神經元”可以學習和收集信息,模仿人類大腦的神經元建立聯系。它克服了傳統方法將句子分割為不同片段進行翻譯的缺點,充分利用上下文信息,對句子進行整體編碼和解碼,從而生成更為流暢的譯文。

  2018年11月,科大訊飛的機器翻譯系統首次在CATTI全國翻譯專業資格(水平)技術能力測試中達到“英語二級”專業資格標準。

  其在今年5月推出的訊飛翻譯機3.0,支持全球近200個國家和地區語言互譯,以及拍照翻譯、方言翻譯,同時首創了自進化離線翻譯引擎,中英離線翻譯準確率95%,效果達到大學英語六級水平,而在線翻譯準確率98%,達到英語專業八級水平。

  “盡管機器翻譯技術在語料豐富的語言和用戶相對配合的使用環境下達到可用性門檻,但由于語言本身的復雜性,機器翻譯還有很長的路要走。”安琪表示。

  開放平臺:賦能百萬開發者

  2017年11月,科技部明確依托科大訊飛建設智能語音國家新一代人工智能開放創新平臺。作為“國家隊”的一員,科大訊飛做了哪些努力?

  “人工智能要有看得見、摸得著的真實應用案例,能夠基于典型應用場景自我進化。”科大訊飛董事長劉慶峰表示,科大訊飛面向國內外企業、中小創業團隊和個人開發者發布智能交互技術服務平臺“訊飛開放平臺”,以“云+端”方式提供語音合成與識別、語義理解、人機交互等相關的技術服務和垂直場景的解決方案,持續構建人工智能生態體系,“讓每一個人都擁有改變世界的力量”。

  科大訊飛消費者事業群副總裁、訊飛開放平臺負責人于繼棟告訴記者,隨著核心技術的提升,這一平臺的能力也在不斷擴展,目前已累計提供聲紋識別、語音合成、人臉認證等近200項能力,不斷降低創新門檻,讓開發者更快地開發智能產品,獲得更好的創業平臺。

  截至今年6月底,訊飛開放平臺上已經匯聚超過103萬開發者團隊,開發的總應用數超過65萬,日均交互次數約47億次。

  1024全球開發者節、iFLYTEK AI開發者大賽、首個人工智能技術與應用知識在線學習平臺“AI大學”……科大訊飛依托其業務數據和業務場景搭建多個活動平臺,讓更多人通過云端語音操作系統iFLYOS、全鏈路物聯網開放平臺iFLYIoT等實現人工智能開發夢想,為人工智能產業培育人才。

  目前,科大訊飛通過平臺賦能方式,已經深入教育、醫療、消費者、客服、汽車等多個行業“賽道”。

  “人工智能時代的競爭不是單個企業的競爭,而是一個產業鏈對一個產業鏈的競爭、一個體系對一個體系的競爭,是生態的競爭。”劉慶峰說,唯有生態生生不息,下一步科大訊飛要把現在的主賽道、把現有的資源做透做扎實,開放更多的賽道,助力人工智能生態建設。(記者 姜永斌)

单机麻将游戏下载 河北快三近1ooo期 辽宁12选五技巧 云南快乐十分前三组走势图 德甲球队队标 江苏时时 山西怏乐十分开奖结果查询 六开彩白小姐结果 老时时彩手机走势图 吉林快三今日预测 重庆时时走趋图