掘金五千億市場!語音交互技術已立于智能家居風口之上
來源:海曼科技  發布時間:2018-04-09  點擊量:

掘金五千億市場!語音交互技術已立于智能家居風口之上

想象着,當你下班回到家,輕輕地對門說聲“我回來啦”,在接收到你信息一瞬間,門不僅自動打開,并在短時間内開啟了空調和電視。這種感覺是不是很棒!

在很多國外科幻大片所描述的未來生活中,使用語音方式來操控家電的炫酷場景也是無處不在。在《鋼鐵俠》系列電影中,男主角回到家以後,說聲想喝咖啡,咖啡機便開始沖咖啡,這種生活真是令人羨慕。随着語音交互技術的不斷成熟,未來電影中的畫面将會很快變成現實喲!

語音交互與智能家居

數據顯示,2018年,中國智能家居規模将達到1800億元,到2020年,智能家居市場規模将達到3576億元。分析師預測,2021年全球智能家居市場規模将達5000多億元。

在汽車及互聯網領域,語音交互功能已經很普及。福特的SYNC系統專為手機和數字媒體播放器配備的福特車載多媒體通信娛樂系統,是目前車載系統中采用語音交互技術的成功的案例,已經廣泛應用在福特多個系列汽車中。互聯網巨頭蘋果在其iPhone 4S中推出智能語音助理應用Siri後,Google公司也在其安卓智能手機操作系統中推出了GoogleNow智能語音搜索及問答服務,微軟公司也将語音技術應用于WindowsPhone。

在智能家居領域,國外的IT巨頭已先後以智能家庭産品與語音相結合的方式進入智能家庭領域:谷歌收購NEST布局智能家庭,不斷強化Google Now的語音入口;蘋果HomeKit智能家居平台與Siri也不斷加強融合;微軟也發布了語音助手Cortana(小娜),為它在智能家庭領域擴展交互入口。

在國内,早于2014年8月,語音巨頭科大訊飛就宣布進軍智能家庭市場,并發布了智能語音助手靈犀3.0來操控智能家居設備,這些設備都需要事先和靈犀3.0對接,便可以在靈犀App中搜索到設備,然後進行語音操控。目前支持的設備已經有不少,包括了電視、咖啡機、電燈、空調、熱水器等。

随着國内外巨頭們對語音交互領域投入的增加,語音核心技術正逐步成熟,曾經的技術瓶頸亦在慢慢被突破。這其中語音識别技術是語音交互的基礎與核心,“語音識别”技術相當于給計算機系統安裝上“耳朵”,使其具備“能聽”的功能。該技術經過語音信号處理、語音特征處理、模型訓練及解碼引擎等複雜步驟,使機器最終能夠将語音中的内容、說話人、語種等信息識别出來。

掘金五千億市場!語音交互技術已立于智能家居風口之上

主流的語音識别系統框架圖

語音交互的技術壁壘在哪裡?

前文中說到了語音交互技術在智能家居領域的運用,作為主流人機交互方式之一,語音交互方式将人們的雙手從觸摸屏解放出來,減少人們在數據輸入上花費的時間。但語音交互并不适用于所有場景,目前,智能家居領域,語音交互還存在以下幾個問題:

掘金五千億市場!語音交互技術已立于智能家居風口之上

一張圖看懂語音交互

遠場及噪音幹擾下識别準确率有待提升及端點檢測中的降噪處理技術。這也被稱為“雞尾酒會問題”,寓意在嘈雜的雞尾酒會上遠距離準确識别某一個特定的聲音。當前該問題解決方式是多通道信号處理,例如麥克風陣列的變換。相關落地技術包括思必馳&亞馬遜Echo“環形6+1”麥克風陣列, 以及悠響聲學Mic随意安裝語音拾取技術。

端點檢測、特征提取和解碼過程中模型優化。如果放下現有問題的假設與相關設計,而是交托給機器,讓其從訓練數據中學到的轉換模型來把語音轉成文字序列,可能更簡單高效。

當前主要用端到端CTC模型+Attention模型來優化。地平線的内部評測證明:在1000小時的數據上,CLDNN+CTC模型相比于之前的DCNN模型,性能大概提升了 15%~20%。但端到端的實用性存在争議,現階段它隻是流程中的某一個部分的步驟簡化,尚未囊括解碼部分,而且需要大量的訓練集。

增強預測性和可适應性。在日常人際交流中,人們會預測對方下一句會說什麼。而讓機器獲得相似預測能力的突破口在半監督,無監督學習,尤其是強化學習和遷移學習。騰訊之前有一個PAC-RNN模型,能夠非常快地自适應,從而持續改進識别結果。但是這個模型由于遞歸神經網絡的環路比較大,訓練上比較困難。

在硬件方面,AI語音識别領域的芯片研發也是熱點。而在終端,語音識别兩個關鍵因素是實時性與成本,研發語音識别專屬芯片是終端語音識别硬件發展趨勢,終端芯片的例子包括:啟英泰倫終端智能語音識别芯片CI1006,雲知聲UniRobot硬件芯片系統,和MIT在ISSCC2017上發表的paper裡的芯片。

小結:

投身消費領域,智能家居改變了消費者的居住方式,語音交互為智能家居創造了一個安全、舒适、便利和信息化的居住空間做了不少貢獻,使人們适應在信息社會的快節奏中家居與外部世界保持完全開放的生存狀态。智能家居以家庭為單元,運用多種信息技術,達到監控與信息交互的目的,在未來,居住更加智能、消費者的居住體驗更加舒适,一場由語音交互的變革看起來勢在必行了。

上一篇: 2毫瓦就能實現“闖入偵測”,是什麼智能家居技術?
下一篇: 如何根據老人生活特點進行智能家居設計?
返回首頁 | 産品世界 | 下載中心 | 聯系我們 | 站點地圖 | 阿裡店鋪 | 天貓旗艦店 | 加入海曼
Copyright © 深圳市海曼科技股份有限公司 粵ICP備06020500号 Sitemap Archive

服務熱線:

181 2392 8516

關注海曼微信
http://m.juhua466625.cn|http://wap.juhua466625.cn|http://www.juhua466625.cn||http://juhua466625.cn