VocalZoom技術的應用
色列初創企業VocalZoom是一家人機通訊光學傳感器領先供應商,其光學麥克風能夠帶來更自然、更個性且更安全的語音控制體驗,目前已經與Honda(日本本田)公司的Xcelerator計劃合作,將其光學麥克風技術應用於車內語音控制。
VocalZoom公司的光學麥克風能夠“閱讀”人類在說話時臉部皮膚的震動,從而在車內背景噪音中精準“分離”出駕駛者的語音,從而使汽車語音識別系統相比過去傳統的語音控制解決方案,能夠更精準更方便的理解並執行駕駛者的語音命令。在本田2017 CES上展示的概念驗證Demo中,參觀者可以體驗到VocalZoom公司的神奇科技。
“我們非常高興能夠與本田一起亮相2017 CES,共同展示我們應用於互聯汽車的突破性新型語音控制和語音身份驗證技術,” VocalZoom公司銷售和業務發展部副總裁Rammy Bahalul說,“VocalZoom公司的光學麥克風即使是在開窗、引擎噪音、音樂播放、乘客談話以及其它干擾的背景噪音中,也能提供近乎完美的實時語音識別性能,它重新定義了人機通訊。”
VocalZoom公司光學麥克風語音識別原理
為了將人類的聲音從環境噪音中完全分離,VocalZoom為其HMC傳感器運用了一種低成本、低功耗的干涉測量原理。該傳感器使用一個激光器來測量人們說話時臉部或者耳後皮膚的低頻震動。為了降低干涉測量的成本,VocalZoom選擇了犧牲測量距離,使用一款一級安全等級的垂直腔面發射體激光器(VCSEL),該激光器測量距離為1米,可以直接正對臉部進行皮膚震動探測。
VocalZoom的HMC 傳感器應用了一項簡單但專利保護的干涉測量技術,使用一款可以正對臉部測量的一級安全等級的垂直腔面發射體激光器(VCSEL)。面部震動改變了反射光束的相位,通過定制ASIC中嵌入的算法獲得最終輸出信號,信號再通過I2S接口輸出。
該系統不僅可以改善手機通話質量、更精準更持久的接收語音命令進行聲控操作,還可以用於近距離探測和測量心率。而且,每個人說話的嗓音和相應的面部震動都是獨特的,所以該傳感器還可以用於生物安全識別。
“這一技術將改變人類與機器的交互方式。”VocalZoom銷售和商業發展部副總裁Rammy Bahalul突出了該項技術的主要應用。但是,他還指出該傳感器可以替換掉佔智能手機成本10~20美元的傳感器組件,包括近距探測、語音識別、生物識別(自帶“存活證明”特性)等功能組件,同時還能提供更好的降噪效果,還能通過語音控制降低系統功耗。
為此,摩托羅拉選擇該系統進行了試驗,最後,摩托羅拉還成為了該公司的投資方。今年初,VocalZoom與科大訊飛簽署了一項協議,將VocalZoom的人機交流(HMC)光學麥克風與科大訊飛的“語音雲”智能語音技術平台相結合。
“該傳感器自身功耗在毫瓦範圍內,” Bahalul說道,“成本大約1美元。”激光器的成本在1美元左右,ASIC的成本低於1美元。首批原型系統應該在今年第三季度準備就緒,Behalul預計第一批產品將於2017年年初上市。
留言列表