離線語音識別方案開發(fā)
離線語音識別方案開發(fā)簡介
ASR(Automatic Speech Recognition)自動語音識別技術(shù)是基于關(guān)鍵詞語列表識別的技術(shù)。每次識別的過程,就是把用戶說出的語音內(nèi)容,通過頻譜轉(zhuǎn)換為語音特征,和這個關(guān)鍵詞語列表中的條目進行一一匹配,最優(yōu)匹配的一條作為識別結(jié)果。比如在手機的應(yīng)用中,這個關(guān)鍵詞語列表的內(nèi)容就是電話本中的人名/手機的菜單命令/T卡中的歌曲名稱等,不論這個列表的條目內(nèi)容是什么,只需要用戶設(shè)置相關(guān)的寄存器,就可以把相應(yīng)的待識別條目內(nèi)容以字符形式傳遞給識別引擎。
識別引擎不關(guān)心關(guān)鍵詞語列表中的關(guān)鍵詞語的內(nèi)容,可以是命令,人名,歌曲名字,操作指令等等任何的漢字字符串。
每條關(guān)鍵詞語最大可以支持的字?jǐn)?shù),從算法角度是限制在30字以內(nèi)。但是從實際情況來看,用戶一口氣說超過8個字以上的條目時,幾乎肯定會出現(xiàn)說錯字/說漏字/說多字/打嗝/停頓等情況,這些情況都會嚴(yán)重影響識別并造成識別錯誤。因而一般來說如果要獲得理想的識別效果,建議每條關(guān)鍵詞語的字?jǐn)?shù)不要過長,避免影響效果
ASR技術(shù)最重要的意義在于提供了一種脫離按鍵、鼠標(biāo)的基于語音的用戶界面,使得用戶對于產(chǎn)品的操作更自然,相對手動控制更加快捷、方便,可用于智能家電、智能穿戴,聲控智能玩具等諸多領(lǐng)域。
目前在線語音識別方案價格較高,產(chǎn)品接入復(fù)雜周期冗長,響應(yīng)時間受網(wǎng)絡(luò)影響。 本方案提供的是基于大量語音數(shù)據(jù)庫的非特定人聲離線語音識別。本方案具有成本優(yōu)勢,接入簡單周期短,識別響應(yīng)速度快(0.5秒以內(nèi)),不需要連接網(wǎng)絡(luò)。整體方案成熟、穩(wěn)定、可靠,可以讓傳統(tǒng)產(chǎn)品快速升級智能語音功能。
離線語音識別技術(shù),是基于關(guān)鍵詞語列表識別的技術(shù)。只需要設(shè)定好要識別的關(guān)鍵詞語列表,通過語音識別系統(tǒng)就可以對用戶說出的關(guān)鍵詞語進行識別,不需要用戶作任何錄音訓(xùn)練。
無需聯(lián)網(wǎng)即可輕松
實現(xiàn)語音操控
市場應(yīng)用:
智能語音燈、智能玩具、家電產(chǎn)品(電風(fēng)扇、抽油煙機、空調(diào))、眼部按摩儀、頸部按摩儀,智能音箱等諸多產(chǎn)品。
方案優(yōu)勢:
識別率95%以上,距離3M范圍內(nèi)精準(zhǔn)識別
支持32國語言,支持多個小語種
無需聯(lián)網(wǎng),離線識別,響應(yīng)迅速
支持語音反饋播報,增加互動娛樂
性價比高,SOC架構(gòu),集成Codec
穩(wěn)定性高,工業(yè)級芯片
指令靈活設(shè)計,無需客戶錄音
開發(fā)時間短,技術(shù)支持到位
技術(shù)參數(shù):
工作電壓范圍可選3.3~5.5V
輸入專用MIC引腳 增強級為26dB,最大總增益為65dB
差分音頻PWM輸出,直接驅(qū)動1W/8Ω揚聲器
2路PWM信號輸出,可用于LED調(diào)光
提供I2C/UART接口和自定義通訊協(xié)議,可用于外接模塊、與外部MCU通訊
合作方式:
提供語音識別完整設(shè)計方案,客戶可以根據(jù)自己的需求設(shè)計功能,我司負(fù)責(zé)聲控部分的開發(fā),跟客戶的主控對接
芯片授權(quán):客戶自己開發(fā)應(yīng)用,生產(chǎn)PCB,自行購買相應(yīng)的元器件生產(chǎn),我司提供芯片、相關(guān)的參考路線、語音識別命令制作。
成功案例:
1、智能語音燈
2、智能小家電
3、保健按摩器
4、智能中控
語音降噪模塊:
針對環(huán)境噪音進行有效抑制,提升嘈雜環(huán)境下的識別效率。
適用于有機械運動的產(chǎn)品,如風(fēng)扇,暖風(fēng)機,抽油煙機,掃地機器人等
歡迎各開發(fā)工程師前來咨詢了解。