1. 出門問問是一家算法公司,擁有全套自主研發的語音交互8大關鍵技術:
■多達8個麥克風陣列的信號處理算法
■自研回聲消除、聲源定位,波束成形、去混響、噪聲抑制等核心算法用於遠場語音交互場景
■語音識別:採用業界領先的TDNN-F模型垂直領域最精確的中文識別
■熱詞喚醒:低功耗優化、可定製熱詞、多熱詞;採用RNN+DNN兩步驗證
■語音合成:端到端語音合成技術
■手勢識別
■全自動睡眠檢測
■主動運動姿態識別,游泳檢測等
■運動教練: 自動識別和記錄健身動作
■跌倒檢測: 適配老年人和兒童的雙重模式
■統計式模型:谷歌的BERT模型
■自然語言理解:理解近100個垂直領域和高達13個維度的複雜查詢
■多輪對話:垂直領域的多輪對話,例如導航、音樂、電話等等
■知識圖譜:實現5000萬實體與20億實體關係連結
■熱詞喚醒和多命令詞識別
■自研針對可穿戴設備的高清語音信號處理算法
■結合雙麥克風波束成形算法和骨傳導融合算法
■實現在耳機上24小時離線交互
■垂直搜索:自研垂直搜尋引擎,接入100+第三方生態
■主動搜索和智能推送:基於可穿戴、家居、車載不同場景數據和用戶畫像的智能推送
2. QCC3020的功能架構圖如下:
內置120MHZ Qualcomm Kalimba audio DSP;
外掛可編程QSPI Flash;
支持2MIC模擬/數字;
支持SPI/I2C/UART,I2S輸入;
Aptx,Aptx_HD,Aptx LL;
支持低功耗模式;
支持充電管理模式;
支持ClassD,ClassAB輸出;
支持Sink和earbud工程設計;
VFBGA-90pin, 5.5*5.5mm封裝;
3. D4基本性能介紹
- 超低功耗可編程DSP處理器;
- 支持第三方算法;
- 豐富的接口:SPI/I2C/UART/I2S;
- 體積小:Wlcsp36封裝,2*2.4mm;
- 適用於藍牙耳機音箱等領域;
- 集成2路ADC模數轉換;
- 3路模擬MIC輸入,或者3路數字MIC輸入。
D4代碼加載啟動,支持多種接口,各種接口速率如下:
SPI up to 15.4Mbps,優先推薦選擇;
I2C up to 3Mpbs;
UART up to 6Mbps;
D4的 1MIC通話功耗如下:
休眠模式:70uA
1MIC低功耗模式:0.8mA;
1MIC通話降噪模式:3.3mA;
數字MIC支持採樣率:8,16,22.5,32,44.1,48K,16Bit/24Bit;
4. 產品原理圖整體設計如下:
5. 產品PCB layout設計細節注意:
QCC3020的電源和地是很關鍵的地方,所以PCB走線優先考慮晶片的電源和GND的完整性,再到晶振/RF/信號;信號線儘量遠離電源和干擾源,RF天線預留足夠的空間和乾淨的GND;
QCC3020信號層走線細節:內層信號GND包裹,相鄰層有完整的GND隔離,減少層與層間信號的互相干擾;
D4電源和MIC模擬信號再TOP走線細節:MIC的走線遠離電源線,使用GND線包裹,TOP層的GND也需要保證完整性;
D4信號層走線儘量有GND包裹,儘量減少和電源的並行,模擬信號線和數字信號線分開,最好成組出線,減少干擾;
6. 產品通話調試,搭建的調試硬體環境如下:
QCC系列調試底板+QCC3020+D4模塊搭建實際調試環境;
7. QCC3020代碼整改和D4降噪算法移植
QCC3020基本代碼系統初始化:
QCC3020的通訊SPI口初始化:
問問算法在D4晶片初始化加載:
D4通過UART錄音,加載出門問問算法前後測試效果圖:
►場景應用圖
►產品實體圖
►展示板照片
►方案方塊圖
►產品實物圖
►核心技術優勢
QCC3020技術優勢: 1. 支持BT5.2; 2. 可編程DSP; 3. 支持I2S輸入; 4. 支持SBC,AAC,APTX,APTX-HD; 5. 支持低功耗模式; 6. 支持充電管理; D4技術優勢: 1. 超強DSP集成晶片; 2. 支持第三方算法移植; 3. 支持I2S數字音頻輸出; 4. 支持數字和模擬MIC; 5. 數字MIC支持採樣率:8,16,22.5,32,44.1,48K,16Bit/24Bit; 6. 支持超低功耗模式; 7. 小封裝設計:2.2*2.4mm; 出門問問算法優勢: 1. 支持通話ENC回聲消除; 2. 支持通話環境噪聲降噪; 3.支持通話風噪降噪; 4. 算法數據包小,易於移植。
►方案規格
1. 1MIC通話設計; 2. 支持通話回聲消除和環境降噪; 3. 支持數字mic和模擬mic設計; 4. 降噪算法代碼容量小。