Search
Close this search box.
Search
Close this search box.

昆山杜克大学与澜起电子科技(昆山)合作研发语音唤醒AI芯片取得进展

当前,新一轮科技革命和产业变革方兴未艾,人工智能(AI)已逐渐发展成为带动技术创新、推动产业升级的通用技术。昆山杜克大学大数据研究中心李明副教授领导的研究团队长期致力于AI语音技术的探索创新。近一年,团队在昆山市政府研究计划的资助下开展了语音识别智能芯片关键技术的研究项目,还与业界领先的集成电路设计公司澜起电子科技(昆山)有限公司进行合作,研发语音唤醒AI芯片,并取得了不俗进展。

根据国际数据公司(IDC)发布的数据,2018年中国智能家居市场出货量预计达到1.5亿台,且未来每一台智能家居产品可能都将具备语音交互功能。远场语音唤醒及识别的定制化AI芯片的应用场景非常丰富,包含智能音箱,智能家居,可穿戴智能硬件,机器人,小家电,玩具,车载等众多场景。对于普通终端设备而言,语音唤醒模块,需要始终保持在监听状态,难以使用云端服务。因此针对远场语音唤醒的端侧神经网络专用芯片算法模拟及关键技术研究,可以在低成本、低功耗,快响应、高性能、保隐私的条件下,为广大的智能终端赋能高性能远场语音唤醒及识别功能。

在2019-2020年度昆山市政府研究计划的资助下,李明博士作为项目负责人,带领团队开展了“基于深度学习的远场语音识别智能芯片关键技术研究”项目。在现有基于端到端深度学习的语音唤醒算法框架基础上,采用小型化卷积神经网络及数据增强策略,利用多任务学习框架并使用领域自适应算法以提高系统性能,相比于基线系统提出了性能更好速度更快的高性能远场语音唤醒识别算法。

同一时期,昆山杜克大学与澜起电子科技(昆山)有限公司共同合作,针对此语音唤醒算法及系统,就嵌入式系统验证,硬件FPGA架构设计,定点方案对比等方面开展了研究,为后续算法硬件验证及芯片开发打下良好基础。

双方的合作论文 “Multi-task Learning with Alignment Loss for Far-field Small-Footprint Keyword Spotting”已于近日投稿至语音领域国际主流学术会议Interspeech2020,其预印版已公开于Arxiv。

双方合作的语音唤醒原形系统的演示视频如下:

If you are a journalist looking for information about the University or for an expert to interview for a story, our team can help.

Add our
WeChat

If you are a journalist looking for information about the University or for an expert to interview for a story, our team can help.