Search
Close this search box.
Search
Close this search box.

昆杜团队斩获国际语音挑战赛冠军

昆山杜克大学语音与多模态智能信息处理(SMIIP)实验室与OPPO研发团队携手,近日在国际语音领域的顶级会议Interspeech 2024上荣获第三届国际音视频语音增强挑战赛(AVSE Challenge)限定训练数据赛道的冠军。

获奖证书

昆杜参赛团队成员包括武大-昆杜联合培养博士生金湛和曾邦,指导教师为昆山杜克大学电子与计算机工程副教授李明博士,来自OPPO的技术专家李茁和刘鑫也给予了技术指导。此次夺冠的项目专注于音视频目标人语音抽取技术,这是昆杜SMIIP实验室自2022年夏季以来新启动的研究方向,涵盖了语音的分离、语音提取的听感增强以及基于目标人唇动的特征提取等关键技术。

金湛

2022年,金湛从昆杜电子与计算机工程硕士项目(ECE)项目毕业后,成为昆杜与武汉大学联合培养的博士生,并加入昆山杜克大学SMIIP实验室参与研究。

“作为武大-昆杜联合培养博士生,在昆杜的学习期间,我加入了李明教授的团队,专注于语音分离方向的研究。这次获奖不仅是对我目前工作的一个阶段性总结,而且此次比赛中的经验与困难,将指引我寻找新的解决方案。未来,我期待我的系统不仅能在干净环境中提升性能,还能在带混响和信息缺失的真实场景下保持分离效果。”

李明教授

李明教授领导的SMIIP实验室在说话人识别、日志、分离、语音唤醒与识别、语音合成与转换、伪造音检测等多个方向都有研究。近年来,实验室在语音领域的顶级期刊TASLP和顶级会议ICASSP、INTERSPEECH上发表多篇论文,并在VoxSRC说话人识别比赛中屡获冠军。

Interspeech是国际语音通信协会(International Speech Communication Association, ISCA)举办的年度会议,是全球最大、最全面的专注于语音通信领域的学术盛会。本次AVSE挑战赛由爱丁堡大学、爱丁堡纳皮尔大学、德州大学达拉斯分校、诺丁汉大学、台湾“中央研究院”的学者共同发起,是Interspeech 2024的官方赛事之一,吸引了多个来自学术界和工业界的队伍参加,一共有57个参赛系统被提交。比赛设有三个赛道,旨在考验在限定训练数据、不限定训练数据以及低延时要求下的目标人群语音抽取能力。

如果您是一名记者,正在寻找有关大学的信息或专家采访故事,我们的团队可以提供帮助。

媒体关系

中国传播

李怡
联系电话: (+86) 0512-3665 7720

邮箱: yi.li@dukekunshan.edu.cn

Add our
WeChat