图片新闻
科研进展
  

计算机与信息工程学院赵子平教授团队研究成果在IEEE Transactions on Affective Computing发表


发布时间:2025-06-06

近日,我校计算机与信息工程学院赵子平教授团队联合浙江大学、清华大学、美国费尔菲尔德大学在期刊IEEE Transactions on Affective Computing发表题为“A Knowledge Distillation-based Approach to Speech Emotion Recognition”的学术论文。

Transformer作为深度学习中的重要架构,凭借其强大的长序列依赖建模能力,在自然语言处理、计算机视觉等多个领域得到了广泛应用。然而,当前的Transformer架构在语音情感识别任务中表现欠佳,这主要是由于未对齐的时间戳以及不同变量间物理测量的差异,会导致注意力机制的无意义映射。同时,Transformer架构包含大量参数,需要消耗大量的计算资源,这使其难以在资源有限的环境中部署。此外,人类情感具有复杂性和模糊性,而现有的Transformer架构难以有效处理这种复杂的情感信息。为此,研究团队提出了一种知识蒸馏框架。具体而言,研究团队首先对教师模型进行微调,使其能够适应不同的语音情感识别任务。在学生模型中,将单个序列时间点嵌入到变量标记中,以此聚合全局语音表示。同时,结合监督对比损失和交叉熵损失,以增大可学习特征之间的类间距离。最后,采用元知识蒸馏与基于课程的知识蒸馏方法,提升学生模型的性能。实验结果验证了该方法的有效性。这一成果为推动语音情感识别领域的进一步发展提供了新的理论框架。

计算机与信息工程学院赵子平教授为该论文第一作者,指导的硕士研究生刘纪新为共同第一作者,天津师范大学为该论文第一署名单位。该研究得到国家自然科学基金资助 (62071330, 61831022, U21B2020等)。


论文链接:https://doi.org/10.1109/TAFFC.2025.3574178



关闭

快速链接
 
地址:天津市西青区宾水西道393号 邮政编码:300387      
津ICP备09008453号-1|津教备0385号
津公网安备 12011102000560号|事业单位标识