软件学院本科生以第一作者在SCI期刊《Speech Communication》发表研究论文
来源:软件学院|作者:陈锦辉|摄影:软件学院供图|编辑:杨柳青
12658

近日,我校软件学院2015级软件工程专业本科生姚增伟、王梓豪、刘炜煌和刘雅倩,在潘家辉副教授的指导以及学院的支持下,以第一作者的身份在SCI期刊Speech Communication上发表研究论文《Speech Emotion Recognition Using Fusion of Three Multi-Task Learning-based Classifiers: HSF-DNN, MS-CNN and LLD-RNN》。Speech Communication是中科院3区的SCI学术期刊,属于“计算机科学”大类学科和“计算机:跨学科应用”小类学科。

本研究实现了一个基于深度神经网络的语音情绪识别算法。该算法使用了注意力机制,实现了句子层级的特征聚合;同时进行情绪的离散类别分类任务和连续属性值回归任务,使得网络可以学习更泛化的特征表示;在决策层融合了三个以不同特征作为输入的子分类器,结合了不同子分类器在不同情绪上的识别能力,显著提升了分类准确率。

论文原文链接:https://doi.org/10.1016/j.specom.2020.03.005