论文
论文
期刊
专题
资讯
问答
专家
智库
图表
推荐
视频
高级检索
首页
期刊群
论文库
专家库
图表
专题
问答
视频
图书
科研智库
资讯
行业新闻
学术会议
展会信息
实验室
投稿
各刊稿件投审编端口
写作指导
关于
平台介绍
出版传媒集团
学术期刊工作委员会
主办单位:煤炭科学研究总院有限公司、中国煤炭学会学术期刊工作委员会
首页
>
优先出版
基于SAE-LS-CGAN数据增强的语音情感识别
太原理工大学学报
网络首发时间:2024-03-28 18:47:01
108
作者
魏佳楠
孙颖
张雪英
单位
太原理工大学电子信息与光学工程学院
摘要
语音情感语料库具有数据稀少的问题,然而深度神经网络的训练需要大量的数据才能实现较好的性能。数据增强是解决这一问题的有效方法,但是目前语音情感识别领域缺乏对数据增强方法的有效性研究。在分析多种语音数据增强方法的基础上,本文提出了一种基于改进条件生成对抗网络(Conditional Generative Adversarial Network, CGAN)的新的数据增强网络SAE-LS-CGAN。其中,改进CGAN将语音特征映射为N个矩阵,鉴别器分别对每个矩阵进行评价,增加鉴别的准确性。另外,网络整体设计与传统的生成对抗网络(Generative Adversarial Network, GAN)不同,该网络增加栈式自编码器(Stacked AutoEncoder, SAE),并将其输出作为改进CGAN的输入,同时使用类别学习器(Class Learning Block, CLB)辅助提升生成样本的质量,最后引入最小二乘损失函数(The Least Squares Loss Function, LS)对网络进行对抗性训练,在原始特征空间和潜在空间中生成高质量的特征向量,这些生成数据扩展到训练数据中,用于分类。实验结果表明,在Emo-DB和IEMOCAP数据集上,都表现出较好的性能。
关键词
语音情感识别
数据增强
栈式自编码器
条件生成对抗网络
最小二乘损失函数
文章目录
1 基于SAE-LS-CGAN数据增强方法
1.1 栈式自编码器
1.2 生成对抗网络
1.3 条件生成对抗网络
1.4 损失函数
2 实 验
2.1 实验数据与特征预处理
2.2 评价指标
2.3 实验设置
3 结 果
3.1消融实验
3.2对比实验
4 结 语
相关问题
立即提问
太原理工大学学报
Journal of Taiyuan University of Technology
中文核心期刊
中国科技核心期刊
0年期
推荐专家
崔耀
推荐企业
第七届中国国际煤炭清洁高效利用展览会
推荐专题
《洁净煤技术》“煤与新能源”虚拟专题(一)
《#煤炭经济研究 》 “能源革命下电力新质生产力构成”专题
《工矿自动化》“矿山无人驾驶技术”专题
《洁净煤技术》“碳材料新技术”虚拟专题(一)|虚拟专题
《洁净煤技术》“煤电三改联动” | 虚拟专题
《煤田地质与勘探》“煤地质与碳中和” | 虚拟专题
《能源环境保护》“重金属污染”研究领域
《能源环境保护》“机器学习”研究领域
“对话”专题(《智能矿山》)
《洁净煤技术》“CCUS大规模集成化发展”专题
亮点论文
蒙陕矿区内钢板-钢筋混凝土钻井井壁非均匀受力特性研究
环形冻结温度场演化规律影响因素研究
基于虚拟现实技术的锚杆(索)支护规范化施工培训系统研发
能源革命下电力新质生产力构成
新型低能耗CO2混合胺吸收剂实现燃煤烟气高效脱碳
深部高浓度胶结充填开采地表沉陷控制因素及影响规律
新时期能源企业创建世界一流企业战略研究
融合简化可视图和A*算法的矿用车辆全局路径规划算法
纳米磁铁矿对海藻厌氧发酵产甲烷性能影响及机制探究
纤维种类及橡胶含量对矿用水泥基材料性能影响研究
主办单位:
煤炭科学研究总院有限公司 中国煤炭学会学术期刊工作委员会
煤问提
问答社区(热门)
问答社区(问答专场)
提问
热议话题
问答
推荐专家
活跃用户
煤传媒
时事
科技
事件
煤视界
专家报告
特别访谈
煤炭科普
会议活动
增强素材
技术宣讲
科技创新50强
2017年度
2016年度
2015年度
会员中心
专家
通讯员
普通会员
登录注册
©版权所有2015 煤炭科学研究总院有限公司 地址:北京市朝阳区和平里青年沟东路煤炭大厦 邮编:100013
京ICP备05086979号-16
技术支持:
云智互联