全部
全部
论文
专家
专题
问答
视频
资讯
图书
图表
专利
高级检索
首页
期刊群
论文库
专家库
图表
专题
问答
视频
图书
科研智库
资讯
行业新闻
学术会议
展会信息
实验室
投稿
各刊稿件投审编端口
写作指导
关于
平台介绍
出版传媒集团
学术期刊工作委员会
主办单位:煤炭科学研究总院有限公司、中国煤炭学会学术期刊工作委员会
首页
>
优先出版
基于SAE-LS-CGAN数据增强的语音情感识别
太原理工大学学报
网络首发时间:2024-03-28 18:47:01
129
作者
魏佳楠
孙颖
张雪英
单位
太原理工大学电子信息与光学工程学院
摘要
语音情感语料库具有数据稀少的问题,然而深度神经网络的训练需要大量的数据才能实现较好的性能。数据增强是解决这一问题的有效方法,但是目前语音情感识别领域缺乏对数据增强方法的有效性研究。在分析多种语音数据增强方法的基础上,本文提出了一种基于改进条件生成对抗网络(Conditional Generative Adversarial Network, CGAN)的新的数据增强网络SAE-LS-CGAN。其中,改进CGAN将语音特征映射为N个矩阵,鉴别器分别对每个矩阵进行评价,增加鉴别的准确性。另外,网络整体设计与传统的生成对抗网络(Generative Adversarial Network, GAN)不同,该网络增加栈式自编码器(Stacked AutoEncoder, SAE),并将其输出作为改进CGAN的输入,同时使用类别学习器(Class Learning Block, CLB)辅助提升生成样本的质量,最后引入最小二乘损失函数(The Least Squares Loss Function, LS)对网络进行对抗性训练,在原始特征空间和潜在空间中生成高质量的特征向量,这些生成数据扩展到训练数据中,用于分类。实验结果表明,在Emo-DB和IEMOCAP数据集上,都表现出较好的性能。
关键词
语音情感识别
数据增强
栈式自编码器
条件生成对抗网络
最小二乘损失函数
文章目录
1 基于SAE-LS-CGAN数据增强方法
1.1 栈式自编码器
1.2 生成对抗网络
1.3 条件生成对抗网络
1.4 损失函数
2 实 验
2.1 实验数据与特征预处理
2.2 评价指标
2.3 实验设置
3 结 果
3.1消融实验
3.2对比实验
4 结 语
相关问题
立即提问
太原理工大学学报
Journal of Taiyuan University of Technology
中文核心期刊
中国科技核心期刊
0年期
推荐专家
宫传刚
推荐企业
转化果(图文)
推荐专题
《煤田地质与勘探》“煤矿隐蔽灾害探查与治理地质综合保障技术”虚拟专题
《煤炭科学技术》“中国煤层气高效开发关键技术与实践”专题
《智能矿山》"数字岩石力学"专题
《煤田地质与勘探》“定向钻进技术、装备及应用”虚拟专题
《煤田地质与勘探》“矿井水害防治、水资源保护与利用”虚拟专题
《能源环境保护》厌氧创新技术与资源化应用·虚拟专题
《矿业科学学报》“矿井地质灾害隐患透明化”专题
《洁净煤技术》2023—2024年度高影响力论文Top20
《洁净煤技术》“光煤互补”虚拟专题
碳新篇:女性科学家的能源探索专辑
亮点论文
网络首发||瞿赞研究员:CVOCs对吸附剂低温吸附零价汞的影响
《煤炭经济研究》2025年第2期 | 王建良编委:统一框架下不同净零氢气生产途径成本比较研究
【重点论文推荐】刘建功教授:煤矿立体生态矿山建设技术研究
“卓越科学家”专题丨岳建华教授:矿井直流电法偶极–偶极超前探测装置模拟及其应用
郭涛副研究员:中国南方煤层气主要地质特点、勘探开发进展及策略
金丹副研究员:随掘地震实时采集数据同步时差校正方法
王红岩教授级高级工程师:上扬子地区下寒武统筇竹寺组地层特征及页岩气富集段分布
网络首发||曾宪海教授:糠醛催化加氢制备下游醇类产物
《煤炭经济研究》2025年第2期 | 刘满芝编委:补贴退坡下新能源汽车发展演化博弈研究
“卓越科学家”专题丨刘泉声教授:煤矿深部巷道碎胀大变形灾害控制及大变形灾变环境下TBM快速成巷技术
主办单位:
煤炭科学研究总院有限公司 中国煤炭学会学术期刊工作委员会
煤问提
问答社区(热门)
问答社区(问答专场)
提问
热议话题
问答
推荐专家
活跃用户
煤传媒
时事
科技
事件
煤视界
专家报告
特别访谈
煤炭科普
会议活动
增强素材
技术宣讲
科技创新50强
2017年度
2016年度
2015年度
会员中心
专家
通讯员
普通会员
登录注册
©版权所有2015 煤炭科学研究总院有限公司 地址:北京市朝阳区和平里青年沟东路煤炭大厦 邮编:100013
京ICP备05086979号-16
技术支持:
云智互联