版权说明 操作指南
首页 > 成果 > 成果详情

基于自注意力机制时频谱同源特征融合的鸟鸣声分类

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
刘志华;陈文洁;陈爱斌
作者机构:
[刘志华; 陈爱斌; 陈文洁] 中南林业科技大学计算机与信息工程学院,长沙 410004
[刘志华; 陈爱斌; 陈文洁] 中南林业科技大学人工智能应用研究所,长沙 410004
语种:
中文
关键词:
深度学习;鸟鸣声分类;卷积神经网络;自注意力机制;同源谱图特征融合
关键词(英文):
deep learning;bird sound classification;Convolutional Neural Network(CNN);self-attention mechanism;homologous spectrogram feature fusion
期刊:
计算机应用
ISSN:
1001-9081
年:
2022
卷:
42
期:
4
页码:
1260-1268
基金类别:
智慧物流技术湖南省重点实验室(2019TP1015);
机构署名:
本校为第一机构
院系归属:
计算机与信息工程学院
摘要:
目前深度学习模型大都难以应对复杂背景噪音下的鸟鸣声分类问题。考虑到鸟鸣声具有时域连续性、频域高低性特点,因此提出了一种利用同源谱图特征进行融合的方法用于复杂背景噪音下的鸟鸣声分类。首先使用卷积神经网络(CNN)提取鸟鸣声梅尔时频谱特征,再使用特定的卷积以及下采样操作,将同一梅尔时频谱特征的时域和频域维度分别压缩至1,得到仅包含鸟鸣声高低特性的频域特征以及连续特性的时域特征。基于上述提取频域以及时域特征的操作,在时域和频域维度上同时对梅尔时频谱特征进行提取,得到具有连续性以及高低特性的时频域特征。然后将自注意力机制分别用于得到的时域、频域、时频域特征...
摘要(英文):
At present,most deep learning models are difficult to deal with the classification of bird sound under complex background noise.Because bird sound has the continuity characteristic in time domain and high-low characteristic in frequency domain,a fusion model of homologous spectrogram features was proposed for bird sound classification under complex background noise.Firstly,Convolutional Neural Network(CNN)was used to extract Mel-spectrogram features of bird sound.Then,the time domain and frequency domain dimensions of the same Mel-spectrogram feature were compressed to 1 by specific convolutio...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com