返回
列表
上一篇
文章
下一篇
文章
常见的7种四川语音数据标注异常情况
发布时间:2024.09.27 10:01:53
分享到:

我们来看一下语音数据标注常见的异常情况,主要分为7种:丢帧、切音、吞音、喷麦、重音、空旷音、混响。

1、丢帧

在语音录制过程中,由于音频设备的问题而表现出的发音卡顿,比如语音段中某0.1秒内突然没有声音,0.1秒过后语音又恢复正常,这种现象称为“丢帧”。

2、切音

在语音录制过程中,由于过早结束或过晚开始录制导致个别字被截断而表现出的发音不完善,这种现象称为“切音”。

3、吞音

在说话人发音时,比如说话太快了,个别字的声母或韵母没有完全发音而表现出的发音不完整,这种现象称为“吞音”。

4、喷麦

喷麦则是在说话发音时,由于距离麦克风太近而表现出的录入语音不清晰,听起来有明显噗噗的声音,这就是“喷麦”。

5、重音

在人说话发音时,语音中出现两个或多个人说话,他们的音量大小和频率接近,具有大段重叠,无法分清主次,这就是“重音”。

6、空旷音

空旷音简单来说就是在录制过程中,因为周围环境比较空旷,带来的回音,这就是“空旷音”。

7、混响

混响是一种比较常见的声学场景,与回声不同,混响是语音经过多次反射、折射后叠加而成的声音。

以上7种情况是在语音数据标注过程中常见的异常现象。它们各自具有不同的特点和表现形式,对语音数据标注的质量和有效性产生不同程度的影响。

留言反馈
企业名称
所在区域
姓名
电子邮箱
联系电话
问题描述
上传图片