返回
列表
上一篇
文章
下一篇
文章
四川语音数据标注的8种常见方式
发布时间:2024.10.09 09:20:59
分享到:

1、发音校对

发音校对是对整个口语训练过程中的数据采集以及对不标准的发音进行纠正的过程。

 

2、语音清洗

语音清洗是对语音进行重新的审查和校验的过程,清洗空音频,筛选出符合要求的音频,删除重复信息,纠正错误,并提供语音一致性,助力语音识别模型训练。

 

3、VAD语音切割

VAD语音切割,从一段语音数据中找到语音部分的起点和终止点,从中抽取语音情感识别所需的信号特征,从声音信号流里识别和消除长时间的静音期,将有效的语音信号和无用的语音信号或者噪音信号进行分离,以使后续的语音转写、语音情感分析。

 

4、韵律标注

韵律标注是指从语音数据中确定韵律信息,再对标注文本进行韵律符号标注,常见于语音合成技术。

 

5、音素标注

音素标注是根据音标、组成音素和读音对语音进行标注的过程。

 

6、情绪判定

情绪判断能够对语音内容中说话人的情绪倾向进行判断,区分他们的情感态度,帮助训练NLP模型。

 

7、声纹识别标注

声纹识别标注是将语音人声中的声纹特征提取出来,并标注上对应属性,以帮助训练语音识别模型。

 

8、ASR转写

ASR转写是根据音频播放的内容转写为对应的文本,并选择相关的标签,用于语音识别模型训练。第三方平台可对提供的语音数据进行精确转录,支持普通话、方言、英文和小语种等多种语言。

1728436649934.jpg

留言反馈
企业名称
所在区域
姓名
电子邮箱
联系电话
问题描述
上传图片