首页

新闻中心

四川语音数据标注的8种常见方式

发布时间：2024.10.09 09:20:59

分享到：

1、发音校对

发音校对是对整个口语训练过程中的数据采集以及对不标准的发音进行纠正的过程。

2、语音清洗

语音清洗是对语音进行重新的审查和校验的过程，清洗空音频，筛选出符合要求的音频，删除重复信息，纠正错误，并提供语音一致性，助力语音识别模型训练。

3、VAD语音切割

VAD语音切割，从一段语音数据中找到语音部分的起点和终止点，从中抽取语音情感识别所需的信号特征，从声音信号流里识别和消除长时间的静音期，将有效的语音信号和无用的语音信号或者噪音信号进行分离，以使后续的语音转写、语音情感分析。

4、韵律标注

韵律标注是指从语音数据中确定韵律信息，再对标注文本进行韵律符号标注，常见于语音合成技术。

5、音素标注

音素标注是根据音标、组成音素和读音对语音进行标注的过程。

6、情绪判定

情绪判断能够对语音内容中说话人的情绪倾向进行判断，区分他们的情感态度，帮助训练NLP模型。

7、声纹识别标注

声纹识别标注是将语音人声中的声纹特征提取出来，并标注上对应属性，以帮助训练语音识别模型。

8、ASR转写

ASR转写是根据音频播放的内容转写为对应的文本，并选择相关的标签，用于语音识别模型训练。第三方平台可对提供的语音数据进行精确转录，支持普通话、方言、英文和小语种等多种语言。

聚合川渝人才响应全球服务

Aggregate Sichuan And Chongqing Talents To Respond To Global Services

联系方式

固话

0832-2112880

地址

四川省内江市东兴区东兴街道圣美街10号

许经理 neijiangsito
田经理 TMQNO1

xhj38441263@foxmail.com
TMQNO1@163.com

0832-2112880

友情链接 | 内江市人民政府内江市商务局内江市经济合作局内江市人力资源和社会保障局内江市市场监督管理局内江市疾控中心内江市卫生健康委



留言反馈