sito
sito
sito
sito
sito
从概念上来看,四川数据标注是对未处理的初级数据, 包括语音、图片、文本、视频等进行加工处理,并转换为机器可识别信息的过程。原始数据一般通过数据采集获得, 随后的数据标注相当于对数据进行加工, 然后输送到人工智能算法和模型里完成调用。
分类式标注有两大特征:一是有明确的标注规则,无需复杂的业务逻辑介入,多为通用性对象的识别;二是无专业知识的人员可经过短期培训掌握标注方法,无需强依赖专家,例如OCR图片标注、语音转写、文本分类等场景。与之相反,训练式标注的特征为:一是无法形成明确的标注规则,需要广泛的业务逻辑;二是需要由具备业务领域专业知识的人员完成,难以短期培养标注人员,例如专业领域的问答标注。