sito
sito
sito
sito
sito
早期,市场对数据采集标注的要求较低,准入门槛低,行业内云集了大量中小规模的服务商和灵活就业/兼职个人,四川数据标注领头企业主要采用转包、众包模式提供服务,行业存在标注效率低下、数据质量参差不齐、高技能人才不足、全程数据安全合规风险高等问题。
一是标注效率低下、数据质量参差不齐。当前数据标注高度依赖人力,十分枯燥、耗费眼力体力,很多中小供应商缺少AI辅助标注、AI质检能力,标注师个人能力素质直接影响标注效率和数据质量,形成行业生产效率低下、数据质量不均衡的局面。
二是高技能产业人才缺乏。从任务需求来看,以较为复杂的语音标注、计算机视觉标注为主,医疗医药、法律、金融、电力等专业数据集标注生产,还对标注师的学科知识储备有一定要求。从人才培养来说,人工智能训练师新型岗位培养、专业设立并没有受到社会重视,市场上缺乏经过系统性训练的高技能人才。
三是全程数据安全合规风险高。根据中国信通院报告,80%的安全风险发生在数据流通环节。从行业现状来看,数据标注的链条较长,包括采集、标注、存储、传输等环节,转包模式下信息链条更长,黄赌毒/暴力信息过滤、隐私保护、数据不当使用等都是标注和审核企业面临的难题。