sito
sito
sito
sito
sito
当前,数据标注员的规模虽处于急速扩张中,但与逐日激增的市场需求相比,缺口依旧很大。
同时,人工智能主要算法应用领域集中在计算机视觉、语音识别/语音合成,以及自然语言处理三个方面。
图像方面:一个新研发的计算机视觉算法需要上万张到数十万张不等的标注图片训练,新功能的开发需要近万张图片训练,而定期优化算法也有上千张图片的需求,一个用于智慧城市的算法应用,每年都有数十万张图片的稳定需求。
语音方面:头部公司累计应用的标注数据集已达百万小时以上,每年需求仍以20%-30%的增速上升,要求数据服务商不仅要掌握专业的声学知识、数据标注经验,还要拥有语音合成的算法能力。
自然语言处理方面:随着工业、医疗、教育的AI应用产品进一步爆发,将会有更多交互方式出现,自然语义数据处理的需求将会持续增长,有望成为继图像、语音之后的第三大增量市场。
这些海量的数据几乎全部依赖数据标注员手工进行标注,数据标注员的数量缺口十分可观。
同样,伴随AI商业化落地进程的加快,AI企业对于数据标注服务供应商也提出了新的要求,高质量、精细化、定制化的数据集越来越受到需求方的青睐,这也意味着对数据标注员的专业素质能力提出了更高的要求。