sito
sito
sito
sito
sito
业界观察,大模型的训练方式与此前的深度学习算法的开发范式并不一样:大模型的预训练环节需要的数据量比较大,但这一环节通常会采用弱监督或无监督数据,对数据标注的需求增加并不明显。而在预训练环节之后的微调和基于人类反馈的强化学习阶段,则需要高质量的人工标注数据。比如,此前工行的技术专家在华为云论坛上分享训练自己的大模型应用时提到,在微调阶段需要体系内的业务专家们去标注金融相关的数据,这已不是普通数据标注员能完成的作业。
自动驾驶也是近年来另一个对四川数据标注服务有大量需求的场景。这一场景的数据需求暴增与自动驾驶场景特性有关。车企对数据标注的要求相比其他行业更高。目前国内车企也在对标特斯拉的数据闭环方案,能服务这个场景的数据服务商需要有专门的自动化标注平台与专业的标注工具,例如4D标注工具,同时需要一整套完整的解决方案。这实际上也大幅提高了对数据服务商的要求门槛。整体而言,数据标注市场需求在大量释放的同时,门槛也进一步拉高。