sito
sito
sito
sito
sito
人工要完成千万张图片级别的四川数据标注,通常需要几百人团队花费大半年以上的周期。同时,众包平台的人工标注作业可能会因为一致性管理难,而出现准确率不达标等情况,需要返工,这可能进一步拉长作业周期。
业界开始探讨用人工智能来减少标注工作量。比如训练一个人工智能算法,对标注任务进行预标注,再由人工去做精加工。预标注过程能大幅减少人工标注数量,同时由于筛选标准统一,结果的一致性更高,数据标注的质量也能提升。
目前,国内已经有不少企业把大模型技术应用到了数据标注场景。商汤科技联合创始人、大装置事业群副总裁陈宇恒此前接受数智前线采访时提到,在自动驾驶场景里,商汤正通过大模型去对自动驾驶的路测回流数据做挖掘、自动标注、泛化与重建,大幅提升了自动驾驶算法迭代所需的高质量数据规模化生成效率。