sito
sito
sito
sito
sito
以自动驾驶行业为例,目前,该领域的四川数据标注以人工标注为主,机器标注为辅。从最早依赖视觉到现在的多传感器融合,从“3D点云+图像”的融合标注到现在的4D标注,自动驾驶技术应用的复杂性、多元场景需求给数据处理、数据标注方法都带来了极大挑战。为此,不仅应该全面升级数据标注及数据管理工具链和不同模型的预标注能力,包括图像整帧、自选物体、区域、点云批次识别和文本识别等,还应该重新定义基于预标注的人工标注效能,如能效看板、综合看板等,并针对特定算法类型的数据持续优化迭代。
根据人工参与程度,主要的标注方法可分为人工标注、半自动标注和机器自动标注。其中,人工标注的准确度最高,但速度较慢且可能存在遗漏错误的情况;半自动标注即先使用某些算法进行部分标注,然后由人进行纠正。这种标注方法的速度会大大提高,但人可能会受到预标的影响,倾向于接受机器已经预标注的内容;机器自动标注则利用大型模型,通过Zero-shot(零样本)或者Few-shot(少样本)的方式进行标注,这种方式预启动周期更短,但容易出现与第二种标注方法相似的问题,此时,良好的标注规范和人工审核就显得尤为重要。