数据标注前应完成以下四项准备工作:
1.分析数据:明确机器学习和模型训练过程中所需的标注数据类型、量级、用途及应用场景等;
2.整理数据:明确数据与标签文件存放的目录结构,在任务分配与回收时,应按指定的目录进行数据组织;
3.明确命名规则:应明确数据与标签文件的命名方式,命名规则应避免数据更新迭代时的重名,便于数据追踪、标注追踪,且数据文件名与标签文件名应保持一致;
4.标注数据定义与需求量:明确标注数据的定义并确定最终的需求量。