
sito

sito

sito

sito

sito
质量检查能够确保数据标注结果有价值,符合数据需求方的特定应用目的。根据项目特性,质量检查方法可以归纳为以下几种,标注项目负责人需要根据场景需求及项目特点进行选择:
1. 逐条检査:即对整个标注项目所包含的所有标注子任务逐一核査并确认。适用于项目量级不大、人力资源充沛、时间节点不紧张、对标注数据结果的准确率要求极高的标注项目。这种方法覆盖的质量检查范围最全,同时也适用于任何形式的数据标注场景。该方法可确保标注数据输出的最高质量,尤其对于数据格式主观成分较多、应用场景较复杂的任务更有效;
2. 按比例抽查:即从全部标注数据中科学地抽取样本,对样本中的数据逐条检查,以此评判全部标注数据的质量。样本量的选择需符合统计学基本原理,足以代表全部标注数据。抽查审核时,项目负责人可指派较有经验的审核员完成,从而确保交付质量;
3. 抽样检验又可分为以下两种:
(1)简单抽样:以等概率抽取n件待检测样本的方法。
(2)系统抽样:每隔一定时间或一定编号进行检测,而每一次又是从一定时间间隔内生产出的产品或段编号产品中随机抽取一个或几个样本的方法;
在质量检查过程中,需要设定质量检查间隔,防止由于一次性不合格数据积压过多而导致延误交付还需要根据算法要求设定质量检查合格率,增加标注人员容错率。