在数据标注进行前,我们需要采集到足够多的原始数据,因为它是我们用来标注的原材料,一般数据采集分为以下几种数据来源:
-网络爬虫:通过互联网爬取数据
-内部数据:企业内部长期积累的原始数据
-定制化采集:根据机器学习任务类型进行布置场景和演员进行采集,或在相关场所安置传感器进行采集