




为汇聚数据资源、提升数据质量、盘活数据要素价值,探索数据标注产业高质量发展的科学路径,国家数据局部署了成都、沈阳、合肥、长沙、海口、保定、大同等7个承担数据标注基地建设任务的城市,并支持上述城市在技术创新、行业赋能、生态培育、标准应用、人才就业、数据安全等方面先行先试。
在技术创新方面,基地积极布局智能标注技术攻关。例如,沈阳市制定了《数据标注技术创新指导意见》,以“揭榜挂帅”形式支持建成人工智能医学图像分析系统,能够提供医学光镜图像、病理图像等数据智能标注,已标注10TB高质量数据集,并应用于有关大模型研发。在行业赋能方面,基地打造了一批行业高质量数据集。例如,成都市已储备金融、医疗、网络安全等领域的多模态高质量数据集5400TB,赋能训练30余个人工智能模型。长沙市天心经济开发区已聚集地理、气象等8个领域共计700TB的数据资源,可支持智能交通、灾害预警、城市规划等人工智能应用。在生态培育方面,基地产业集群效应初步显现。例如,合肥市积极整合产业链资源,已与国内外上百家相关企业开展数据合作。海口市运营百度智能云人工智能基础数据产业基地,吸引大模型企业和数据标注企业等入驻,打造协同发展的产业生态。在标准应用方面,基地稳步开展标准体系建设。例如,成都市有关科研机构正在制定数据标注技术、数据加工分析能力评估、数据资源集成能力评估等地方和行业标准,为提升数据标注质量打好基础。在人才就业方面,基地推进产教融合多元培养成效显著。例如,大同市积极推进产教融合,培养数据标注人才,目前基地累计已培训就业数据标注相关人员约两万人次,其中本科及以上学历占比近三成。保定市举办首届人工智能基础数据标注职工职业技能大赛,旨在推动培养优秀数据标注人才,约93个团体400人参加。在数据安全方面,基地数据安全保障体系逐步建立。沈阳市、成都市、长沙市、大同市等从技术和制度两个维度强化数据标注全流程安全管理,例如搭建基于区块链技术的数据标注安全溯源机制、推动数据标注安全生产环境建设、开展数据合规认证、建立数据安全风险分级分类体系等。