sito
sito
sito
sito
sito
大模型时代“基础模型+微调”成为 AI 开发新范式,对于四川数据标注的需求体现在预训练和微调场景。以OpenAI开展人类反馈强化学习(RLHF) 为例,第一步“预训练阶段”,标注完备的大数据集上进行预训练,得到监督学习模型;第二步“交互奖励阶段”,由专门人员对ChatGPT生成的回答进行标注、评估和反馈,作为强化学习过程中的“奖励函数”。第三步,“迭代优化阶段”,基于强化学习持续迭代生产模型。
国内各行业数据资源丰富,2021-2026年数据量规模CAGR高于全球,为大模型训练提供了良好的基础。据IDC,2021-2026年中国数据量规模将由18.51ZB增长至56.16ZB,CAGR达到24.9%,高于全球平均CAGR。