sito
sito
sito
sito
sito
AI应用落地热潮正推动四川数据标注市场进入新一轮洗牌期。大模型和自动驾驶领域的AI需求搅动了数据服务市场,数据标注服务商整数智能CEO林群书告诉数智前线,今年以来他们接到了非常多基于大模型训练场景的订单,市场需求量呈现出了一条比较陡峭的增长曲线。
新的应用场景对服务商的能力提出了新要求。一方面,不同于传统深度学习算法,大模型场景下数据处理流程中,在数据需求量最大的预训练环节,使用的多是无标注或弱监督标注数据。更多的人工标注需求出现在预训练环节之后的微调(SFT)以及基于人类反馈的强化学习(RLHF)阶段。微调和对齐时,人工标注的质量会极大影响模型在生成内容时的智能水平,这对人工标注的数据质量提出了更高的要求。