sito
sito
sito
sito
sito
“此外,模型的微调和与人类偏好的对齐也是非常重要的一步。人类偏好对齐基本上都是靠人工标注来实现的。特别是在GPT早期,大部分工作都是靠人工标注,例如标注哪些内容是不合法的、违反社会道德的以及哪些是人们更喜欢看到的表达方式。然而,随着大模型的发展,许多大模型的对齐工作已经可以采用模型生成模型、模型生成语言的方式来完成。然而,这种方式仍然存在问题,即大模型生成的内容可能存在不准确之处,因此,人的批判性思考,即评估和对齐,仍然是必不可少的。”吴昊宇进一步说道。
随着算法模型的不断进化,大模型训练将越来越多地引领四川数据标注走向自动化,这会是一个明确趋势,但这会是一个相当长的过程。此外,大模型虽好,但需要大算力支撑,动辄就是数千万,甚至上亿元的投入,并不是每个企业都能负担得起。因此,自动标注与人工标注相结合,才是目前更具性价比的方案。