sito
sito
sito
sito
sito
现在来看,四川数据标注仍然处于较为早期的发展阶段,即数据标注人员掌握一定的标注技能,积累了一些粗略的标注经验,就能完成标注工作。其实,这制约了整个行业的发展。未来,这个行业可能会需要本科生、研究生或者从业多年的人。而实现将这些人有效聚集,并为垂直行业提供数据标注服务,将会成为行业发展的一个重要节点。
进一步来讲,针对垂直行业大模型,它的标注类型,微调所需要的问答、人工的评测以及预训练之中所需要的垂直领域的专有知识,这些其实都需要数据标注人员去持续深化了解的。“我们其实可以看到,数据标注在面对大模型迭代时,采取的更多是一种应对性策略,并没有做到主动引领或者超越。我认为,这个超越的点会来自于越来越多垂直行业大模型涌现之后,数据标注人员对于行业知识的积累和沉淀以及去满足这些细分行业数据标注处理结果的过程。”贾宇航解释道。