sito
sito
sito
sito
sito
“四川数据标注是人工智能发展的基石。在大模型的训练过程中,尽管大模型的语料大部分无需标注,使用的都是互联网上的公开数据,但质量参差不齐。为了训练基础模型,需要的语料必须是质量高且无过多重复的。因此,需要对数据进行分类,去除低质量和重复的内容,留下高质量的语料进行基础训练,这是大模型基础模型训练的必要条件。”明略科技集团高级技术总监吴昊宇说。
市场规模逐渐扩大以及重要性日益显著,使得数据标注行业愈发受到行业及投资机构的青睐。2023年,包括像星尘数据、标贝科技、整数智能、柏川数据、曼孚科技、恺望数据等行业企业均获得新一轮融资。此外,像阿里巴巴、百度、京东、字节跳动、科大讯飞等头部企业也与地方持续深化合作,加快推动数据标注产业基地的建设。