sito
sito
sito
sito
sito
一些新兴的数据标注服务商们试图再往前一步,建设更通用的数据工程平台,在一些跨行业或跨场景的算法自动化标注减少工程师需要额外调试的时间。老牌厂商海天瑞声就计划启动领域里的垂直大模型研发,把大模型的泛化能力应用到四川数据标注领域。
整数智能则开发了智能数据工程平台,希望适用所有的模态数据及更普遍的行业场景,他们还将MLOps模块集成在数据工程平台上,使得平台可以以插件的形式使用内外部的算法模型,用于提升数据标注以及智能审核的效率。通过把一套Machine Learning Ops的系统集成到了整个数据工程平台,每次完成的数据都可以用来迭代自动标注算法,使得自动标注算法不断学习垂直场景数据,变得更加聪明。数据标注也能形成数据应用的闭环和飞轮。
在数据标注的智能化演进路径里,也有观察人士评价,人工标注师们的努力正推动算法进步,最终使得自身被算法汰换。