




人工智能深度学习的数据标注已经发展成为一个全新的行业,机器学习对于数据的需求不仅仅数量在上升,质量和精确度也在不断的增加。在这样一个行业背景下,对于像数据标注师、质检师和项目经理等专业人才的需求量也大量增加。所以,想要加入这个行业,不仅仅要学习了解什么是数据标注?更要学习数据标注的类型有哪些,并且能够在相应的项目标注平台上熟练操作。
四川数据标注有很多类型,如分类标注、标框标注、描点标注、区域标注等。接下来,精数标注研究院带大家学习几种常见的数标注分类,希望对大家在学习工作中有所帮助。基础的数据标注类型有计算机视觉、语音工程、自然语言处理。
一、计算机视觉类。拉框标注:用2D框、3D框、多边形框等标注出图像或视频数据中的指定目标对象。
语义分割:标记图像中存在的内容及位置,根据属性进行像素级分割,支持单属性、多级属性。
3D点云标注:将点云数据图像中的多类指定对象使用3D框进行标注。
关键点标注:对人脸关键点、人体骨骼关键点、人脸五官等进行关键点标注。
线标注:支持贝塞尔曲线和普通线段标注,支持对车道线进行贝塞尔曲线标注,使用线段将图像目标的边缘、轮廓用线段标注。
2D/3D融合标注:对2D平面图与3D点云图映射的数据组进行标注,支持自动贴边、跨帧复制、测距、2/3D图片标注分离等多种功能。
二、自然语言处理类。OCR转写:将图像中的文字进行识别,并以文本的形式转写。
文本信息抽取:把文本里包含的信息进行分类和打标签等结构化处理。
NLU语句泛化:基于特定文本数据进行多角度泛化,以不同的描述方式重组语句。
词性标注:基于特定文本数据进行词性理解标注,如动词、名词、形容词等。
情感判断:针对指定文本数据,判断该文本的情感类别并给出相应的标签,如积极、消极等。
意图判断:常使用分类的方法将句子分为相应的意图种类,进而判断语义意图。
三、语音工程类。ASR语音转写:提取语音数据特征,转写为对应的文本或命令。
语音情绪判定:从语音数据中识别说话人的情绪状态。
声纹识别标注:对音频数据中的说话人进行辨认或确认。
语音切割:根据需求,将语音实现分段切割。
按照标注的难易程度来划分,可以分为常识性标注和专业性标注。