返回
列表
上一篇
文章
下一篇
文章
四川为何需要数据标注
发布时间:2024.05.30 09:32:02
分享到:

数据标注就像是为机器学习“划重点”和“笔记讲解”。比如我们想让AI创作图画,首先需要让它先学习和识别每幅画画的是什么、颜色是什么、有什么实体在里面,然后AI才能通过这些详细的注解学会模仿并创作出相似的画作。AI的文字生成也是一样,AI需要了解文本数据的情感色彩和使用场景,才能够学会按照不同的情感要求去生成新的句子或文章。没有这些“重点”和“笔记”,机器学习的效率、质量和准确性会受到影响。尽管近年来无监督学习和半监督学习技术也在不断发展,但数据标注依然是精准实现生成式AI的重要因素。

人工智能是要构建一个世界知识体系,而人类的世界知识体系是能理解万事万物的。我们通常的原始数据大部分是非结构化的数据。“比如文字、语音、视频,这些都是非结构化数据。而标注是用人构建的知识体系去给它们打标签,那首先就要理解这个语义,标注如果不对,就可能指鹿为马。”

 


留言反馈
企业名称
所在区域
姓名
电子邮箱
联系电话
问题描述
上传图片