返回
列表
上一篇
文章
下一篇
文章
四川UGC内容审核机器过滤机制
发布时间:2024.09.02 11:00:01
分享到:

1.关键词过滤

建立违禁词库,词库可分为敏感、违禁等。在用户点击发布的同时对用户发布的内容进行关键词过滤,如帖子标题、内容进行关键词过滤,并且根据设定的命中关键词的权重值对其进行操作。这里的词库是需要通过运营维护的,人工定期的添加才能保证关键词过滤的效果。

2.重复内容过滤

重复内容过滤能极大的限制广告内容、灌水,我们可以看到大部分广告内容都是CV工程师发布的。(CV即Ctrl+C Ctrl+V复制粘贴)大部分内容都是一模一样的可能会略微改动一些但是相似度不会低于80%,重复内容对比前需要对标点符号等无关信息屏蔽,在用户发布前对重复内容进行过滤并弹出toast提示用户不要发布重复内容。

3.限制发布次数

这里同样能够很有效的降低用户刷帖、灌水、发布广告等内容。对用户发布次数进行限制,如每天只能发布10个帖子等,具体次数限制需要根据后台数据,对异常用户及普通用户行为数据进行分析对比进而设定对应的限制发布次数,因为我们不知道普通用户每天平均发布的帖子数量。

4.根据用户属性过滤

根据不同用户人群,将用户发布的内容进行过滤。例如将用户分为新人(注册7天内的用户)、KOL(Key Opinion Leader 关键意见领袖)、高危用户(有过违禁记录的用户)及普通用户等,由于他们的行为特征不同,可以采取不同的审核策略。如新人,大部分新人都在消费内容,极少的新人会产生内容,因此对新人产生的内容我们是需要进行审核的,可以采取机器过滤+人工审核的方式。

留言反馈
企业名称
所在区域
姓名
电子邮箱
联系电话
问题描述
上传图片