
sito

sito

sito

sito

sito
四川内容审核根据待审核内容的不同格式,采用不同算法独立或者算法间相组合的形式进行基于机器审核的快速筛查。
文本内容审核。文本内容审核主要包含关键词的检测,语义理解等审核手段。审核平台会根据场景需求维护敏感词库,结合多种文本对抗方法、政策权威要求等关键词库,辅以自然语言处理等人工智能算法,精准地防范违规风险。在维护词库或黑白名单的基础上,引入自然语言处理能力,对待审核文本进行语义分析,规避因汉字的组合偶然触发敏感信息导致的误检。图像内容审核。相较于文本内容审核,图像内容审核的流程更为复杂。对图像进行内容审核之前,需要对图像中的信息进行抽取。对于图像中可能出现的诸如敏感人物(负面人物、落马高官、失德艺人等)、异常场景(血腥暴力、特定建筑/旗帜等、黄色低俗、诱导性广告等)维护一定规模的异常人物/场景图片库,当送检图片中包含图片库中包含的敏感元素时,对送检图片进行判断。根据不同的使用场景,可以手动调整检测阈值,合理区分正常图片与敏感图片。音频内容审核。与图像内容审核类似,作为文字的另一种表达形式,音频中也有可能包含敏感信息。对音频进行内容审核之前,需要对音频中的信息进行提取。提取内容包括:音频中包含的文本信息、音频中包含的声纹特征及音色信息,针对音频原始文件质量高低不同,一般情况下还需要对音频文件进行降噪等预处理。视频内容审核。视频素材作为集合了文本、图像、音频等多种数据整合形成的数据,在进行内容审核时也将对应的整合文本、图像、音频等能力,同时调用各项能力,分别判断待审核视频在文本展示上、在图像展示上、在声音上是否存在风险点。