蚂蚁智能内容合规产品,提供一站式营销合规管控解决方案

news/2024/9/18 6:21:04/

随着互联网服务的不断深化,产品营销的形式从传统文本、长图文,增加到短视频、直播等新媒介形态,展现形式愈加丰富的同时,也为营销宣传内容合规审核带来了诸多难题。

  • 如何解决与日俱增的审核量与合规审核人员有限之间的矛盾?

  • 如何提升审核效率,满足业务部门快速发布需求?

  • 对于音视频、直播,如何对这些新媒介形式实现高效高质量的审核?

基于上述挑战,蚂蚁数科推出了全栈式智能内容合规审核平台产品。该产品基于AI智能技术及专业内容审核规则沉淀,向金融、互联网、政企、传媒等行业客户提供一站式智能内容合规审核解决方案,可助力机构有效降低营销合规风险。

此前,蚂蚁集团基于内部解语花平台与博时基金共建的基金内容合规智能审核系统荣获第八届证券期货科学技术奖优秀奖和2021年度深圳市金融创新奖三等奖。该审核系统具备高度自主知识产权,处于国内外领先水平。

一、产品能力

合规专家人力有限,越来越无力支撑海量内容的人工审核,且人工风险排查存在排查标准不统一,风险挖掘不深入,评审结果无沉淀等一系列问题。

蚂蚁智能审核产品基于人工智能技术及专家经验的解读和沉淀,提供了一站式的营销合规风险管控解决方案,将监管要求进行数字化转译,通过程序化手段实现快速的机审策略配置;同时提供了统一审核服务接入,支持文本、图片、语音、视频、直播、文件等全媒体格式的营销宣传内容识别,结构化内容特征,进行规则推理,完成风险决策和处置。

多媒体内容识别

支持全媒体格式处理,适用于企业级推销产品或服务的文字、图片、音频、视频、直播或其他内容展示形式,以实现针对用户可感知的应用页面、营销宣传、金融产品信息、销售行为过程等内容的全媒体格式的智能审核。

智能内容审核

合规专家会将自己的审核经验总结成规则或违规风险点,基于特定审核场景,融合各类算法模型构建复杂且精准的策略体系,打造感知引擎-认知引擎-决策引擎为核心的多媒介金融风险精细化审核引擎,达成以机器审核代替人工审核的目标。

二、技术内幕

1.多媒体内容识别

在内容审核的过程中,针对不同的内容往往需要采用不同的处理方式来达到审核的目的。日常遇到的内容包括营销广告、产品页面文案、启动屏、IM、电销、直播、超链接、氛围图、弹窗、信息流、PUSH、短信、邮件等各种面向消费者的信息展示形式,这些内容大多以各种素材类似一张图片/一段音频/一段视频等方式承载。内容处理中心服务于审核前的内容预处理环节,即从这些素材中提取出需要审核的信息,进行内容转换、抽取、压缩等。

1.1基础能力建设:

o 文件处理:提供文件内容抽取、文件类型转换、文件生成图片等多种文件处理功能。

o 图片处理:提供图片压缩、智能切割、图像增强、降噪处理等多种图像处理能力。

o 音视频处理:提供音视频转码,视频抽帧,音频文件提取,语音ASR、增强、降噪等多种能力。

1.2 复杂处理流程编排:为了应对灵活多变的内容处理流程,内容处理中心支持自定义内容处理流程编排,针对不同场景通过自定义脚本的方式实现内容处理节点的灵活编排。譬如为了满足复杂监管要求,当视频中语音涉及产品业绩介绍时,视频页面应当播放业绩展示板,通过自定义脚本的方式实现视频抽音频后,识别其中关键内容,再抽取对应时间图片,进行联合送审。

2.智能内容审核及规则编排

为识别更复杂且隐蔽的金融风险问题,提升合规风险识别的准确率和召回率,我们建设了感知&认知&决策三层漏斗式处理引擎。同时建立统一算法能力接入平台,实现原子算法能力业务无感插拔。最后在调用节点的输入输出之间加入了工程能力介入,如灰度图等,以增强算法模型的识别能力。

与天生具备自然属性的概念不同,监管合规概念是由社会活动的演进而出现,再由相关监管部门进行定义与规范的,专家会将自己的审核经验总结成规则或违规风险点,机审则需要对这些规则进行算法实现,规则生产配置的过程其实就是将一项项专家经验转换成机审能力的过程。在这个过程中,规则数量大,需要覆盖的场景多,为每条规则研发一个脚本工作量大,后期维护成本高昂。

同时在研发规则脚本时,发现很多规则是有相似的处理逻辑的,且具备一定顺序性,由此提炼原子能力,设计出一套规则的编排方案,快速实现业务规则,同时在规则发生调整时可快速切换组合方式,同时可以基于简单的配置化,做到业务的快速接入和使用。

3.模型迭代优化

审核中算法模型的优化迭代更新依赖大量的标注样本。在内容合规领域,没有成熟、直接可用的样本集,强依赖合规专家经验的持续输入,然而合规专家打标的人力成本和时间成本都非常高昂,因此如何降低打标成本是内容合规领域的重中之重。围绕着这个问题,我们采用了小样本学习、主动学习、噪声学习等技术,在打标环节筛选高质量的样本,节省专家时间的同时使算法模型达到业务要求的精度,提高人在回路体系的效率。

以小样本学习为例,我们使用大规模预训练语言模型,使用NLP的prompt(模板填充)模式,结合半监督学习,充分利用未打标样本,能够在样本量减少一半的情况下,模型效果保持不变。在特定任务中,样本量能减少到原先的1/5。在这套框架下,“人”、“数据”、“模型”三者是互相提升的,数据在整个回路里从未标注变成强标注,人从对审核规则有初步理解变成审核方面的专家,模型从无监督到强监督。

三、落地案例

博时基金-蚂蚁智能审核样板间 丨通过AI技术,实现基金产品销售素材智能化审核服务

蚂蚁智能审核产品一直以来致力于为用户提供智能内容合规审核能力,与行业共建合规规则库,持续优化更新。在基金产品宣传材料方面,博时基金引入了蚂蚁集团智能合规审核服务,构建博时基金内容管理与智能审核平台。 智能审核能力提升了合规审核效率,降低合规风险,大幅优化了业务-合规审核流程。内容管理平台提供营销素材存储、管理、复用、共享服务,助力不同素材需求方快速获取审核通过的定稿素材,提升营销品宣效率。

博时基金与蚂蚁共建的智能审核系统还具备以下两大特点:

技术创新点:基于深度神经网络框架,运用大规模预训练、多模态识别、人在回路算法等技术构建了国内领先的金融合规模型集群,将合规专家经验转化为智能审核能力,解决了复杂语境下的准确率和审核效率问题。

业务创新点:围绕内容生命周期,部署全流程的合规管理应用场景,并创造性实现了人机结合应用界面,创新实现视频直播类智能合规审核,从“0到1”的突破。

目前蚂蚁集团智能合规内容审核产品已开始向基金、保险、银行等金融机构推广落地。

四、未来展望

目前,智能审核产品已经广泛应用在包括蚂蚁保、蚂蚁基金、网商银行、博时基金等多家机构,持续帮助机构定位与洞察合规业务风险,提升业务协同效率。同时蚂蚁智能审核产品现已向金融机构提供商业化服务,期待与更多机构共建行业合规规则库,开展合规领域大模型的构建和应用实践,进一步提升智能化水平。

后续我们会持续分享蚂蚁集团智能合规内容审核能力演进过程中的落地与思考,欢迎大家提出任何意见与建议。

如有兴趣,可以联系:gengliu.gl@antgroup.com


http://www.ppmy.cn/news/12727.html

相关文章

UI自动化测试模块与环境管理全面打通,MeterSphere开源持续测试平台v2.6.0发布

2023年1月16日,MeterSphere一站式开源持续测试平台正式发布v2.6.0版本。 在这一版本中,MeterSphere的UI自动化测试模块与环境管理全面打通,更好地满足了用户一个脚本同时跑多个环境的测试需求。在测试跟踪模块中,测试计划关联测试…

[ECE]模拟试题-5

在cluster1上有一task1索引,请编写一个查询并满足以下要求: ● 定义一个名为a的运行时字段,通过a字段实现以下聚合(a字段的值等于b字段减去c字段) ● 聚合a值小于-2的文档 ● 聚合-5到5之间的文档 ● 聚合大于5的文档DELETE task1 PUT task1 {"settings": {"…

不会数学的程序员,只能走到初级开发工程师!

作者:小傅哥 博客:https://bugstack.cn 沉淀、分享、成长,让自己和他人都能有所收获!😄 在我还是初级程序员时,每天也都粘贴着代码和包装着接口。那个阶段并没有意识到数学能在编程中起到什么作用&#xff…

juc系列(1)---进程,线程,并行,并发

目录概述进程线程关系并发并行:同步异步:对比概述 进程 程序由指令和数据组成,但这些指令要运行,数据要读写,就必须将指令加载至CPU,数据加载至内 存。在指令运行过程中还需要用到磁盘、网络等设备。进程就是用来加载…

Windows下IIS部署网站流程

IIS Internet information service 是一个web服务器 1. IIS用于windows系统 2.apache用于Linux系统,JAVA的web服务器 3.Nginx用于Linux,负责负载均衡,反向代理 安装完IIS之后,去更改DNS的指向。 DNS指向:IP 和 域名 的…

LeetCode 62. 不同路径

🌈🌈😄😄 欢迎来到茶色岛独家岛屿,本期将为大家揭晓LeetCode 62. 不同路径,做好准备了么,那么开始吧。 🌲🌲🐴🐴 一、题目名称 LeetCode 62. …

【数据结构与算法】顺序表的原理及实现

1.什么是顺序表 顺序表是用一段物理地址连续的存储单元进行存储元素的线性结构,通常是以数组进行存储。通过数据元素物理存储的相邻关系来反映数据元素之间逻辑上的相邻关系。 2.顺序表的实现 判断顺序表是否为空表public boolean isEmpty()判断顺序表是否满publi…

【论文精读】Scaling distributed machine learning with the parameter server

Scaling distributed machine learning with the parameter server前言Abstract1. Introduction1.1 Contributions1.2 Engineering Challenges1.3 Related Work2. Machine Learning2.1 Goals2.2 Risk Minimization2.3 Generative Models3. Architecture3.1 (Key,Value) Vectors…

SH-PEG-Silane巯基-聚乙二醇-硅烷试剂简介Silane-PEG-SH

SH-PEG-Silane巯基-聚乙二醇-硅烷 外观:固体或液体,取决于分子量大小。 PEG可选分子量: 1000,2000,3400,5000,10000 溶剂: 溶于DMSO,DMF,DCM,溶于水。 纯度:>95% 保存:-20℃&#xff0c…

新入公司 git基本命令使用(二) 小乌龟版

git命令行的操作复杂不直观,且容易出错. 这里推荐大家使用 git版小乌龟插件进行使用 下载地址 :https://tortoisegit.org/download/ 安装一路next即可 创建本地仓库 右键点击克隆, 然后输入项目地址,确认 拉取代码 右键点击同步 , 然后再界面中选择好对应的分支, 点击拉取 …

Express做后端服务详细步骤,从零到一

文章目录一、全局安装脚手架二、生成项目1.生成项目2.目录结构介绍3.拓展:配置文件热更新(避免改一次文件重启一次服务)步骤1:安装nodemon步骤2:创建nodemon.json文件步骤3:更改启动命令步骤4:上…

Python基础(二十四):面向对象核心知识

文章目录 面向对象核心知识 一、面向对象三大特性 1、封装 2、继承 3、多态 二、多态 1、了解多态 2、体验多态 三、类属性和实例属性 1、类属性 2、实例属性 四、类方法和静态方法 1、类方法 2、静态方法 面向对象核心知识 一、面向对象三大特性 1、封装 将…

Java中的包装类

基本数据类型的豪华版---包装类基本数据类型包装类基本数据类型 在我们刚开始学习Java的时候,我们学习的应该就是Java中的八种基本数据类型: byte short int long float double char boolean 当时我们还说过Java是面向对象编程的语言,一切皆对象,但是受到当时知识的限制,我们还…

校招求职HR常问问题汇总

前言 前言:面试是一次重要的自我销售的过程,只不过销售的产品是你自己,你要做的就是说服面试官认为你是优秀的,从而给你一个工作机会。 文章目录前言一、回答问题的原则二、自我介绍1、注意2、模板3、达到的效果三、你还有什么问题…

卷积神经网络中特征图大小计算公式总结

W:输入特征图的宽,H:输入特征图的高K:kernel size卷积核宽和高,P:padding(特征图需要填充的0的个数),S:stride步长width_out:卷积后输出特征图的宽…

回首2022展望2023

回首2022,虽然经历反复的居家办公,但仍然努力客服家庭与工作的时间冲突,很好的完成了开发任务。并在疫情变换间隙,带着部门同事做了几次团建,锻炼了队伍,提高了凝聚力。我同时坚信迟早会全面放开。在闲暇之…

Go语言运算符

Go语言运算符 参考资料主要来源于菜鸟教程。 运算符用在程序运行时执行数学逻辑运算。 Go语言内置的运算符有: 算术运算符关系运算符逻辑运算符位运算符赋值运算符其它运算符 算术运算符 下表列出所有Go语言的算术运算符。假定A值为10,B值20。 运算符…

理解CSS

CSS 作为前端技术栈中关键一环,对页面元素及样式呈现起到了直接作用。本节课旨在通过对 CSS 的工作流程及原理、页面中 CSS 使用方法等详细解读,帮助前端新手建立对 CSS 的全面而深刻的认知。 CSS概念 CSS 即 Cascading Style Sheets,是用来…

[idekCTF 2023] Malbolge I Gluttony,Typop,Cleithrophobia,Megalophobia

这些题名字我都不认识,这是什么语呀。这个比赛感觉太难了,加上春节将近比较忙,仅作了4个简单题。记录一下。Misc/Malbolge I Gluttony这是个虚拟机的题,放入misc感觉有点不可思忆,题目给了7个命令,有"…

【初阶数据结构】——写了将近 5 万字,终于把 二叉树 初阶的内容讲清楚了

文章目录前言1. 树的概念及结构1.1 树的概念1.2 树与非树1.3 树的相关概念1.4 树的表示1.5 树在实际中的运用(表示文件系统的目录树结构)2. 二叉树概念及结构2.1 概念2.2 现实中的二叉树2.3 特殊的二叉树2.3.1 满二叉树2.3.1 完全二叉树2.4 二叉树的性质…