阿里&美团风控策略调研
categories: Ai安全(大模型安全)
注:本文内容都来自阿里、美团的多年前的公开资料调研总结。不涉及任何内部机密
一、宏观风控
1.1MT风控体系建设
风控特性:
- 高对抗性:因为有利可图,黑产会一直存在
- 准确性:
- 准确率:判断为风险的用户的准确程度(避免误判)。策略准确率99%以上才能上线
- 准确率比召回率重要——避免误伤
- 召回率:成功判断风险的用户占风险用户的总量
- 准确率:判断为风险的用户的准确程度(避免误判)。策略准确率99%以上才能上线
- 灵活性:随时监控、随时修改
1.1.1MT风控架构
- 实时:毫秒级
- 准实时:几s——几分钟
- 离线:通过ETL(数据抽取、转换清洗、合并加载)
1.1.2风控关键
情报(黑灰产特征、手段)、策略(短平快、但易被绕过)、模型(需要开发周期)、知识库(黑白名单、用户/商家画像)
1.1.3实时监控
1.1.4风控模型
- 异常检测:
- 基于数据统计
- eg:某个ip登陆成功率很高
- 聚类:离群异常点
- 孤立森林….
- 基于数据统计
- 知识图谱:多对多关系挖掘
- 同一设备不能被多个登陆ID登陆
- 同一登陆id不能出现在多设备
- …..
- 用户画像:风险评分、信用评分…
1.2Ali风控
1.2.1典型防控链路
经过七层防控环节(绿色属于业务测)
端上安全-基础安全-业务安全
- 端上安全防控(应用层):端上的安全策略(这个我们有)
- 基础安全防控:不加入具体业务逻辑
- 网络层:流量清洗&流量保护
- 人机防控:流量侧人机防护
- 实时安全防控:业务测防控
- 人机防控:业务测人机防控(因为人机比较复杂,需要多维度)
- 黑/白:优先黑白判断——为后续节约成本
- 灰:比较复杂的灰——需要从多维度识别风险
- 准实时联合防控(近线):将多种流量&行为放在一起监控
- 离线回捞
1.2.2业务安全架构
业务测安防主要分为四大块
- 风险识别:检查到用户的风险行为
- 业务简单且准确率很高:直接进入风险处置
- 行为模糊or准确率不高:进行风险审核
- 业务非常复杂:进入风险决策
- eg:某些风险在时间段内不论触犯多少次、只能进行一次处罚;但是它在不同环节可能会被多次识别。需要在风险决策中统一去重、收口
- 风险决策:决策复杂业务场景
- 风险审核:审核低置信度风险(机审or人审)
- 风险处置
1.2.3近线检测
为什么要做近线检测?
近线定位
- 近线引擎要求
- 时效性不能太差(延迟太久没有返回风险结果,业务会认为该信息正常,易导致漏防)
- 多事件综合处理能力(多流join处理)——超灵活多格式数据处理(需要算法自己实现)
- 易用:和现有风控体系无缝融合
1.2.4离线引擎
- 实时引擎稳定性:很多离线数据需要批量导入实时引擎
- 批处理能力:很多场景要求批处理能力
- 新业务接入:新业务接入风控体系成本高
- 新风险(漏过):需要回捞新风险
- 策略变更(策略上新):需要用历史数据进行回归验证
二、风控策略总结(结论)
2.1实效性说明
并非所有风险都要求实时判定,而是根据风险危害程度&判定复杂程度
分类三类:实时(在线)、准实时(近线)、离线
2.2标签研判说明
- 总结风控体系由:是由多层体系 + 多维数据源研判出来的 + 新模型快速上线 + ……(非仅靠业务数据)
我们能做的就是:
- 多手段结合研判,增加风险研判维度——尽可能全面(具体手段的效果和取舍,只有真实数据实验后才能知道)
- 机器学习轻量模型
- llm生成规则库的算法
- llm生成排查风险画像代码(这个可以作为全黑命中)
- 低置信度&灰色风险的复杂研判(本身就有复杂场景下的风险不能实时判断)
- 上面的每种手段,可能都会涉及存在某些低置信度场景(灰色风险)
- 利用数据集微调过后的llm进行灰色风险的研判
2.3 近线检测场景
因为业务复杂度、实现成本、时间跨度等多方面原因,很多业务难以在实时引擎完成
- 薅羊毛:注册+登陆+交易多行为判断
- 涉黄、涉政:需要结合多维度信息判断