阿里&美团风控策略调研


categories: Ai安全(大模型安全)


注:本文内容都来自阿里、美团的多年前的公开资料调研总结。不涉及任何内部机密

MT亿级流量风控建设

阿里风控大脑

一、宏观风控

1.1MT风控体系建设

风控特性:

  1. 高对抗性:因为有利可图,黑产会一直存在
  2. 准确性:
    1. 准确率:判断为风险的用户的准确程度(避免误判)。策略准确率99%以上才能上线
      1. 准确率比召回率重要——避免误伤
    2. 召回率:成功判断风险的用户占风险用户的总量
  3. 灵活性:随时监控、随时修改

1.1.1MT风控架构

  1. 实时:毫秒级
  2. 准实时:几s——几分钟
  3. 离线:通过ETL(数据抽取、转换清洗、合并加载)

1.1.2风控关键

情报(黑灰产特征、手段)、策略(短平快、但易被绕过)、模型(需要开发周期)、知识库(黑白名单、用户/商家画像)

1.1.3实时监控

1.1.4风控模型

  1. 异常检测:
    1. 基于数据统计
      1. eg:某个ip登陆成功率很高
    2. 聚类:离群异常点
    3. 孤立森林….
  2. 知识图谱:多对多关系挖掘
    1. 同一设备不能被多个登陆ID登陆
    2. 同一登陆id不能出现在多设备
    3. …..
  3. 用户画像:风险评分、信用评分…

1.2Ali风控

阿里风控大脑

1.2.1典型防控链路

经过七层防控环节(绿色属于业务测)

端上安全-基础安全-业务安全

  1. 端上安全防控(应用层):端上的安全策略(这个我们有)
  2. 基础安全防控:不加入具体业务逻辑
    1. 网络层:流量清洗&流量保护
    2. 人机防控:流量侧人机防护
  3. 实时安全防控:业务测防控
    1. 人机防控:业务测人机防控(因为人机比较复杂,需要多维度)
    2. 黑/白:优先黑白判断——为后续节约成本
    3. 灰:比较复杂的灰——需要从多维度识别风险
  4. 准实时联合防控(近线):将多种流量&行为放在一起监控
  5. 离线回捞

1.2.2业务安全架构

业务测安防主要分为四大块

  1. 风险识别:检查到用户的风险行为
    1. 业务简单且准确率很高:直接进入风险处置
    2. 行为模糊or准确率不高:进行风险审核
    3. 业务非常复杂:进入风险决策
      1. eg:某些风险在时间段内不论触犯多少次、只能进行一次处罚;但是它在不同环节可能会被多次识别。需要在风险决策中统一去重、收口
  2. 风险决策:决策复杂业务场景
  3. 风险审核:审核低置信度风险(机审or人审)
  4. 风险处置

1.2.3近线检测

为什么要做近线检测?

近线定位

  1. 近线引擎要求
    1. 时效性不能太差(延迟太久没有返回风险结果,业务会认为该信息正常,易导致漏防)
    2. 多事件综合处理能力(多流join处理)——超灵活多格式数据处理(需要算法自己实现)
    3. 易用:和现有风控体系无缝融合

1.2.4离线引擎

  1. 实时引擎稳定性:很多离线数据需要批量导入实时引擎
  2. 批处理能力:很多场景要求批处理能力
  3. 新业务接入:新业务接入风控体系成本高
  4. 新风险(漏过):需要回捞新风险
  5. 策略变更(策略上新):需要用历史数据进行回归验证

二、风控策略总结(结论)

2.1实效性说明

并非所有风险都要求实时判定,而是根据风险危害程度&判定复杂程度

分类三类:实时(在线)、准实时(近线)、离线

2.2标签研判说明

  1. 总结风控体系由:是由多层体系 + 多维数据源研判出来的 + 新模型快速上线 + ……(非仅靠业务数据)

我们能做的就是:

  1. 多手段结合研判,增加风险研判维度——尽可能全面(具体手段的效果和取舍,只有真实数据实验后才能知道)
    1. 机器学习轻量模型
    2. llm生成规则库的算法
      1. llm生成排查风险画像代码(这个可以作为全黑命中)
  2. 低置信度&灰色风险的复杂研判(本身就有复杂场景下的风险不能实时判断)
    1. 上面的每种手段,可能都会涉及存在某些低置信度场景(灰色风险)
    2. 利用数据集微调过后的llm进行灰色风险的研判

2.3 近线检测场景

因为业务复杂度、实现成本、时间跨度等多方面原因,很多业务难以在实时引擎完成

  1. 薅羊毛:注册+登陆+交易多行为判断
  2. 涉黄、涉政:需要结合多维度信息判断