恒昌：数亿实体和数十亿关系的图数据库在风控上应用_最新动态

　　2.风险事件预警

　　尽管对欺诈团伙调查能取得不错效果，但因其可能需要调查员随时联系客户或联系周边人群以验证调查员的推论，因此整体成本还是相当高的。为了解决这个问题，基于模型的风险事件预警就应运而生。如果说欺诈团伙调查是主动出击，风险事件预警更像是被动防御。

　　风险事件预警是通过模型生成一组类似上述欺诈团伙调查中出现的场景，给每一个场景一个相对低一些的初始置信度，后期通过不断的反馈迭代来优化置信度。当一个新客户到来之后，首先会将其信息整合到知识图谱中。紧接着，该客户会被规则引擎捕捉到，规则引擎会基于客户信息从知识图谱中提取一组特征，由该特征决定了引擎首先会触发哪些场景，而这些场景的结论可能导致规则引擎又触发另外一组场景。在满足特定条件下，最终结果输出，如果有相应的风险事件被触发，则信息会送达相关团队。

　　风险事件预警最有意思的地方在于，一个新客户的到来，可能会导致一个早先客户的风险事件被触发。这主要是因为新客户融入到知识图谱中时带进的新数据，可能会让图谱中的某些子网的结构发生彻底的改变。目前恒昌采用一组启发式的算法来扩展新进客户的影响，效果显著。这也意味着，风险事件预警并非只针对贷前风险事件，还会将贷后风险事件作为预警。比如触发了某个老客户的潜在逾期风险时，就可以引导相关团队提前关注，在情况恶化前及时止损。

　　3.失联修复

　　如果客户奔着欺诈而来，那几乎也注定了后续无法联系上，称此类失联为“第一类失联”。“失联”是无法完全避免的，主要是因为失联的成本很低。即使客户自身“消失”的意愿不高，但换手机号、搬家、换公司都可能导致客户及其联系人完全联系不上，称此类为“第二类失联”。

　　将图数据库应用于失联修复是非常直观的，因为图数据库在数据丰富的条件下能非常方便地进行各类关系的提取。恒昌的失联修复项目结合了知识图谱（基于图数据库）及传统的机器学习技术，前者作为修复策略的具体联系方式来源，后者作为策略有效性的评估依据。目前，恒昌能做到失联客户实时修复，修复专员完成具体操作后会有相应的备注及日志信息，这些数据会被实时收集用于改进修复策略。

　　本文仅拿众多策略中较为容易理解的一条来略作说明，这条策略主要是从图数据库中提取和失联客户处于同一公司，且当前住址与失联客户接近的用户作为修复中间人。虽然是一条简单的策略，但深入思考会发现，国内有很多规模不小的工厂会吸引周边村子的人去工作，而这些村子可能本身规模也不小，这样修复中间人不见得认识失联人。因此这条简单的策略背后也需要有一个启发式算法，通过公司/工厂的规模来调整当前住址需要匹配的粒度（比如，是到村、到组、还是得具体到门牌相邻）。更进一步，如果在此基础之上，修复中间人和失联人有过通话记录往来或是有通讯录关联（事实的条件远比这个复杂），就大幅增加了该修复中间人的置信度，甚至可以基于此条件在图数据库查询过程中提前中止，直接返回相关结论。以上操作基于图数据库可以将数据一次取出再进行处理，基本是毫秒级响应，如果触发了提前中止，耗时可能更短。但如果基于关系型数据库，首先会涉及多张业务表的检索、关联，其次还可能按照初次处理结果多次连接数据库，造成数据库资源的浪费。

　　实际中，恒昌通常会混合使用多种数据库，以利用它们各自的特点来创建一个数据生态系统。除了图数据库外，大规模的用户授权数据会让恒昌在底层配上分布式的列式存储或键值存储库。但回归根本，恒昌期望为客户提供高效、安全的财富管理及借款信息咨询与服务，就需要优秀的风险控制作为保障。而这，恰恰也是图数据库能最大程度发挥价值的领域之一。

首页上一页 1 2 3 末页

责任编辑：admin

关注国脉电子政务网，政府CIO的思想阵地与交流平台，5000位政府CIO在这里读懂“互联网+政务”