近日,知名快递公司顺丰和电商巨头阿里巴巴争端甚嚣尘上,这次争端意味着“数据”已然成为商业必争的“资产”。因此,伴随大数据时代来临,数据获取、存储、分析等一系列技术的研发和应用已经得到了众多企业的关注。

 
  作为大数据开发利用的重要组成部分,就数据存储而言,图数据库是利用图的特性来对数据进行存储管理,并对传统图的概念进行了扩展。越来越成熟的数据模型,使得利用事物(即“节点”或“实体”)及事物之间的联系(即“边”或“关系”)来对各类业务场景进行抽象变得更加容易。也正因为图数据库基于图论的理论和算法实现,相对于关系型数据库,它也更擅于处理网状的复杂关系。此外,图数据库通常都支持对图数据模型的增、删、改、查(CRUD)方法,并较多地用于事务(OLTP)系统中,被应用系统实时访问。
 
  图数据库作为恒昌知识图谱的底层存储方案,是多方数据的知识融合及提炼后进行汇聚的场所,为恒昌丰富的服务线与数据技术间的承转起着重要作用。由于Neo4j 是目前最成熟的图数据库之一,恒昌广泛使用 Neo4j 作为知识图谱底层图数据持久方案,基于其优异的事务能力而提供实时的数据查询功能。此外,恒昌还在 Titan、Gaffer 等分布式图数据库或计算引擎上有着深入的研究。
 
  目前,恒昌的图数据库已经融合了多方数据,包括业务系统主要服务线各阶段的数据、用户授权数据等。这些数据形成的实体规模已过亿、形成的关系已多达数十亿。随着用户数量的提升,这个数据还在持续增长。因此,基于图数据库开发的知识图谱正在发挥着越来越大的作用,目前已经上线或待上线的技术平台覆盖了客户失联修复、反欺诈规则引擎、欺诈团伙调查等,近期还会覆盖风险预警等方向。
责任编辑:admin