导    读

  它山之石,可以攻玉。为了帮助各界人士学习国外先进经验,进一步了解大数据市场的定价、交易与保护,国脉战略研究院专家杨冰之、林渠,带来了《大数据市场调查:定价、交易与保护》的翻译文章,相信会给大家以思想的碰撞、灵感的启迪,促进大家思考,从而为我国推进数据要素市场化配置改革,贡献国脉战略研究院的智慧。本文为《大数据市场调查:定价、交易与保护》连载系列文章第四篇。

  大数据继续呈指数级增长。随着大数据的增长和大数据驱动应用的发展,数据本身变得更有价值。如前所述,数据挖掘和机器学习过程可以在充分和全面的数据样本基础上从数据集中产生商业价值。因此大数据成为一种新的数据资产,需要有效、公平的评估和定价方法。在本节,我们首先讲述现有的数据定价模型。然后,我们对这些定价模型进行分类,并讨论每种模型的优缺点。

  A. 数字商品定价原理

  数据可以看作是一种在市场上买卖的数字商品。经济学中对实物商品交易的早期研究表明,实物商品价格的差异主要取决于产品线的特征差异。该模型由穆萨(Mussa)和罗森(Rosen)于1978年提出,命名为垂直分割或质量分割。在这个模型中,因为价格相同,消费者显然更喜欢质量较高的商品,而不是质量较低的商品。为了满足不同的消费者,生产商通常提供不同质量水平的产品。一般来说,生产者必须考虑增量成本和质量成本来决定产品的分化。例如,在信息技术产品公司中,通常对不同级别的产品提供不同价格,所采用的价格涵盖从高到低的大部分价位。与实物商品交易的研究一样,人们更加关注数字和信息商品的质量差异。因此,基于不同版本的策略是确定数字商品价格的一种常见方法。

  此外,对于实物商品生产,再生产成本是需要考虑的主要成本之一。而对于数字商品生产,再生产成本几乎为零(版本控制、完整性检查、维护等)。因此,衡量数字商品商业价格的因素是开发成本、配置或分析成本以及维护成本。同时,为了满足不同的消费者,数字商品的价格也需要差异化。例如,原始或预处理的气候记录数据集可以通过使用精度的不同、时间频率等重新打包成不同级别的产品。这些具有不同价格和功能的数据集可以满足不同的消费者需求。我们在研究当前大数据定价策略的基础上,将现有的定价策略分为下面不同类别。

  B. 数据市场结构

  正如我们所知,市场结构决定了实物商品交易的价格,数据市场也是如此,在数据市场中,这些结构同样会影响数据价格。因此,总结数据市场结构是数据定价的第一步。我们将市场结构罗列在表1中。

图片

  (表一)

  在垄断结构中,同一数据集将由不同的垄断者进行分析或生成。换句话说,不同质量和水平的商品是基于相同的原始数据集生产的,我们称之为数据商品。为此,垄断者有足够的权力增加数据商品的利润。通常,这些垄断者不是为所有数据商品设定单一价格,而是根据数据商品的质量和细节设定不同的价格点,以满足消费者对不同层次的需求。这种策略被定义为价格歧视。尽管如此,垄断者通常会先隐藏这些把戏,并试图调查消费者的偏好。在数据市场中,垄断者通常设定参考价格,并监控消费者的反应。根据此参考价格,以及价格的轻微增减,垄断者能够细化需求模型和价格函数。而这会将数据商品的利润最大化。

  在竞争中,大多数垄断者失去了市场地位,只有少数胜利者幸存下来。这些赢家大多控制着市场资源,这导致了寡头垄断结构。特别是在数据市场中,原始数据集只属于少数所有者。为此,数据所有者有很强的能力控制机器学习和数据挖掘过程、市场价格、竞争和机会,在数据市场中实现最大利润。尽管如此,这种数据市场结构是病态的,不可能使数据市场繁荣起来,寡头垄断严重影响消费者的需求和供应商的服务。此外,缺乏竞争会导致数据市场疲软。

  在强竞争结构的情况下,销售价格应接近边际成本,以增加市场透明度。它给消费者带来了诸多好处,如降低价格和提供更好的服务。尽管如此,从长远来看,这种结构可能会产生问题,因为所有的竞争都将导致利润减少。为了在激烈的竞争结构中销售更多的商品,所有者必须尽可能降低销售价格,这肯定会减少所有者的利润,从而减少竞争对手的数量。与数据市场尤其相关的是,强大的竞争结构通常出现在新兴市场,这些领域的市场准入门槛较低。因此,许多所有者以同质化和劣质产品参与市场,实际上它们没有竞争力,因此只有降低销售价格才能为数据商品提供有效的竞争力,竞争性降价将导致激烈的竞争和市场萎缩。

  C. 数据定价策略

  通常,考虑成本是商品定价的唯一规则,尤其是对于数字商品。事实上,只考虑成本是一种常见的缺陷,它应该只是合理定价的一个因素。成熟的定价策略将是利润最大化而不是降低成本。因此,选择合适的定价策略很重要。有多种方法可以用于不同生产商或公司确定其定价策略。例如,马斯切利特(Muschalleetal)针对数据市场将不同类型的数据定价策略分为以下六大类。

  自由数据策略(Free Data Strategy)是在线发布数据及在公共存储中共享数据,交易不是免费数据的目标。例如,数据样本、低精度数据和公共数据库就是免费数据的例子。免费数据可以吸引一些对购买完整数据集犹豫不决的潜在客户,刺激消费。同时,免费数据定价模型具有灵活性。根据需求,数据所有者可以将免费数据策略调整为其他定价策略,以实现数据所有者利润最大化。

  基于使用的定价策略(Usage-Based Pricing Strategy)指统计数据流使用情况和服务时间的策略。该策略涉及一些主要市场行为。例如,移动电话运营商最初根据每个用户的使用情况销售数据服务。这些公司每月统计数据使用情况并计算价格。同样地,网络供应商向用户提供互联网服务,计算服务时间和价格。近年来,服务提供商将数据使用和服务时间合并在一起,从而动态地改变了价格。它们将高峰时间和使用情况结合起来考虑,这对于数据和服务的定价来说更合理。

  套餐定价策略(Package Pricing Strategy)是一种增强版的基于使用情况的定价策略。一些供应商,如T-mobile、Verizon等,提供固定价格的数据包计划。套餐定价策略是根据大量基于使用的定价策略的研究成果和收集的数据制定的。为了使供应商的利润最大化,需要进行额外的工作,包括用户使用分析、高峰时间监控、网络流量控制等。供应商可以根据研究结果为其数字商品和服务创建合理的定价模型。套餐定价优化是当前一个非常热门的研究课题。

  单位定价策略(Flat Pricing Strategy)是最简单的定价策略。在这种策略中,时间是唯一的参数,供应商只需考虑将每个数字商品销售一次。这种定价策略通常用于软件许可和托管。此外,使用统一定价策略便于供应商预期利润,并制定未来计划和活动。尽管如此,统一定价对消费者来说缺乏灵活性和多样性。

  二部定价策略(Two-Part Tariff Strategy)是套餐定价和统一定价策略的组合。在这种情况下,消费者需要支付的总价格包含两部分。第一是软件许可证的固定费用,第二是固定服务和数据支持。这一策略被网络服务提供商、移动电话运营商、软件公司等广泛使用。这些公司首先以固定价格销售其数字产品,第二部分包括服务费、更新费或固定套餐以外的数据使用费。

  免费策略(Freemium Strategy)是近年来许多供应商大量采用的新战略。这种定价策略的主要思想是免费向消费者提供基本产品或有限服务。同时,供应商还以一定的成本向消费者提供增值服务(优质服务)。优质服务的定价策略可以是上面列出的任何策略。这种策略经常被小公司采用,比如苹果和谷歌Play商店的小型开发商。它们将产品上传到商店,免费下载。尽管如此,全功能版本需要额外费用才能解锁。

  鉴于上述策略,为数据商品设计定价模型需要同时考虑数据市场结构和数据定价策略。现有的一些数据定价模型只考虑市场结构,如拍卖、基于成本的定价等,而另一些则涉及分布式数据存储结构(云计算、边缘计算等)和物联网辅助。我们将在下面进行更详细的讨论。

  D. 数据定价模型

  数据定价的主要考虑因素是数据收集成本、数据分析成本、数据管理成本以及消费者需求。在上述市场结构和定价策略之后,图2将定价模型分为两大类:(i)基于经济的定价模型和(ii)基于博弈论的定价模型。下面,我们首先介绍数据定价的关键因素及其挑战,然后详细描述数据定价模型。

 图片

  (图2.数据定价模型)

  1) 数据定价的主要因素和挑战

  数据作为一种独特的商品,具有许多普通实物商品不具有的特征。以下是数字数据集定价面临的挑战。

  不同的数据来源:随着数十亿智能个人设备和传感器的涌现,物联网驱动的智能系统已成为贡献数据的主要基础设施。不同的设备和相关的部署成本可能对评估收集成本构成重大挑战。同时,收集的数据类型多样,难以分类和评价。而如何激励这些设备的所有者贡献和共享收集的数据也是额外的挑战。

  数据管理的复杂性:大数据创造了不断增长的巨大数据量。因此如何管理(分析、存储、更新等)数据是数据定价的另一个挑战。事实上,维护大数据的成本很高。从技术角度来看,大多数大数据都存储在云或边缘存储中,维护存储和数据可用性以及保护数据会带来高昂的成本。这些过程也很难评估和定价。同时,原始数据在可利用之前需要进行分析,开发分析数据集的高效应用程序也是评估数据定价的因素。

  数据的多样性:为了销售数据集,供应商通常处理原始数据以满足各种需求。这种方法为定价评估提出了许多复杂的问题。例如,需要重新生成原始数据集,并将其按不同体积、精度和类型划分为不同级别。那么,如何评估不同商品的价格仍然是一个具有挑战性的问题。

  关于如何应对这些挑战有许多研究。例如,物联网为数据收集提供了最重要的网络基础设施,数十亿台设备自动运行,在不同领域不断收集数据。因此,为了量化数据收集的成本并处理不同的数据源,我们需要了解物联网的工作原理,并鼓励所有组件在物联网中提供更好的性能。为了鼓励传感器上传数据并为传感器所有者实现更好的利润,适当的定价模型变得更加关键。引入定价机制是鼓励所有者贡献自己数据的一种可行方法。定价机制调整价格和付款计划,以保证足够的参与规模,并提升数据服务、数据准确性和数据覆盖率。

  根据不同的场景,有几种不同的定价策略用于评估成本。最常见的策略是基于经济的定价,它建立了基于经济原则的价格模型。第二种策略是基于博弈论的定价。在这种策略中,价格模型考虑到价格受竞争的影响,是动态的。

  2) 基于经济的定价模型

  基于经济的定价模型基于经济原则。下面,我们将详细介绍数据定价的经典经济概念。

  成本模型:它考虑任何商品的总成本,并将总成本的比率设定为利润。我们假设 I 为期望收入,C 为总成本,p 为利润百分比。等式 I = C (1 + p) 表示成本和收入之间的关系。成本通常包括商品的固定成本和可变成本。一般来说,固定成本是资源成本、设备成本、能源消耗等。可变成本包括劳动力成本、开发成本和其他成本。这种定价模型的优点是简单,因为它只考虑内部因素来决定售价。另一方面,不考虑外部因素,如竞争和需求,对该定价模型并不利。

  消费者感知模型:由于基于成本的定价模式容易被竞争对手模仿和复制,从长远来看,供应商需要考虑消费者的反馈。特别是对于数字商品,其再生产成本几乎为零,因此使用感知定价模型更可靠。消费者感知价格由所有消费者愿意支付的价格决定。哈蒙(Harmon)等人提出了影响数据定价的五个主要因素,以Pv=(Vp,Vc,Vm,Vs,Ve)表示。这里,Vp表示基于消费者反馈数据的性能。关键因素是效用,效用是对购买商品或服务的消费者的满意度测量。因此在数字市场领域,这是供应商满足消费者的价格准确性的最重要因素。另外,Vc是可能影响消费者行为的市场环境因素,Vm是消费者愿意购买数字商品的动机,Vs是供应商价值,代表供应商的信用和消费者的主要反馈,Ve代表经济价值,这取决于消费者的需求,以及消费者对价格的感知。

  供求模型:供应商和消费者之间的关系是商业模式的一部分。根据这种关系,市场决定商品的价格。在经济学领域,供求函数被用来表示这种关系。在市场中,P表示商品的价格,Q表示商品的数量。因此,我们有两个线性函数来记录这种关系。方程 P = a ? b · Qs是供给函数;P = c ? d ·Qd是需求函数。这里,a、b、c和d是系数,并且b大于d。根据这两个方程,我们可以建立供需关系,如图3所示。

图片

  (图3.供求函数)

  如图所示,橙色线表示供给函数,绿色线表示需求函数。供应商和消费者之间的行为是平衡的。从图中我们可以看到,橙色线比绿色线有更高的坡度,因此必然有一个交叉点。这个交叉点是供应商和消费者的平衡条件。在这一点,我们从方程中获得P: (P?a )/b = (P?c)/ d ;和Q: a ? b · Qd = c ? d · Qs。

  该模型有两个基本特征:(i)这是供应商和消费者之间的一致行为,以及(ii)供应商和消费者不能改变这一过程,决策过程由市场决定。因此,这种模式保证了市场的公平性。

  差别定价模式:为了满足商品的各种需求,供应商应提供各种具有不同特性的商品。差异定价模型考虑到这些商品之间的差异,提出了不同的价格。例如,高精度数据包的价格应高于低精度数据包,全功能数字应用程序的价格也应高于演示版应用程序。

  动态数据定价(智能数据定价)模型:这是差异定价模型的特例,以避免需求和数据流峰值,它也被称为智能数据定价模型(SDP)。动态数据定价模型监控市场并评估系统是忙还是闲。通过评估,可以动态调整数字商品的价格,从而节省供应商的资源和消费者的资金。此外,实现这一目标有两个主要机制。第一种是基于时间的定价,第二种是基于使用情况的定价。对于基于时间的定价机制,价格将随时间而变化。例如,网络供应商通常在夜间提供较低的数据价格,以鼓励消费者在非高峰时间使用网络服务,并阻止在高峰需求期间使用。同样,基于使用情况的定价机制将根据数据使用情况改变定价。

  3) 基于博弈论的定价模型

  博弈论是定价和市场领域的一种有用方法,尤其是在数据商品的定价中。在下文,我们首先介绍三种不同的博弈论方案,用于数据定价模型:(i)非合作博弈(Non-cooperative game,),(ii)斯塔克伯格博弈(Stackelberg game),以及(iii)讨价还价博弈(Bargaining game)。然后,我们将讨论如何使用这些博弈论方案对数字数据商品进行定价。

  a:非合作博弈

  在非合作博弈中,假设所有参与者彼此不合作。为了具体说明非合作博弈,介绍一些术语:(i)参与者(player)是参与博弈并做出决定的个人;(ii)回报(Payoff)是实际利益或效用,代表参与者的预期结果;(iii)合理性(Rationality)描述了所有参与者都希望在博弈过程中保持其个人最大利益的情况;(iv)策略(Strategy)是参与者采取的行为,每个参与者的策略可能不同。支付结果不仅仅只受一种博弈的影响,还会受到其他博弈的影响。

  研究人员设计了一个定价模型来评估物联网传感数据。在该模型中,所有供应商都以竞争的方式销售其数据,并将该模型定义为非合作博弈。供应商扮演参与者的角色,他们决定定价策略。将(V,π)表示为一个n个参与者(卖家)的博弈,其中Vi表示参与者i使用的定价策略。V 是每个策略集的笛卡尔积:V = V1 ·V2 ·V3 ···Vn,而 πi 是代表卖方 i 收益的向量。


图片

  从这个不平等性中,我们知道纳什均衡中的参与者没有动机改变他们的定价策略,因为这会导致更糟糕的回报。因此,实现纳什均衡是解决问题的唯一途径。注意,在某些条件下不存在纳什均衡,有时在相反的条件下存在多个纳什均衡。因此,找到纳什均衡且博弈只有一个纳什均衡是利用非合作博弈对数据集定价的充分必要条件。

  b:斯塔克伯格(Stackelberg)博弈

  在非合作博弈模型中,所有参与者都必须发布一个定价策略,并且定价策略是透明的。尽管如此,这在真实的数字市场中并不总是正确的,因为参与者无法计算纳什均衡。因此,他们不能给数字商品定价。相反,参与者需要等其他参与者宣布它们的定价策略。例如,当移动运营商向他们出售数据计划时,他们显然需要考虑竞争对手的价格。因此,移动运营商越晚宣布其定价策略,性能就越好。这是一个典型的斯塔克伯格(Stackelberg)博弈模型。

  哈达迪(Haddadi)和加塞米(Ghasemi)提出了Stackelberg博弈模型,以保护宣布其定价策略的参与者。它定义了两个位置,领导者和追随者。假设一个市场中有两个参与者,V1和V2是参与者1和2的定价策略集。如果参与者2首先宣布V2,那么参与者2将是领导者,参与者1将是追随者。使用Stackelberg博弈,他们证明了领导者可以获得比使用其他模型更好的回报。请注意,将Stackelberg博弈引入数字市场可以使所有参与者的收益最大化,尤其是领导者的收益。此外,现有研究表明,在频谱交易和资源分配中使用Stackelberg博弈模型,可以提高物联网系统的网络性能和稳健性。

  c:讨价还价博弈

  最后一个方案是讨价还价博弈。这种博弈论指的是销售商和消费者达成协议的一种情况,为了达成这一协议,销售商和消费者需要进行协商。在简单的数字市场中,只有当供应商和消费者就某种商品的销售价格达成一致时,交易才会发生。

  在这个定价模型中,将rv表示为确保供应商获得可接受的收益的保留价格。同样,消费者还提供rc作为消费者愿意购买的保留价格。同时,与其他博弈理论类似,供应商和消费者都提交了他们的定价策略Pv和Pc。

  图片

  由于讨价还价博弈是解决复杂谈判条件的适当方案,因此它通常用于数据拍卖、网络资源拍卖。

  最后,我们整理了现有的数据定价模型,见表2。

图片

  (表2. 定价数据模型)

  总之,在本章节,我们对数据定价进行了全面概述,并阐述了与大数据定价相关的主要概念,如数字商品定价原则、数据市场结构和数据定价策略。我们还详细解释了基于经济的定价模型和基于博弈论的定价模型。尽管如此,大数据的模型相对较少,大多数最先进的定价模型都是针对传统商品进行研究的。作为未来的研究方向,应在大数据科学方面做出更多努力,以了解不同类型的数据,并设计适当的模型,实现不同类型数据用户的精准性。

更多精彩,请关注“官方微信”

11.jpg

 关于国脉 

国脉,是大数据治理、数字政府、营商环境、数字经济、政务服务专业提供商。创新提出"软件+咨询+数据+平台+创新业务"五位一体服务模型,拥有超能城市APP营商环境流程再造系统、营商环境督查与考核评估系统、政策智能服务系统、数据基因、数据母体等几十项软件产品,长期为中国智慧城市、智慧政府和智慧企业提供专业咨询规划和数据服务,广泛服务于发改委、营商环境局、考核办、大数据局、行政审批局等政府客户、中央企业和高等院校。

责任编辑:wuwenfei