自主学习型算法共谋的事前预防与监管*

作者:王健 吴宗泽  2021-08-30 15:51  新传播    【字号:  

近年基于人工智能技术的自主学习型算法在信息推荐、动态定价情境下显现出如价格歧视、性别歧视等异常,逐渐引发学界对自主学习型算法问题的担忧。囿于自主学习型算法的不透明性及行为隐蔽性,往往难以在反垄断执法、司法层面对其予以及时、有效规制。因而须依据自主学习型算法自身特点构筑起合法、有效的事前管控路径,从技术监管、数据控制、算法审核等层面对自主学习型算法加以规制,及时遏止自主学习型算法共谋不当影响的出现和扩张。

[摘 要]近年基于人工智能技术的自主学习型算法在信息推荐、动态定价情境下显现出如价格歧视、性别歧视等异常,逐渐引发学界对自主学习型算法问题的担忧。囿于自主学习型算法的不透明性及行为隐蔽性,往往难以在反垄断执法、司法层面对其予以及时、有效规制。因而须依据自主学习型算法自身特点构筑起合法、有效的事前管控路径,从技术监管、数据控制、算法审核等层面对自主学习型算法加以规制,及时遏止自主学习型算法共谋不当影响的出现和扩张。

[关键词]人工智能 算法共谋 技术监管 事前管控 反垄断法

[中图分类号] D912.29;TP18  [文献标识码] A  [文章编号]1671-3575(2020)02-0147-12

大数据、云计算等技术的逐步成熟,使得复杂计算机算法在商业上的普及应用成为可能。越来越多的企业开始使用计算机算法改进产品的定价模型、服务策略并预测市场变化趋势,商品定价也呈现出由统一定价模式逐渐过渡至差异化定价、动态定价模式的倾向。欧洲委员会于2017年5月10日发布的《Final Report on E-Commerce Sector Inquiry》(《欧洲委员会:电子商务产业调查总结报告》)显示,约有53%的受访零售商表示会采取一定措施监控竞争对手的在线价格,其中约67%的受访零售商会选择借助自动化软件来进行价格监控。[1]但在算法广泛应用的同时,近年Spencer Meyer v. Travis Kalanick、U.S. v. David Topkins等相关算法共谋案例也引发学界对算法反竞争效应的思考。基于计算机算法的功能差异,学界大体将其划分为信号算法、监管算法、平行算法、预测算法四种。随着人工智能技术的发展以及大数据、云计算等底层技术的成熟,自主学习型算法(Self-Learning Algorithms)如今也值得充分重视。虽然部分自主学习型算法在功能细分上仍不外乎前述信号、监管、预测等,但由于机器学习等人工智能算法的输出过程并不会有明确的行为依据(即代码指令),其输出过程即便对于设计者、使用者而言都如同“黑箱”一般不可获知。考虑到算法运行方式的独特性,需要将自主学习型算法较其他算法进行单独区分。


*本文为国家社会科学基金重点项目“反垄断法制裁的现代化研究”(18AFX019)的阶段性成果。

[1]European Commission, Final Report on the E-Commerce Sector Inquiry, Commission Staff Working Document, SWD (2017)154 Final,2017.


自主学习型算法依据人工智能技术使用程度的不同,可分为不纯粹自主学习型算法与纯粹自主学习型算法。不纯粹自主学习型算法指设计者在设计算法时局部采用人工智能技术,如只在构建市场价格预测模型时采用机器学习算法。从形成共谋的方式看,总体而言不纯粹自主学习型算法仅部分采用人工智能技术,实际使用过程中还需要依赖使用者的具体操作。因此在不纯粹自主学习型算法共谋情境下,不纯粹自主学习型算法仅仅是作为使用者实施共谋行为的辅助工具,使用者对其的控制程度仍维持在较高水平。而当市场信息透明度、算力水平达到一定程度的情况下,设计者则可在设计算法时整体采用人工智能技术生成相应模型,这类整体采用人工智能技术的计算机算法可称为纯粹自主学习型算法。在纯粹自主学习型算法共谋情境下,由于整体输出过程均缺乏明确、可修正的行为依据,故此种共谋自主化程度较高且难以为使用者直接控制。纯粹自主学习型算法在实际运作时能够借助分析历史数据、反复试错等方式掌握更为复杂的合谋方式,通常可集合信号算法、监管算法、预测算法等算法的特点自主达成产量层面、竞标层面、销售层面等不同于以往的垄断形式。如在票务在线预订平台等市场信息透明度较高的市场,纯粹自主学习型算法能够在缺乏明确沟通的情况下通过发出价格信号、惩罚背离行为等方法主动开展并维持价格共谋。又如在移动出行平台等算法相似度较高的市场,纯粹自主学习型算法能够基于消费者画像对不同消费者采取差异化定价。有报告显示,优步(Uber)平台曾在一段时期内表现出向不常匹配平台订单的用户设置更高价格的倾向(Surge Pricing)—即在各用户所在地理位置相近的情况下,以往不常匹配平台订单的用户所得到订单价格将高于常匹配平台订单的用户。[2]这些共谋情形将在一定程度上扩大共谋市场范围、提高市场进入壁垒、产生行为歧视、降低消费者福利,对市场公平竞争秩序、消费者权益以及经济运行效率等都构成足够威胁。


[2]Le Chen, Alan Mislove and Christo Wilson,"Peeking Beneath the Hood of Uber", The ACM Conference, Japan,2015.


一、自主学习型算法共谋的特殊性

(一)主观意识的弱化

非自主学习型算法共谋多是由设计者、使用者等主体事先就如何达成共谋制定出策略机制,使得算法能够在一定条件下执行。从本质上看,此类算法共谋与反垄断法以往所规制的合谋行为并无不同。美国联邦贸易委员会专员Ohlhausen就指出,“如果‘算法’这个词能被任意一个人名所替换,则执法机构可以像处理以往其他反垄断案件一样处理这类算法共谋”。[3]而自主学习型算法共谋事实上是算法基于利益最大化的既定目标,依据供需关系、成本费用、产品产量、产品差异等相似的市场信息对价格设定、产量设置等行为自主作出近似或相同的预判。自主学习型算法的而设计框架并不需要明确的参数或公式作为实现共谋的基础,设计者、使用者等主体通过算法设计环节对自主学习型算法施加影响的程度较其他算法类型更为有限。脸书人工智能研究院(Facebook AI Research, NY)的一篇研究报告就指出,强化学习算法并不需要算法设计者特定的设计就可以表现出一定程度的合作行为。倘若条件足够理想,自主学习型算法将有可能仅仅在基础设计框架下就自主衍生出平行行为。[4]

就自主学习型算法的操作过程而言,其过程主观意识的弱化程度亦极为明显。如在共谋合作对象的选择上,自主学习型算法多以价格信号或单边公告的方式主动进行匹配,其选择范围较以往共谋类型更为广泛、随机、不特定。当自主学习型算法自主性达到一定程度时,算法操作层面的控制程度将得到进一步弱化:自主学习型算法能够基于市场信息反复预测、评估并独立作出信号、监管及平行行为,当合作行为产生的收益超出自主学习型算法所期望的阈值则会自主展开合作。设计者、使用者等主体的意志因无法直接参与共谋实施过程而难以得到具体体现,如何认定各共谋参与者的合谋意思将变得更为困难。


[3]Schwalbe Ulrich,"Algorithms, Machine Learning, and Collusion", SSRN Electronic Journal,2018.

[4]Adam Lerer and Alexander Peysakhovich,"Maintaining Cooperation in Complex Social Dilemmas Using Deep Reinforcement Learning", Cornell U.Libr., Working Paper,2018:8.


(二)共谋状态的稳定

算法共谋状态的稳定程度,通常取决于行为隐蔽程度高低、惩罚能力强弱、共谋弹性大小等因素。从行为隐蔽程度的角度看,一般情况下借助算法实施的合谋行为在达成价格、产量一致前往往依赖于事先约定、预设固定的参数或公式,其合谋意思表示较为外显、明确。此外,一些算法共谋常体现出明显的跟随性—如2011年亚马逊平台书商在销售《The Making of A Fly》图书时利用算法相互参照对方定价,进而陷入循环定价的窘境。[5]而自主学习型算法在达成共谋时通常不需要明确一致的公式、参数,且能够依据市场动态情况主动调整共谋价格并达成共谋合意,使得欲达成合谋的经营者在面对监管时保持较好的隐蔽进而维持共谋的稳定。目前多数算法共谋虽仍需要设计者、使用者经由某些外显的方式进行引导,但部分算法在实验室环境中已表现出一定程度的自主交流、协作能力。如Jacob等学者基于强化学习设计的算法“S++”可以基于预设的信号模块与其他算法(甚至人类玩家)在游戏中进行协作,并在多个测试中保持较高水平的性能。“S++”甚至会随着游戏复杂程度的提升而使用一些复合动作传递合作讯息,而人类玩家通常难以理解且不会采用这类复合动作作为传递讯息的方式。[6]这些复合动作若实施在实际市场情境下,则意味着自主学习型算法共谋的隐蔽性将进一步提升。


[5]施春风:《定价算法在网络交易中的反垄断法律规制》,《河北法学》,2018年第11期。

[6]Jacob W. Crandall and others,"Cooperating with Machine", Nature Communications,2018:3.


考虑到背离行为会造成共谋参与者的利润损失,识别背离行为并及时作出反制的能力是达成共谋的必然要求。依托大数据、爬虫等相关技术,现有算法也能在有限程度上满足这一需求。比如采用“以牙还牙”(Tit-For-Tat)策略,共谋参与者能够采用价格跟随行为对私自调整定价或库存的行为作出及时响应。因而背离行为所能够产生的利润空间实际上已经被大幅压缩,共谋参与者间的监管、惩罚行为在实际操作中仅仅是“威胁”意义上的存在。但简单采取价格跟随行为容易衍生出另一问题,即是背离行为发生后共谋参与者因无法及时返回合作而造成利润损失。鉴于上述情况,如何在背离行为发生后及时返回合作关键对于自主学习型算法共谋而言则显得更为关键。脸书人工智能研究院(Facebook AI Research, NY)近期提出,在信息流较为充分的情况下采用附条件的结果主义合作算法(Consequentialist Conditional Cooperation)对历史信息进行分析,可以有效避免背离行为发生后难以再次达成共谋的缺陷。[7]具体而言,附条件的结果主义合作算法能够基于历史对局信息对对手行为、次回合收益进行实时评估,当合作行为预期产生的收益超出算法的期望阈值时则重新进行合作。


[7]Alexander Peysakhovich and Adam Lerer,"Consequentialist Conditional Cooperation in Social Dilemmas with Imperfect Information", Cornell U.Libr., Working Paper,2018:2.


(三)共谋情形的多样

算法共谋普遍需要共谋参与者共同就共谋行为的实施方式、实施条件等内容达成一致,据此协调共谋行为并确保共谋状态持续稳定。因而算法共谋通常存在于直接竞争的经营者之间,多以横向合谋的形式出现。但在自主学习型算法共谋的情境下,共谋参与者往往能够经由互联网平台、开源数据库、第三方设计者等各类主体达成共谋。其直接影响是达成共谋所需要的市场条件逐步降低、市场竞争者数量与形成共谋的关联关系进一步弱化,使得经营者达成共谋的市场范围趋于扩张。[8]囿于现阶段并未出现特征较明显的自主学习型算法共谋案例,故此处仅例举相似情形以供参照。

1.基于第三方算法设计者或代理商的共谋情形  由于自主学习型算法设计的专业化程度较高,故市场经营者多会选择将自主学习型算法设计任务外包第三方设计者或直接使用第三方代理商算法以降低经营成本。如若多个存在直接竞争关系的经营者均使用同一第三方设计者或代理商提供的自主学习型算法,算法架构甚至代码层面的相似则会促使自主学习型算法共谋的形成。这在相关的计算机算法实验中也有所体现,如附条件的结果主义合作算法在自我合作时会较与其他算法合作时获得更好的收益率;[9]“S++”算法在自我合作时除收益率更优外,还表现出达成合作更快、维持合作更久等特点。[10]在Eturas et al. v. Lietuvos Respublikos Konkurencijos Taryba案中,涉案旅行社均使用由第三方算法代理商Eturas提供服务的在线预订系统。因在线预订系统对折扣率的技术限制,各旅行社向消费者提供的折扣率被强制保持在3%以内。[11]立陶宛竞争委员会认为涉案旅行社通过默示的方式作出共谋的意思表示,间接达成价格层面的协同。即便Eturas作为不参与相关市场竞争的第三方算法代理商,其仍然应当为便利价格协同行为而受到处罚。[12]


[8]周围:《算法共谋的反垄断法规制》,《法学》,2020年第1期。

[9]Alexander Peysakhovich and Adam Lerer,"Consequentialist Conditional Cooperation in Social Dilemmas with Imperfect Information".

[10]Jacob W. Crandall and others,"Cooperating with Machine". 

[11]HaVu, K. A. & Zupancic N.,"Case Comment: Collusion and Online Platforms in Eturas",11, Competition Law Review,2016.

[12]Eturas, C-74/14, ECLI:EU:C:2016:42.


2.基于开源数据库的共谋情形  接入自主学习型算法的市场信息相似与否以及特殊信息有无都将对自主学习型算法的评估、预测行为产生影响,从而阻碍共谋的形成。为进一步促进自主学习型算法共谋的形成,较为直接的方式是共谋参与者相互开源数据库接口或共用某一开源数据库。如西班牙国家市场与竞争委员会(CNMC)于2019年4月12日发布的报告称,西班牙最主要的烟草批发商Logista基于其市场支配地位[13]搭建了可以每日发布烟草销售相关信息的计算机应用程序。基于烟草销售相关信息的共享,与Logista签订分销合同的各烟草制造商自2008年以来产品价格保持着高度一致。[14]该情形下的另一表现形式是预先就开源数据库内某一特殊信息进行协调,以该信息作为共谋信号。如美国司法部就曾在Spencer Meyer v. Travis Kalanick案件调查报告中指出,美国各航空公司会依据美国航空票务信息发行公司(Airline Tariff Publishing Co.)向社会公开的机票发行起止日期进行价格合谋。[15]

3.基于平台的共谋情形  如今电商、网约车等领域的个体经营者多会寻求平台型企业进行挂靠,以此减少经营成本、增强市场竞争力。为避免经营者间的恶性竞争,以优步(Uber)、滴滴出行为代表的平台型企业多会通过提供定价算法与经营者纵向的达成价格一致。此类缺乏横向沟通而经由平台型企业达成的共谋行为,被称为轴辐共谋(Hub and Spoke Conspiracy)。轴辐共谋由隐蔽的横向协议与若干外显的纵向协议共同构成,将传统横向协议、纵向协议二分法的界限变得模糊。由于轴辐共谋中处于轮辐的横向协议往往缺乏直接证据,如何对其事实及违法性进行认定则变得更为棘手。[16]

自主学习型算法在此基础上衍生出的另一情形是附条件的价格歧视行为,如前文提到优步(Uber)平台曾在一段时期内表现出向不常匹配平台订单的用户设置更高价格的倾向。我国反垄断法关于价格歧视的规定归于滥用市场支配地位的行为,其实施主体是具有市场支配地位的经营者。可附条件的价格歧视行为并不以实施者具有市场支配地位为要求,平台型企业仅在数据信息充分的情况下即可实施。用户信息控制情况与市场支配地位是否具有应然关系、如何对平台型企业市场支配地位进行判断,则使得轴辐共谋行为变得进一步复杂化。


[13]烟草批发商Logista自2008年以来,全国范围内的市场份额长期维持在99%。

[14]Comision Nacional De Los Mercados Y LA Competencia,Expediente S/DC/0607/17 Tabacos,2019.

[15]Organization for Economic Co-operation and Development (OECD): Algorithms and Collusion: Competition Policy in the Digital Age,[2017-09-14], <www.oecd.org/competition/algorithms-collusion-competition-policy-in-the-digital-age.htm>.

[16]张晨颖:《垄断协议二分法检讨与禁止规则再造—从轴辐协议谈起》,《法商研究》,2018年第2期。


二、自主学习型算法共谋的规制困境

囿于前述自主学习型算法共谋表现形式复杂、行为依据模糊、主观意识弱化等特点,反垄断执法、司法层面难以对自主学习型算法共谋予以及时、有效的规制。此处分别就执法立案、事实认定两阶段所存在的局限,对自主学习型算法共谋现存的规制困境进行分析。

(一)执法立案阶段存在的局限

依据我国《反垄断法》第三十八条规定,目前反垄断调查可分为主动调查和被动调查两类。主动调查指反垄断执法机构依法定职权,对某一市场中涉嫌垄断的行为进行主动调查。这意味着在启动反垄断调查前,相关执法人员需要主动发掘、搜集相关线索以查明垄断行为的存在。就目前而言,搜集线索的主要路径包括新闻资讯、行业会议、市场调研等。考虑到自主学习型算法共谋行为发生时间不特定、表现效果不明显,事实上执法人员很难经由这些传统方法发现自主学习型算法共谋的相关线索。例如在动态定价算法场景下,自主学习型算法可在深夜不特定时段以高频变价行为发出共谋信号,在短时间内达成价格共谋。


被动调查一般指反垄断执法机构应第三方举报或垄断行为人自愿报告,而实施的反应性行为。从垄断行为人自愿报告的角度看,局限性体现在垄断行为人自愿报告动机不强烈和对自主学习型算法共谋具体行为不了解两方面。由于反垄断执法机构缺乏对经营者的事前管控,使得垄断行为人存在较大操作空间对数据、代码等内容进行隐瞒。进而反垄断执法机构或因证据收集成本过高、证据收集周期过长等原因无法及时、有效对其行为予以规制,造成我国现行反垄断法在对该类行为威慑效果上的缺失。在此情况下,垄断行为人通常不会有足够的动机向反垄断执法机构自愿报告其行为。另一方面,自主学习型算法本身的不透明也阻碍了设计者、使用者对于算法的实际控制。如优步(Uber)、爱彼迎(Airbnb)等一些既有的价格歧视案例也表明,设计者、使用者即便在透明程度稍高的不纯粹自主学习型算法场景下也很难做到对自主学习型算法的充分控制。

就第三方举报的角度而言,尤其需要注意到普通消费者举报条件的不足。目前自主学习型算法多应用于动态定价行为,其交易相对人通常为普通的独立消费者。前文优步(Uber)价格歧视的例子就反映出普通消费者难以意识到价格歧视等问题的存在,因而无法及时维护自身合法权益。但即便某些消费者偶然发现此类问题,也难以搜集到足够的证据进行举报。另一方面,我国个人信息保护方面的法律法规对基于自动化分析、决策的数据使用场景亦未作出规定,这也使得相关主体或因解释权、救济权的缺失而无法及时维权。欧盟《通用数据保护条例》在第12、13、14、15及22条对基于自动化分析、决策的数据使用场景作出相关规定,但在应用层面可能仍不足够。例如个人信息处理目的、个人数据接收方种类等信息应以何种方式向数据主体提供?在缺乏事前数据管控规范化指引的情形下,此类信息可能由于内容复杂、提示隐蔽等原因在实际操作中被消费者所忽视。


(二)事实认定阶段存在的局限

在不考虑人为干预的情况下,自主学习型算法共谋事实上可以认作为一种默示共谋—算法在利益最大化目标的基础上依据供需关系、成本费用等市场信息独立作出近似或相同的预判并形成具有反竞争效果的协作,从而导致价格处于竞争水平之上引发市场的无谓损失。且为预防私自降价、增产等背离行为造成的利润损失,参与共谋的竞争者将凭借惩罚行为进行威慑以谋取共谋状态持续稳定。但与以往反垄断法所规制的默示共谋不同,自主学习型算法共谋因缺乏经营者客观协商与明示合作而难以直接为反垄断法调整。故在规制时常需借助证据规则深入分析自主学习型算法共谋形成的内核,以明确其中各类共谋的具体要件。

证据规则对于事实认定至关重要,是垄断协议禁止制度的核心之一。但自主学习型算法共谋等默示共谋行为由于目的要素的无形性、抽象性,其证明过程往往较其他合谋行为更为复杂。其原因一是共谋的合意形式具有隐蔽性,形式呈现出“去书面化”、多样化的特点;二是涉案的证据信息具有不对称性,即便是执法机构都难以收集到相应的直接证据;三是由于默示合谋与平行行为具有相似性,除是否存在意思联络、有无合理抗辩理由外并无区别。但意思联络证据又存在前述复杂性,故默示共谋的证明过程常常深受掣肘并进而成为实践中规制默示共谋的症结。


为进一步甄别合法的平行行为与违法的默示共谋行为,美国、欧盟常将间接证据引入事实认定过程。间接证据证明规则目前在我国尚存在争议,如有学者赞成使用间接证据和举证责任倒置共同证明默示共谋行为,而有些学者则支持综合间接证据证明默示共谋行为。但无论如何,间接证据证明规则的模糊一方面使得经营者缺乏反垄断规制的可预见性,无法就特定的间接证据类型进行预先整理、留存。例如自主学习型算法训练样本、数据接口等关键间接证据类型,其直接处于经营者控制之下而难以为反垄断执法者调取收集。另一方面,如若反垄断执法机构无法对特定间接证据类型进行有针对性的、及时的收集整理,也会较大程度阻碍执法工作的有效开展。而间接证据的收集过程亦存在局限,主要反映在代码、数据两个层面。就代码而言,除代码整体内容、结构、逻辑极其相似的特殊情况外,反垄断执法者通常难以仅依据代码推断出设计者或使用者的主观恶意。尤其在纯粹自主学习型算法共谋的情境下,即使没有设计者预先针对性设置,自主学习型算法仍能够依据利润最大化的考量自主衍生出合作、惩罚等行为,由此反垄断执法者依据代码对信息交流行为进行推定的能力被大幅削弱。而在数据层面上,由于现行法律法规并未对算法训练样本数据的使用、备份等内容加以规定,故在实际调查中反垄断执法者极有可能无法对相关证据进行及时完整的提存。数据、代码层面证据的缺失,将影响责任主体的认定。若是自主学习型算法在缺乏人为干预的情况下自主衍生出共谋行为,则应认定为是物的责任;若是设计者在设计、训练过程中刻意引导自主学习型算法倾向,则应认定为是设计者的责任;若是使用者在使用过程中通过开放隐蔽接口等方式人为营造数据层面的一致,则应认定为是使用者的责任。[17]而在数据、代码层面证据缺失的情形下,设计者或使用者将有机会把责任归咎于自主学习型算法本身。即便责任终究仍由使用者、设计者等主体承担,但此时意味着该损害的直接原因为自主学习型算法而非使用者、设计者等主体,归责过程必会因此受影响,使用者、设计者等主体所承担的责任将大幅减轻。


[17]杨立新:《民事责任在人工智能发展风险管控中的作用》,《法学杂志》,2019年第2期。


除前述提到证据获取及行为预判层面的不足外,部分学者认为我国反垄断法未对“协议”的具体含义作出规定是自主学习型算法共谋缺乏可规制性的原因。他们认为我国《反垄断法》仅仅在第13条以原则性规定对“垄断协议”概念进行界定,即便辅以例举性规定仍不足以明确垄断协议的具体构成要件。在此情况下无法认定自主学习型算法共谋是否属于反垄断法中“垄断协议”所指情形,为自主学习型算法共谋的认定过程造成阻碍。为此应当通过立法扩张“垄断协议”概念、弱化“协议”形式要件,从而为规制自主学习型算法共谋留出实施空间。[18]但我国反垄断法中关于“垄断协议”的概念已经较为模糊,仅仅对其排除、限制竞争的反竞争效果予以明确。因而此条事实上已为法律解释留有余地,法院或反垄断执法机构可以通过目的解释等方法进行释明。近期发布的《〈反垄断法〉修订草案(公开征求意见稿)》也反映出这一态度—草案将我国现行《反垄断法》第13条第2款上升为“统领”第二章垄断协议内容的一般性条款,有效消弭现有规范体系的结构性缺陷,使得法院、反垄断执法机构在认定垄断协议时更具裁量空间。

当然通过制定法律、法规、指南等方式对“垄断协议”概念予以补充、说明将有助于提升规制自主学习型算法共谋等新兴垄断协议行为的现实可操作性,但这并不足以支撑其必要性。因而现有反垄断法制度框架在证据条件明晰的情况下仍能够有效规制自主学习型算法共谋,但规制困境的根源仍在于证据收集、提存、固定过程的障碍。然而以往依靠反垄断执法机构等主体被动进行信息收集、整理、固定的做法难以弥补上述缺陷,尤其是对于算法训练样本、价格变动记录、数据获取接口等自主学习型算法的核心信息根本无法做到有效、全面收集。因此只有引入事前预防与监管措施对此类核心信息预先进行针对性提存、分析、管控,才能占据主动并对其予以有效、合理规制。


[18]周围:《算法共谋的反垄断法规制》,《法学》,2020年第1期。


三、自主学习型算法共谋的事前预防与监管

对于自主学习型算法共谋这一新兴共谋形式,应当明确其机理、剖析其特征。在此基础上针对性地进行环节设置,寻求合理、有效的规制路径。

(一)自主学习型算法的实现原理

不纯粹或纯粹的自主学习型算法目前大多是基于机器学习原理实现的,依据实现方法不同可粗略分为监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)以及强化学习(Reinforcement Learning)三种。监督学习的核心是通过输入一定量带有标记(监督信号)的训练样本,由计算机自主分析并生成相应的推断功能。如在设计识别物体形状的监督学习算法时,设计者需要事先准备一些标记好形状名称的物体照片。监督算法基于这些训练样本生成出将所有输入映射为相应输出的算法模型,并可对输出内容进行简单判断。而无监督学习的核心则是聚类,即将未标记有特征的训练样本依据划分方法、层次方法等进行聚类。再以识别物体形状为例,假如在设计之初对训练样本图片未作标记,则可直接通过无监督学习算法对训练样本进行聚类。但由于缺乏对训练样本的预先归类,所以在输出结果时算法无法依据确定的标准对其进行衡量。强化学习的核心是在训练时重复试错(Learning Through Trial and Error),并在过程中给予算法一定量的刺激反馈以增强某种行为,如通过奖励正强化行为、通过惩罚负强化行为等。与非监督学习不同,强化学习并非一种映射关系。如在线购物平台进行商品推荐时,非监督学习算法可能会基于用户以往的购物记录推荐类似的商品。而强化学习算法由于在训练时会受到近期购物记录的影响,会尝试推荐不同的商品,并根据用户点击、浏览时间等数据的反馈进而构建出用户购物偏好的模型。


在初步了解各算法实现的基本原理后,有几点值得在探究自主学习型算法时注意。一是在构建算法模型时,设计者使用、设置训练样本的偏好会对算法模型的构建产生影响。如在训练样本上预先标记人种、性别等参数,则很有可能使得动态定价模型在构建时产生人种、性别层面的歧视;二是随着训练样本模糊度的提升,算法往往需要更多的时间对数据进行分析、建模。这意味着在设计如动态定价算法等复杂算法时,设计者通常需要在本地预先对算法进行长时间的训练;三是当涉及强化学习算法时,设计者对于反馈的设置也将对算法模型的倾向产生影响。再以动态定价算法为例,如若设计者对合作行为给予奖励(正强化)或对背离行为进行惩罚(负强化)则很有可能使得算法模型体现出倾向于共谋合作的特征。这些特征对于自主学习型算法共谋规制框架的具体建构有着较好的借鉴意义,尤其是在涉及去模型化的强化学习算法共谋类型时值得注意。如一项由英国牛津大学、美国加州大学伯克利分校、OpenAI实验室等机构发起的联合实验表明,即使在算法设计之初不预设合作相关的算法内容,计算机算法同样能够基于利益最大化的需求而学习合作。[19]这类算法由于在设计之初并没有明显的功能设置、偏好设置,且在数据分析、处理过程中并不会提供决策的依据,对反垄断执法机构而言无异于是不透明的“黑匣子”。对其分析应当从其相关特征针对性入手,例如供算法训练的训练样本是否有偏好、反馈的设置是否有偏好等。


[19]Jakob N. Foerster and others,"Learning with Opponent-Learning Awareness", Cornell U. Libr.,Working Paper,2018:2.


(二)面向算法内容的事前预防与监管路径设计

可针对算法本身或其结果进行监管。

1.算法透明措施  自主学习型算法的实质威胁并不在于其是否便利市场竞争者的共谋,而是它不确定的行为方式。如优步(Uber)平台设计激增价格算法的初衷,是通过价格的倍数激增以减少用户的需求并增加司机的响应数。但由于算法的不透明,优步(Uber)平台本身也没有意识到激增定价模型会衍生出价格歧视的行为。这并不鲜见,爱彼迎(Airbnb)[20]、谷歌广告平台(Google Ads)[21]同样出现过类似情形。考虑到上述问题,算法透明如今为许多学者、政治家所倡导。德国总理安格拉·默克尔就曾呼吁脸书(Facebook)、谷歌(Google)等大型互联网公司公开其算法,否则用户或将会因信息接受范围缩小而感知失真。狭义的算法透明指披露算法的源代码、训练样本等基本算法要素,而广义的算法透明则指运用算法公开、算法审核等手段促成完整意义的算法透明。[22]因广义的算法透明所指过于宽泛,此处论述仅限于狭义的算法透明。

算法透明很大程度上使得反垄断执法机构对于算法设计者、使用者的可问责性和对算法的知情权得到满足,同时也有利于在事后对自主学习型算法的决策过程、依据提出公平性和合理性的质疑。尤其是在应对算法代码、架构相似的特殊情形时,算法透明能够便于反垄断执法者快速识别并及时对算法来源进行核查。但即便不考虑商业秘密、社会秩序等问题,仅仅公开算法源代码在多数情况下并不等于算法可知甚至也并不足以提高透明度:一是由于商用算法往往由多组算法模块构成,其复杂性本身便会给解释工作造成难度;二是由于自主学习型算法决策依赖于特定数据环境,单纯静态地考察源代码并不实际;三是由于代码解释周期普遍过长,并不符合反垄断执法实践的需求。目前有学者退而求其次地提出算法整体设计应实现模块化,便于算法工程师逐一对其解释、阐明。但其对于商业算法的设计有较高要求,实践上可能存在一定困难,且算法迭代更新将会使得模块趋于复杂从而难以保证模块化解释达到预期效果。因而就如何实现高效、可行的算法透明,目前仍待进一步探索。


[20]Edelman Benjamin G. and M. Luca,"Digital Discrimination: The Case Of Airbnb.com", Harvard Business School NOM Unit Working Paper,2014:3.

[21]Sweeney Latanya,"Discrimination in Online Ad Delivery", Queue,2013:3.

[22]沈伟伟:《算法透明原则的迷思—算法规制理论的批判》,《环球法律评论》,2019年第6期。


2.“黑箱”测试  沿着前述算法透明化的思路,可以考虑由反垄断执法机构牵头设立算法测试、评估平台,要求自主学习型算法的设计者或使用者在实际使用前进行强制性的“黑箱”测试。在设计“黑箱测试”时可以采取对抗的形式去测试、识别出一些具有反竞争效果的算法特性,并将其作为禁止子集的一部分。即便未识别出具有反竞争效果的特性,也可以对是否存在人为修改、人为控制等运行机制进行识别。若算法具有以人为操作触发共谋的倾向,则很大程度上意味着共谋合意的存在。反垄断执法机构也可通过内设或聘请的专家协助其审查自主学习型算法的细节部分。如此前美国司法部在调查亚马逊(Amazon)等在线平台时,就曾聘请反垄断诉讼律师Ryan Shores协助审查。[23]但即便排除技术层面的因素,目前“黑箱测试”可能尚不具有可实施性。一是从《著作权法》看,不属于该法第22条所列合理使用情形的“黑箱测试”是否会构成侵权?二是由于测试算法同样不具有透明性,“黑箱测试”又是否会造成行政权力的不当扩张?[24]三是算法版本迭代变更时,是否均需要进行“黑箱测试”?经营者在“黑箱测试”缺乏相关法律规定的情况下,往往会以商业秘密作为抗辩。因此在建立“黑箱测试”机制前可参考如《最高人民法院关于审理不正当竞争民事案件应用法律若干问题的解释》中有关反向工程的条款,基于正当性对“黑箱测试”予以一定豁免。与此同时还应对算法披露的流程、方式进行相应约束,防止因算法内容不当泄露而造成对商业秘密、社会秩序的侵害。

除前述提到两类行政层面的主动审核外,还应当完善行业协会、消费者层面的监督制度。如行业协会可牵头举办类似Pwn2Own、WCTF等赛事,以鼓励公众在现实条件下(即模拟现实条件而无需算法公开)参与算法的监督和完善过程。


[23]Delrahim Makan: Data key to antitrust in digital markets, Global Competition Review Website[2019-11-11], <https://globalcompetitionreview.com/article/1210763/delrahim-data-key-to-antitrust-in-digital-markets>,最后访问时间2019年11月13日.

[24]万勇:《人工智能时代的版权法通知—移除制度》,《中外法学》,2019年第5期。


(三)面向数据来源的事前预防与监管路径设计

由于动态市场的复杂性,自主学习型算法通常需要极长时间的训练以建立模型。经济政策研究中心(CEPR)的一篇报告指出,自主学习型算法在仅为50*50的网格实验中便需要约500,000个周期才能实现收敛(可以理解为实现价格共谋状态)。[25]如若将该算法置于真实市场环境下,其需要的周期则会更多。除训练时长外,训练样本量也有相应的要求。美国东北大学研究人员在推导优步(Uber)激增定价模型时,仅四周内少量时段的数据量就达到2.1TB。[26]如此的训练时长及训练样本量,使得设计者根本无法实现自主学习型算法的实时训练。因此,设计者必然选择转向本地化的训练模式。

针对本地化训练模式的特点,反垄断执法者在前期市场调查阶段应当要求相关主体保留一定时期内的训练样本(数据)并就其来源作出解释。一方面,由于前期市场调查的随机性、不确定性,自主学习型算法共谋的实施者难以及时对训练样本作出修改、清理,从根本上保证了训练样本的可审核性。反垄断执法者可以要求设计者解释算法的构造并在一定情况下选择性地对这些训练样本进行测试,通过测试对训练样本设置上的倾向性进行进一步审核。但在数据披露的基础上还需要谨防干扰性披露的问题,即通过披露大量冗余、干扰性的数据以妨碍关键数据内容的解释。故反垄断执法机构在抽检、审核数据时可引入第三方机构协助,以期审核过程有序进行。另一方面,对数据来源的审查可以初步判断出竞争者是否具有潜在的共谋意思以及其对市场信息对称性的影响程度。数据的分享、使用本身并不当然为反垄断法所规制,但如成本价格、生产数量等关键市场信息则可以降低市场竞争不确定性进而促进共谋。对于此类关键市场信息的来源则必须予以关注,例如数据是否是由同业竞争者提供独立接口获得、数据内容是否含有单边公告信号、经营者对关键市场数据是否予以必要防护等。如若确实存在前述问题,则可以很大程度上认定共谋行为的存在。如欧盟《横向合作协议指南》就价格、产量等信息作出规定,若经营者间存在交换此类关键信息则可直接认定为具有限制、排除竞争目的。


[25]Emilio Calvano and others,"Artificial Intelligence, Algorithmic Pricing and Collusion", Centre for Economic Policy Research Discussion Paper, No.13405,2019:21.

[26]Le Chen,Alan Mislove and Christo Wilson,"Peeking Beneath the Hood of Uber".


考虑到事前阶段在认定过程存在的缺陷,反垄断执法机构可考虑适用“通知-删除”等较为缓和的措施予以前期规制。但这些措施具有一定的执法灵活性,应当在立法上相应限制其处罚权以保障企业的合法权益。而我国反垄断法在此方面尚不完善,仅《反垄断法》第四十四条有一简要表述。为兼顾执法灵活性与处罚权力,美国联邦贸易委员会(FTC)在作出处罚时需从如下方面证明相关主体的行为具有反竞争效应:(1)可能会对消费者造成重大损害;(2)消费者无法合理避免该损害;(3)其行为的有利影响并不能抵消对消费者、竞争环境的损害效果。[27]这一标准是原则性、抽象性的,所以在限制处罚权的同时也一定程度上确保执法的灵活。

如何保证数据管控措施得到有效执行,很大程度依赖于相关法律法规的解释、完善。我国目前与此较为相近的是《电子商务法》第31条关于电子商务平台经营者记录、保存商品和服务相关信息的规定,其对信息的基本类型、保存时间都作出相应要求。但在引入反垄断法时,还应注意对信息类型的具体说明以确保数据管控措施的可执行性。如采用列举式的方法指明数据来源信息、终端价格信息等常见的数据信息类型,再辅以概括式的描述保障执法者自由裁量空间。此外还应当注意到此规定强调信息的完整性、保密性、可用性等原则,这一原则可为《反垄断法》第52条所借鉴—即当受调查经营者以不当方法致使披露信息不完整或不可用时也应当认定为是拒绝、阻碍调查的行为。


[27]OECD: Algorithms and Collusion: Competition Policy in the Digital Age.


(四)面向市场结构的事前预防与监管路径设计

前文提到,在产品同质性较强、市场结构较固定的市场较容易出现自主学习型算法的平行行为。对这类市场重点进行市场监控,将有助于对垄断风险的事前控制以及对垄断行为的事后管控。但由于市场信息的不对称性、监管技术的滞后性,反垄断执法者采用传统手段难以及时、准确的识别出自主学习型算法共谋行为。且即便识别出违法行为,也难以将证据线索及时加以提存、固定。因此借助技术手段对商品价格、供需关系等市场结构信息加以实施、动态的监管是极为必要的。

1.市场风险监测措施  一方面反垄断执法机构应当依托于大数据、云计算、数据加密等技术主动建立起一套高效、稳定、安全的市场风险监测系统,对行业信息、舆情信息等数据源及时地收集、分析。另一方面可以适时地要求被监管主体接入反垄断执法机构的市场风险监管系统,借助区块链技术实时提存、固定数据以防止数据的篡改、伪造。当然,由此形成的数据量也对数据质量、处理能力提出相当的要求。因而由政府部门、执法机构、行业协会主导进行数据流程规范化指引,逐渐形成结构化、系统化的数据格式是极其必要的。此举将使得数据清洗难度、数据处理时长大幅降低,从而提高市场风险监管系统的可应用性。此外,各地区监管机构间也应当探讨数据共享的可实践性,为统合监管奠定必备基础。[28]州仲裁委等机构基于区块链技术搭建的“仲裁链”,一定程度上可以供各地区监管机构借鉴。但各节点均安全、可信的情况下采用区块链技术是否经济、效率,采用其他数据加密技术是否可行值得进一步讨论。


[28]杨东:《监管科技:金融科技的监管挑战与维度建构》,《中国社会科学》,2018年第5期。


2.异常市场行为预警、调查措施  除对一些基本的市场结构信息进行整理、分析外,反垄断执法机构还应当借助人工智能等相关技术识别、监测异常的市场行为。前文提到外显、直接的垄断协议、沟通线索等证据在自主学习型算法共谋的情境下极难获取,此时尤其应当重视对间接经济证据的分析、提取。但间接经济证据由于其零散、关联性较差的原因,通常难以形成清晰、完整的证据链条。美国联邦第四巡回上诉法院在审理Brooke Group Ltd. v. Brown & Williamson Tobacco Corp.案时就指出,间接经济证据虽然也足以证明有意识的平行行为违法,但考虑到平行行为本身并不具有违法性,只有在间接经济证据达到相当程度时才能认定其违法。[29]考虑到高频价格变动等异常的市场行为发生时间短、发生时间不确定等因素,采取传统手段将很难察觉这类行为。因此反垄断执法机构可以同样采用人工智能等相关技术,对市场异动进行监测、预警。在具体操作上,一方面可以考虑将此前已经查处的案件材料相应整合、提取,作为监管算法的训练样本。而另一方面对于一些较常见的间接经济证据类型,则可以考虑直接将其作为常规化的监管目标,例如相对固定的市场份额、市场价格的歧视、异常的市场价格变化幅度及频率等。[30]在识别出相应的间接经济证据后,可以在贝叶斯模型的框架下结合市场结构、市场特点、监管经验推断出共谋的大致概率进而有条件地展开针对性调查。为更有效识别、利用各类间接经济证据,反垄断执法机构可设置专门小组以提升专业性。如美国联邦贸易委员会就于2019年2月设立技术专门小组(Technology Task Force),以调查美国科技行业的反竞争行为。[31]专门小组在日常调查活动过程中可以以行政指导、建议等方式促进竞争政策的有效实施,并在公平竞争审查过程中反推政策制定。

3.消费者指导措施  消费者是市场经济活动的重要组成部分,在反垄断法中也占据相当位置。在大数据、爬虫技术高度发展的现在,消费者同样可以使用竞价平台等技术服务以减少市场信息的不对称。当使用竞价算法的消费者数量达到一定程度时,则消费者可逐步获得买方势力并以此抵消经营者使用算法所引致的负面福利效应。[32]且消费者在使用过程中如若发现经营者存在异常行为,则可以及时向有关部门举报。美国联邦贸易委员会消费者保护局此前就为此设立了技术研究和调查办公室(Office of Technology Research and Investigation),其一项重要职能就是为消费者以及其他组织提供算法透明性等相关问题的指导。[33]


[29]Brooke Group Ltd.v. Brown& Williamson Tobacco Corp.,509 U.S.209(1993).

[30]William E. Kovacic,"Plus Factors and Agreement in Antitrust Law",110 Mich. L. Rev.393,2011:427.

[31]FTC creates new task force to investigate tech sector[2019-02-26], <https://www.cnet.com/news/ftc-creates-new-task-force-to-investigate-the-tech-sector>,最后访问时间2019年12月18日.

[32]周围:《算法共谋的反垄断法规制》。

[33]FTC Office of Technology Research and Investigation, <https://www.ftc.gov/about-ftc/bureaus-offices/bureau-consumer-protection/office-technology-research-investigation>,最后访问时间2019年11月30日.


四、结语

即便纯粹自主学习型算法在实验室环境下已表现出相当的能力,但相较其他专门算法而言多数情况下并不会作出合作行为。且其运行周期长、结果不稳定等特点,使得设计者难以在控制结果的基础上管理成本。故仅就目前技术条件而言,距离纯粹自主学习型算法的实际应用仍为时尚早。因而结合现有条件,依据自主学习型算法特点对各类不纯粹自主学习型算法分环节、分对象予以事前预防和监管是更加现实的,例如本文提到的对市场敏感信息的管控、对单边公告信号的核查、对市场风险的监测等。在各环节设计趋于完善时,即便确实出现纯粹自主学习型算法共谋也不至于无从下手。此外,自主学习型算法共谋所涉及的民事责任认定等问题也值得进一步探究。如在纯粹自主学习型算法共谋的情形下,设计者、使用者间的责任如何界定?又如在“伞形效应”的情境下,未实际参与共谋但却随即提升商品价格的竞争者是否需承担责任?消费者又是否能够向其请求赔偿?为更好应对自主学习型算法共谋,宜在数据层面、消费者层面、民事责任层面等层面逐步协调、完善,结合经济学、计算机科学等专业知识逐步建立起有效、完备的算法共谋规制框架。

编辑:郑令婉

打印本页】【关闭窗口】【复制地址

往期回顾

深圳新闻网传媒股份有限公司版权所有,未经书面授权禁止使用 COPYRIGHT © BY WWW.SZNEWS.COM ALL RIGHTS RESERVED。