深思网

自主学习型算法共谋的事前预防与监管*

2021-08-30 15:51 来源:深圳社会科学


考虑到背离行为会造成共谋参与者的利润损失,识别背离行为并及时作出反制的能力是达成共谋的必然要求。依托大数据、爬虫等相关技术,现有算法也能在有限程度上满足这一需求。比如采用“以牙还牙”(Tit-For-Tat)策略,共谋参与者能够采用价格跟随行为对私自调整定价或库存的行为作出及时响应。因而背离行为所能够产生的利润空间实际上已经被大幅压缩,共谋参与者间的监管、惩罚行为在实际操作中仅仅是“威胁”意义上的存在。但简单采取价格跟随行为容易衍生出另一问题,即是背离行为发生后共谋参与者因无法及时返回合作而造成利润损失。鉴于上述情况,如何在背离行为发生后及时返回合作关键对于自主学习型算法共谋而言则显得更为关键。脸书人工智能研究院(Facebook AI Research, NY)近期提出,在信息流较为充分的情况下采用附条件的结果主义合作算法(Consequentialist Conditional Cooperation)对历史信息进行分析,可以有效避免背离行为发生后难以再次达成共谋的缺陷。[7]具体而言,附条件的结果主义合作算法能够基于历史对局信息对对手行为、次回合收益进行实时评估,当合作行为预期产生的收益超出算法的期望阈值时则重新进行合作。


[7]Alexander Peysakhovich and Adam Lerer,"Consequentialist Conditional Cooperation in Social Dilemmas with Imperfect Information", Cornell U.Libr., Working Paper,2018:2.

责任编辑:郑令婉