一种机器学习方法,用于库存受限的动态定价
2018年03月16日 由 nanan 发表
138667
0
新的研究表明,汤普森抽样可以很自然地与经典的线性规划公式相结合,其中就包括库存受限。
1933年, William R. Thompson发表了一篇关于贝叶斯模型(Bayesian model)算法的文章,该算法最终将被称为汤普森抽样。但这一算法在当时却成为激烈的研究主题,部分原因是互联网公司成功地将其用于在线广告展示。
汤普森抽样选择了多臂强盗问题(有时称为K或N臂强盗问题)上解决勘探开发的行动,以最大限度地提高性能和不断学习,获取新的信息以改进未来的性能。
在一项新的研究中,麻省理工学院教授David Simchi-Levi及其团队目前已经证明,汤普森抽样可用于需求函数未知的收入管理问题。
纳入库存限制
采用汤普森抽样进行收益管理的主要挑战是原始方法不包含库存限制。然而,汤普森抽样可以很自然地与经典的线性规划公式相结合,以包括库存限制。
其结果是一种动态定价算法,该算法结合了领域知识,具有较强的理论性能保证和良好的数值性能结果。
有趣的是,汤普森抽样在不考虑领域知识的情况下,表现却不佳。
Simchil - levi说:“证明汤普森抽样可以结合经典的线性规划公式,包括库存限制,并将此方法应用于一般收入管理问题,这是令人兴奋的。”
行业应用提高了收入
所提出的动态定价算法具有很强的灵活性,适用于航空公司、互联网广告等多种行业的在线零售。
这项刚刚被《运筹学》杂志接受的新研究,是Simchi-Levi开展的一项大型研究项目的一部分,该项目将机器学习和随机优化结合起来,以提高收入、利润率和市场份额。
本研究报告中开发的算法已在诸如日常做市商Groupon,美国在线闪销零售商Rue La La,拉丁美洲大型在线零售商B2W Digital以及大型酿酒公司实施, Simchi-Levi和他的团队在各个零售渠道优化了公司的促销和定价。