杉数科技:低调的运筹学,与金融业的契合点在哪里?
2017年12月27日 由 荟荟 发表
139081
0
“夫运筹帷帐之间,决胜于千里之外。”
1955年,研究人员从《史记·高祖本纪》中提取出“运筹”二字赋予年轻的Operations Research(简称OR)学科以中文名。OR起源于第二次世界大战,最初是为了最高效地分配军事任务和军事资源。随着战后工业生产的日益复杂化,本质是研究优化问题的OR开始延伸至其他更广泛领域,传统应用包括供应链管理、路径优化、选址、能源网络布局、收益管理、资产配置与风控等。
同根同源
作为一门交叉学科,运筹学与数学、计算机、经济管理等学科都存在着密切的联系。斯坦福大学李国鼎工程讲座教授(K. T. Li Chair Professor)、优化领域基石算法内点算法的奠基人之一叶荫宇教授表示,运筹学是在满足约束条件下能够最大化、最小化某一目标的最优决策,有两大关键步骤:建模,将问题通过数学形式准确有效地表达;求解,获得最优化目标函数的决策。
随着 AlphaGo等应用的突破性进展,人工智能大行其道,相关企业如雨后春笋般涌现,对于AI相关学科也产生了深刻的影响。在近日上海财经大学联合杉数科技召开的“2017年数据驱动的优化理论与实践”国际研讨会上,上财交叉科学研究院院长,斯坦福大学博士葛冬冬教授分享了一番运筹学面临的机遇和挑战。
数据全链条包含三个阶段,第一是采集挖掘、管理存储数据,通常由计算机和信息科学技术完成。随后提取数据中的信息,通过规律性分析发现规律,通常由统计和机器学习完成。但这些还不能释放数据的巨大价值,核心决策往往有较高的复杂度,还受诸多关系复杂的决策因素影响,所以运筹学接棒以期实现决策最优化。
“大数据天然带来了算法的需求,一阶算法兴起,非凸优化在深度学习和机器学习取得了有目共睹的成功。此外,量化意识觉醒,带来了对运筹学模型的再意识。”
但与此同时,整个过程从模型驱动向数据驱动转变,对方法论、实践的突破提出了新要求。在现实中,运筹学从业者常会遇到算法归功于谁,模型该听从经济学、统计学还是计算机科学的声音,以及工程化能力薄弱不足以支撑完整思想的传达等一系列问题。
而在斯坦福大学统计系教授黎子良眼中,这一切与AI相关的学科关系则更加简单,“往前数几十年,统计、运筹等都是同源。”在研讨会上,他对雷锋网表示,在实际研究人工智能过程中,黎子良教授也从不拘于统计学的方法,“我的学生散布在计算机、工科、医学等多个专业,我会经常与他们交流问题,也要求他们相互合作。”
细数金融业应用场景
作为人工智能决策层面的支持理论,随着其他技术的发展,运筹学的应用场景在不断拓宽。当然也包括金融领域。
第一个应用场景是投资组合优化。叶荫宇教授曾在公开演讲中提及优化马科维茨模型投资组合的例子。本质上,它是一个权衡收益和风险,构建最优投资组合的优化问题。
“把投资组合的问题写成一个二次规划,它的目标函数是二次函数,所有的约束也都是线性。我们通过一些常用软件Barra、Axioma、ITG、Mosek 等来最快地解出这个二次规划。”
第二大应用场景是风控与征信。作为全球最大的信用评级公司,2006至2007年间,FICO在征信模型求解方面找到了叶教授的科研组求助。叶荫宇教授表示,当时项目的信用评分模型极为复杂,数据样本过大,采用的机器学习模型,例如SVM,缺乏专用算法,一般的算法求解器调用以后无法在短时间内输出分类结果。
这是一个非线性优化问题,求解难度很大。后来,FICO简化了求解问题,并开发出专用、针对性的大规模优化算法,提升效率,增强可用性,还收购了一家专门的优化算法公司Xpress。当下,FICO已经自称是一家预测分析和决策管理公司,据2016年报显示,FICO 评分贡献 2.41 亿美元收入,占其总收入 27%,决策工具占比12%。据了解,旗下拥有一款帮助业务分析师优化决策策略的优化工具Decision Optimizer。
此外的应用场景还包括金融机构的储备金以及金融产品的定价。由几位斯坦福运筹学博士创立于2016年的杉数科技,主要为大公司提供咨询和定制化服务。CTO、明尼苏达大学助理教授王子卓告诉雷锋网,“总的来说,只要涉及到决策的金融场景,多多少少都会牵涉运筹优化。”
据他介绍,他们曾经做过类似项目,为某投资理财机构设计储备金,来应对投资者赎回或者其他市场风险,“类似于物流,只不过这里是资金流,需要做出每天储备多少资金才是安全线的决策,用到了鲁邦优化(Robust Optimization)等模型”。
定价问题其实是指金融产品的利率。产品利率与投资者投资成正比,这时需要权衡利率与平台利润的关系,“可以将此比作零售价格的设定”。
此外还可以应用在收益管理。该场景下要解决的问题就是,商家在如何不增大流量投入的前提下,显著提升企业的销售收入,解决这个问题需要收集多个维度数据,找到不同场景下的最优定价和最好的销售策略。
国内金融应用处于早期
在实践中应用运筹学也符合我国所倡导的集约型经济增长方式,但当前其在金融业的应用还处于早期阶段,相较而言无法与物流、零售领域的实践比肩。
王子卓对雷锋网表示,杉数一开始聚焦的行业就是物流,目前在物流和零售的案例最多。主要有三方面原因:
第一运筹学与物流、零售的契合点传统上比较多,这主要表现在解决问题的广度更高,效果更为显著。
第二,金融行业充斥着一大不确定性因素——人,可控性和标准化难度高,以及金融天然的避险性和强监管,一贯对新技术持相对谨慎的态度。
第三金融机构内部也有团队在做类似的事情,洽谈项目的难度会更高。
另一方面,国外金融行业运筹学的普及度也更高。
据雷锋网了解,叶荫宇教授的斯坦福团队曾为美国运通公司进行过利用动态博弈模型追讨未偿债务的项目。追讨未偿债务是运通重要的商业流程之一,即使是微小的提升也会显著影响其盈亏,但问题是追讨成本高,哪些值得追讨,又该采取怎样的策略。
叶荫宇教授介绍说,后来他们利用有期限的动态博弈来建模还款过程,在三个层面(债务人分配、追债人分配、有期限的动态博弈)进行优化,找到最佳的追债人债务人匹配及追偿方案。落地实施时,将复杂博弈模型转化为5个分割点方案,取得了明显效果。
除了定制化服务,行业机构还会提供一类标准化产品——算法求解器(optimization solver)。运筹学加上算法引擎,通过集成高效的优化算法为复杂数据分析提供基础的算法和软件支持,特别是开发优化算法求解器,能够显著提升机器学习和深度学习效率。市面上知名的求解器有美国Gurobi、IBM旗下Cplex、MOSEK等,前文提及的FICO 旗下Xpress也是此类。
在运筹优化国际研讨会上,成立于1997年丹麦的MOSEK创始人Erling D. Andersen告诉雷锋网,MOSEK产品的主要市场在欧洲、北美,中国仅有一两个正版客户(由于商用求解器相对昂贵,所以存在盗版和大规模的免费教育版用户)。
“国内采用求解器的大多是大公司,而国外应用更加广泛,小公司也有这种意识。此外,国内一些机构可能也不能很好地发挥这种工具的作用。”王子卓告诉雷锋网。
“不能孤芳自赏”
国内的从业机构不多,又有着广阔的应用前景,运筹优化这片蓝海似乎十分富饶。但在从业者纵横波涛之前,还有一个阻碍——生力军匮乏。作为一门交叉学科,运筹学散落在商学院、计算机学院、数学学院、工程学院中,学科建设不足,国内高校开设寥寥。此外,直到今年11月开源算法平台LEAVES发布前,中国还没有自己的优化求解器,主要依靠海外产品。
“不过近两年,运筹学学科受重视程度提升”,葛冬冬教授向雷锋网阐述变化,“一些高校设置交叉研究院,吸引海外知名学者。在业界,我们发现不少大公司,比如顺丰、滴滴、美团、京东等,给相关人才开出的待遇显著提高,这也有利于提高学科培养人才的积极性。”
在闭门会议上,叶荫宇教授表示,研究运筹学,第一要跟上技术发展的潮流,比如关注机器学习中的优化问题;同时,也可以为其他学科提供新思路、方法,帮助他们解决问题。
第二,长期来说,运筹学要结合学术研究与深层的应用,对实际产生意义。
“OR 的本质是一个接地气、落地的科学。OR 要走出去,不要孤芳自赏,还要再做点实际的事。”