机器学习对于投资管理将变得越来越重要,大多数公司将在 5 年内利用机器学习工具或数据,越来越多的战略创新过程将被自动化。本文还提出了解决过拟合问题的方案。

“预测是非常困难的,尤其是与未来有关的预测。”——Niels Bohr,诺贝尔物理学奖得主

要小心,投资专家——机器学习正在入侵你的公司。机器学习这个人工智能的子领域不仅用于为无人车编程或给猫的图片分类,它正在进入投资管理领域,其破坏性潜力才刚刚出现。

从 Siri 和 Alexa 到 IBM Watson,由人工智能驱动的计算机程序正在利用大量的数据来解决以前十分棘手的问题。机器学习使得计算机具有额外的学习能力,而无需对其明确编程。这种类型的 AI 使得计算机面对新数据时可以适应——即能够学习。

机器学习背后的技术主要是由算法的创新推动的,它使得机器可以合成超大规模的数据集,并揭示与预测问题相关的模式、趋势和关联。越来越普遍而且成本不高的并行计算使得精益初创企业也有能力利用这项技术。

这项技术已经改变了从医疗到汽车的许多行业。此外,机器学习被广泛认为是谷歌、Facebook、亚马逊等大企业营收的主要驱动力。然而,机器学习在投资管理中的应用迄今为止还很有限。除了少数领先的对冲基金之外,投资行业还未能认识到机器学习在推动投资决策方面的潜力。

不断改进的算法

机器学习使得预测算法的发现得以自动化,当算法得到更多的数据时,它能够持续改进。最近备受关注的是用机器学习自动执行传统上由数据科学家处理的许多任务,包括数据清理,模型选择,数据聚类,自动特征生成和降维。

深度学习是最近的许多技术突破的功臣,包括学习下围棋并打败了世界排名第三的职业棋手。深度学习还使得计算机图像识别能力与人类相当,并且显著改善了语音识别和机器翻译。深度学习还帮助谷歌搜索或 Facebook 新闻流中,故事和广告的定向更精确。使深度学习如此强大的部分原因是它能够组织并集合大量未标记的数据集作为抽象形式,这对预测更加有用。其结果也好得惊人,不管是速度还是准确率。

这对于投资管理来说意味着什么?

我们相信机器学习将改变所有基金经理投资策略的执行方式。即使是最基础的非量化基金经理也能够从经过ML获取并综合的数据中获得一些想法。例如,深度学习创建结构化数据的能力可用于从文本(如财报电话会议、SEC文件和社交媒体)中提取主题和情绪;或用于分析停车场或作物数据的卫星图像;或评估来自移动电话的位置数据。

定量基金经理肯定会使用这些新的数据源,他们可以使用机器学习来克服过拟合的危险。过拟合的问题存在于对投资委员会或其投资组合经理的诱惑中。他们会倾向于相信自己发现了一个数据驱动的关系,而没有意识到那是伪相关的因果关系。

当数据科学家采用他们最喜欢的方法,设置一些输入特征并且配置他们方法的参数和效用函数时,过度拟合经常会发生。 然后,他们在他们的数据(训练集)的一部分上面运行算法,并查看他们数据的另一部分(测试集)的结果。当事情不可避免地没有照预想那样进展时,研究人员将调整参数,或者数据的特征,或者使用的算法。 随着时间的推移,结果会变得过拟合,因为测试集的值被每个新测试污染了。

过拟合的解决方案

通过机器学习,我们可以通过限制人的参与来设置整体投资框架,从而使过拟合最小化。这个框架将包括备选投资域、交易频率、性能基准、信号数据源和风险约束。我们将让系统自动发现投资策略的具体组合。

这个框架还将指定机器将能够访问的 ML 技术类型。本质上说,股市分析员将分析更高级别的函数。其他更为常规的步骤,比如测试、评分和调整不同结构,都将由机器处理,而机器遍历历史的方式也将与人类在现实中做的相同。

机器学习的进步将使任务进一步自动化,包括特征发现、算法选择,甚至实现信号的交易代码的优化。使用这些新的方法,人类可以花时间创建框架,或者获得新的数据集。自动化方法还减少运行公司所需的股市分析员的数量,鉴于他们往往薪酬高昂,这一点也变得越来越重要。

能够使自动化策略发现成为可能的工具,同时也将使定制解决方案成为可能。这是因为你能在框架中预先就指定好成功策略的标准。例如,一种方法可以搜索具有与经典索引的指定最大偏差的策略,例如美国 small-cap value。这种类型的定制可能催生一类新的零售投资产品。

我们认为机器学习对于资产管理将变得越来越重要,大多数公司将在 5 年内利用机器学习工具或数据。人的参与对于风险管理和框架选择仍然至关重要,但越来越多的战略创新过程将被自动化。

来源:pionline.com

作者:David Andre & Conrad Gann

译者:刘小芹 张易 文强