10 - 拟合
然而,在判定量化策略的优度时,仍有一个极其重要的指导原则,这就是过度拟合。模型的过度拟合本质上意味着研究员使用过多的数据。最经典的定义是研究员建立了一个能够很好解释过去的模型,但对未来解释性较差。这可能发生于几种情况。
第一,研究员必须对模型的复杂度加以注意。模型的复杂度来自几个方面。一个是预测因子的数量。在建立模型时,研究员可以采用数千个因子解释资产价格过去的波动。模型或多或少能够精确解释过去发生的事情。但是让我们来回想量化交易模型的目的,类似于寻找阿尔法的交易者的目的,是预测未来,而不是解释过去。
第二,研究员由于条件的限制,创建相当复杂的模型。例如,可以设想一个为了判定持有多头或空头头寸而寻找价格行为的特定模式的策略。对于宽客,节约意味着做出假设时保持谨慎。
在量化交易中,这处在研究过程的绝对中心位置。节约型模型使用较少的假设条件,尽可能简洁地解释未来。正因如此,对有许多参数或因子的模型通常要持怀疑的态度,尤其要考虑过度拟合的风险。
在科学领域,这被理解为,使用尽可能少的假设条件,尽可能简单的理论解释事物。正是这样,量化研究员工作的一个重要部分是在尽力过于完美地解释过去和尽力简单地解释过去之间进行权衡。倾向于任何一边都是失败,因为这样模型会过于复杂化或过于简单化。
潜在的过度拟合风险的另一个常见来源是参数的具体说明。例如,在构建趋势模型时,研究员认为过去一段时间里价格变化的一些特征可能暗示着未来趋势的持续。可以想象,与这个模型相关的几个参数。
参数拟合的另一个方法是利用各种各样的参数值对策略进行回测,选择使得结果最优的参数。我们建立的模型本身就是对未来的一般性指引的概括性描述,当以这种方式进行表述,很清楚我们宁愿模型更谨慎一些,不要犯错。
参数拟合的最后一个注意点是参数或者只能适用于过去,或者随着市场数据的不断更新,参数能在未来重复使用。这里所考虑的情况适用于参数拟合的每一个实例。然而,重复拟合参数本身会增加模型的复杂性。而且,取决于重新拟合实施的过程,也可以使用尽可能少的数据进行拟合,以免出现过度拟合的现象。
标签:10,研究员,解释,模型,参数,拟合,量化 From: https://www.cnblogs.com/nomornings/p/17158006.html