机器学习专题研究:Adaboost算法下的多因子选股
摘要: Adaboost算法Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的弱分类器,尤其是对难以正确分类的数据重复进行训练,然后把这些弱分类器集合起来,构成一个更强的强分类器。其算法本
Adaboost算法
Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的弱分类器,尤其是对难以正确分类的数据重复进行训练,然后把这些弱分类器集合起来,构成一个更强的强分类器。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来调整每个样本的权值,这样使得难以正确分类的数据得到训练。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。
选股实证
由Adaboost算法得到的强势组合能够跑赢市场,且强势组合,市场指数,弱势组合之间的较为明显的净值差别,算法所构造的组合具有明显的区分度,类似我们也发现所有十档组合之间都有一定程度间隔,说明算法具有有效性。
对比Adaboost方法的结果,回归方法产生的组合从净值数据上不管是强势组还是弱势组都是优于Adaboost算法的。由回归方法与Adaboost算法的净值比图来看,虽然两种方法在回测期截止净值相同,但回归方法产生的组合最高净值更高。当然,可以发现的是,回归法的波动明显比Adaboost算法大,尤其有市场振荡时期。基于Adaboost算法的多因子模型在组合净值的波动率水平上仍有亮点
Adaboost因子与传统因子
从净值曲线上看,考虑了因子大类后的算法选股组合的区分度更高。强势组合与弱势组合的净值差异明显
组合相对HS300指数的超额收益净值曲线相对平稳,最大回撤发生在2014年12月,最大回撤为9%,而在此之前,超额收益的最大回撤为5%左右。从月超额收益上看,组合的月胜率超过50%,达到了56%,整体效果良好。
而对比弱势组合的超额收益,多空策略的净值波动更大,主要的回撤同样发生在2014年底,但策略的胜率仍保持50%以上,达到58%。
组合,算法,分类,净值,Adaboost