在机器学习领域,特征指“被观测对象的可测量性能或特性”,“特征工程处理”是指在给定数据、模型和任务的情况下设计出最合适特征的过程,相当于梳理数据并结合业务需要提取有意义的信息,以干净整齐的形态进行组织。
金融数据有低信噪比的特点,提取有效信号的难度较大,模型如果调整不够得当,就容易学习“噪音”。由于这一特性,量化投资在模型开发和调校时尤其强调避免过拟合。
在量化选股中,因子是指“对个股收益差异有解释作用的特征”,能够解释投资组合的收益或帮助进行资产定价。因子的有效性主要看预测能力。一个因子被验证为有效,是在某历史时间段内的数据所呈现出来的规律,并不意味着该规律在未来的市场中可以持续有效。
“超额收益”通常指某一规定时间段内基金所产生的收益超过业绩基准的部分。对于量化指增产品,对标指数自然成为其业绩标准;而对于全市场选股产品,通常设定万得全A指数为业绩参考基准,为了跟踪观察更方便、横向对比更直观,也可以将中证1000或者中证2000 设为业绩参考基准。
换手率指投资组合在一段时间内转手买卖股票的频率,也称“持股周转率”,常用于衡量投资组合交易频繁程度。市场上多指“年度双边换手率”,其计算公式为:换手率=(卖出金额+买入金额)/ 资产规模。
海外把量化投资策略分为三大类:高频策略、统计套利策略和基本面量化策略。其中,高频是相对于“非高频”的概念,在极短的预测周期内寻找市场流动性不均衡和其他短期价格无效机会,赚取买卖价差而获利。
在提及交易工具时,我们也常看到“量化交易”的描述,但其易被误认为“量化的交易”,定义含糊。实际上量化投资也会用到手动交易,为了避免混淆,可使用更为严谨的“程序化交易”。
从广义上讲,量化投资(Quantitative Investment)是一种以数据为基础、以模型为核心、通常以程序化交易为工具的投资方法。
在新的一年,投资者如何增进对量化投资的理解,更准确把握量化投资的入场机会?如何考察长期收益的稳定性、选择更适合自己的产品?