摘要:随着大数据时代的到来,社会经济领域的数据来源更为多元化。在股票市场中,股票收益率的影响因素一直是研究...随着大数据时代的到来,社会经济领域的数据来源更为多元化。在股票市场中,股票收益率的影响因素一直是研究中的一个热点问题,从国内外学者的相关文献了解到,以往研究股票收益率时主要从宏观经济指标和微观经济指标两个方面分别研究。但随着数据来源的多元化,可供股票收益率研究的经济指标数量剧增,在现阶段研究中业界更希望找出那些对收益率有重要影响的因素。此外,对股票收益率的研究不应割离宏观经济指标与微观经济指标,且已有的研究表明宏观经济指标对股票收益率具有门槛效应。本文提出了带Sparse Group LASSO惩罚的门槛回归模型,既能够估计回归模型的门槛值同时能够对解释变量进行变量选择。为了能够正确估计回归模型的门槛值,使用光滑最小二乘法同时借助牛顿拉夫森法求解目标函数的极值,从而得到估计的门槛值。为了判断估计门槛值是否为真实门槛值,在目标函数中加入Sparse Group LASSO惩罚对变量进行选择,从而将真实门槛值的判断转换为变量选择问题。为了检验SGL门槛回归模型的参数估计及模型拟合的有效性,本文借助蒙特卡洛模拟方法,对一阶SGL门槛回归模型、二阶SGL门槛回归模型及其他对照模型的参数估计及模型拟合进行对比。蒙特卡洛模拟中,二阶SGL门槛回归模型的参数估计偏差与稳健性都优于其他四类模型,对关键参数的估计准确率能达到100%。本文将SGL门槛回归模型应用到股票市场,研究沪深300、中证500及中证800指数收益率的影响因素,67个解释变量分为三类:公司财务指标、基本面指标及风格因子指标,门槛变量为全国居民消费物价指数。实证中,二阶SGL门槛回归模型的模型拟合优于其他四组对照模型,其结果显示,沪深300指数收益率有两个真实门槛值:CPI=102.244及CPI=103.723;中证500指数收益率同样有两个真实门槛:CPI=102.026及CPI=104.037;中证800指数收益率也有两个真实门槛值:CPI=102.026及CPI=104.03。该结果拓展了现有研究认为股票收益率只有一个门槛值CPI=102的结论,发现在CPI=104附近同样会对股票收益率产生门槛效应。更多还原显示全部