1、策略探索:形态识别结合多模态舆情分析虞 堪 国 泰 君 安 期 货首席分析师投 资 咨 询 从 业 证 书 号:Z 0 0 0 2 8 0 4日 期:2 0 2 5 年 6 月 2 5 日01形态识别目录CONTENTS02情绪分析03多模态舆情分析形态识别01/提取特定的规则提取特定的规则通过定义特定的K线形态规则,如头肩顶、头肩底、双顶、双底等,来寻找历史中相似的K线形态。相关性相关性使用相关系数来衡量两段K线之间的线性关系。相关系数接近1表示高度正相关,接近-1表示高度负相关,接近0表示无明显线性相关性。欧氏距离欧氏距离计算K线之间的欧氏距离,距离越小表示相似度越高。对K线的收盘价、开盘
2、价、最高价和最低价进行归一化,以消除量纲的影响。第 4 页相似形态的传统思路欧氏距离可以用于计算具有多个特征的两个样本之间的距离。在多维空间中,每个样本可以表示为一个特征向量,而欧氏距离则衡量这些特征向量之间的直线距离。/第 5 页相似形态的传统思路资 料 来 源:米 筐,国 泰 君 安 期 货 研 究资料来源:米筐,国泰君安期货研究/第 6 页相似形态的传统思路:存在的问题规则单一不灵活,需要手动定义和识别形态,品种间差异降低效果。对形态的定义可能存在主观性,不同分析师可能有不同的理解。经验为主,不能很好地适应行情演变。无法捕捉复杂的形态特征。1234/第 7 页相关性&欧氏距离相关性:相关
3、性:0.83欧氏距离:欧氏距离:111.1相关性:相关性:-0.18欧氏距离欧氏距离:318.5资 料 来 源:米 筐,国 泰 君 安 期 货 研 究资料来源:米筐,国泰君安期货研究/第 8 页动态时间规整动态时间规整是一种用于衡量两个时间序列之间相似度的方法,可以处理时间序列的伸缩和变形。核心思想是通过引入额外的时间维度,找到两个时间序列之间的最优对齐路径,使得这两个序列在形状上的差异最小。语音信号具有相当大的随机性,即使同一个人在不同时刻发同一个音,也不可能具有完全的时间长度。资 料 来 源:米 筐,国 泰 君 安 期 货 研 究资料来源:米筐,国泰君安期货研究ABC/第 9 页动态时间规
4、整资 料 来 源:米 筐,国 泰 君 安 期 货 研 究资料来源:米筐,国泰君安期货研究/第 10 页动态时间规整Savitzky-Golay 滤波器是一种基于多项式拟合的平滑滤波器,能够有效减少数据中的噪声,同时保留数据的主要特征。SG滤波资 料 来 源:米 筐,国 泰 君 安 期 货 研 究资料来源:米筐,国泰君安期货研究/第 11 页动态时间规整资 料 来 源:米 筐,国 泰 君 安 期 货 研 究资料来源:米筐,国泰君安期货研究情绪识别02/第 13 页盘后信息的缺失 根据日内信息构建形态识别因子,回测时间从2021年起。次日开盘交易的效果显著下降,累计收益从94%下降至71%,有23
5、%的收益在随机的隔夜信息中损失。隔日之后,市场情绪可能是有些变化的-0.200.20.40.60.811.2差额当日收盘次日开盘资 料 来 源:米 筐,国 泰 君 安 期 货 研 究资料来源:米筐,国泰君安期货研究/第 14 页情绪衡量方式Keynes的“选美比赛”理论1936年,约翰梅纳德凯恩斯(John Maynard Keynes)指出,投资者在金融市场中往往不是基于资产的基本面价值进行投资,而是试图预测其他投资者的行为和预期。关键不是你认为谁漂亮,而是猜大家会选谁。投资者情绪调查:通过定期对投资者进行问卷调查。基于盘中交易行为数据的方法:它利用多个指标的互补性,通过技术手段去除无关信息
6、,从而提取出更纯净的情绪信号。利用非传统的数据源来提取投资者情绪:通过分析社交媒体平台上的用户言论。/第 15 页基于盘中交易数据的情绪选取于若干个可以表征投资者情绪的代理,使用降维技术提取共同信息,从某证程度上获得提纯的投资者情绪。提纯后情绪的价值:经过降维技术提纯后的投资者情绪,去除了无关因素的干扰,更能反映投资者情绪的核心特征,因此具有更强的预测性能。它可以用于预测市场走势、资产价格波动等。复合指标换手率成交量消费者信心指数投资者信心指数新增账户数量封闭式基金折价率市盈率逆回购利率基差单个代理的局限性:单个情绪代理可能因为包含过多无关信息或噪音,而与价格走势没有明显的相关性。资 料 来