压缩包内含沪深股市全市场股票的日K线数据,包含开盘,最高,最低,收盘,成交量,成交金额,涨跌百分比。数据从1990年开始至2025年年末,数据非常全,适合做A股市场的量化分析,甚或做大模型的训练数据。数据量较大,分成两个CSV文件,较大的文件主要是日K线相关数据,较小的文件是股票名称,行业等信息,压缩在一个.zip文件中。数据从tushare上分段爬取,数据并未按时间顺序排列,下载加压后可自行排序。
2026-01-26 21:54:24 439MB 量化交易
1
本文介绍了QMT量化实战系列中的多因子策略,该策略支持自定义筛选与排序,实测年化收益超过100%。策略通过Tushare获取数据并合成因子,包括市盈率、市净率、股息率等多个指标。筛选逻辑排除了ST股票、上市天数不足的股票以及特定板块的股票。排序逻辑支持多因子自定义排序,并为各因子分配独立权重。交易逻辑包括卖出和买入策略,卖出逻辑基于股票排名,买入逻辑则根据账户总资产均分资金。文章还提供了后续扩展方向,如月份择时和止盈止损。 QMT量化实战系列中的多因子策略是一套利用计算机算法来指导股票交易的系统方法。该策略的核心在于通过合成多个股票分析指标来筛选优质股票并进行排序,其中包括市盈率、市净率、股息率等关键财务指标。通过精确的数据来源,如Tushare,这些指标得以有效获取并加以应用。 在策略的执行过程中,排除了风险较高的ST股票、上市时间较短的股票以及特定板块的股票,以减少非市场性风险。在排序方面,策略支持自定义排序方式,允许投资者为不同因子分配权重,以便进行更为精准的股票筛选。此外,交易逻辑部分包含了卖出和买入策略,卖出基于股票排名决定,而买入策略则采用总资产均分资金的方式。 文章详细介绍了如何通过该策略获取超过100%的年化收益,同时也不忘指出实际操作中可能遇到的风险以及策略的局限性。此外,还提及了策略未来可能的扩展方向,包括月份择时和止盈止损等风险管理策略,以期在实战中取得更稳定的收益。 这种多因子策略的应用不仅需要投资者具备一定的量化交易知识,还要求他们能够熟练操作QMT这类量化交易平台。多因子策略通过量化模型,将市场经验抽象化,用数学语言表达交易逻辑,从而实现客观、系统的投资决策过程。该策略提供了一种科学的方法来挑选和评估股票,这有助于投资者在日益复杂的金融市场中寻找投资机会。 策略的开发与实施是一个复杂的过程,需要精通编程、金融理论和市场分析。尽管量化交易在提高效率和分析深度方面具有优势,但同时也需要投资者对策略进行不断的测试和优化,以适应市场变化,保证策略的持续有效性。量化交易的门槛相对较高,但是它的灵活性和可扩展性也为投资者提供了广阔的定制空间。 多因子策略虽然在实测中表现出色,但投资者应当意识到任何投资策略都无法完全消除市场风险,投资决策应基于全面的分析和审慎的考量。通过不断学习和实践,投资者可以更加熟练地掌握这种策略,并在实际交易中实现风险管理和收益最大化的目标。
2026-01-25 14:17:43 29KB 量化交易
1
"量化金融研究:周期理论与机器学习资产收益预测" 量化金融研究中,周期理论和机器学习资产收益预测是两个重要的概念。本文将从周期理论和机器学习的角度,探讨资产收益预测的方法和应用。 周期理论是指根据经济周期状态对资产配置的原理。美林时钟模型是宏观择时模型的代表,根据经济周期状态进行资产配置。但美林投资时钟模型并不是一个实时、定量的交易策略,其有效与否的关键在于对经济周期状态的判断是否正确。 华泰金工周期系列研究通过傅里叶变换、联合谱估计等信号处理方法,发现并证实了市场中广泛存在 42 个月、100 个月和 200 个月左右的共同周期。以此为基础,提出了华泰量化投资时钟“周期三因子定价与资产配置模型”。通过计算金融资产同比序列与其周期三因子的回归拟合值、拟合值的增加值等,实现对资产周期状态比较精确且全面的测度。 机器学习是指使用机器学习算法来挖掘资产周期状态与未来市场表现的内在逻辑。机器学习模型能以概率方法建立起资产同比周期状态与未来表现间的非线性联系,并给出收益排序的概率预测。仿真测试证明本文机器学习模型对挖掘上述联系的有效性。 机器学习的基本原理是以二元分类的逻辑回归为例。机器学习模型能够挖掘资产周期状态与未来市场表现的内在逻辑,实现对收益排序的概率预测。 在实证研究中,本文采用集成学习法,计算多种可行参数组合的预测结果,采用“少数服从多数”的原则,平均后确定最终结果,降低模型对参数依赖,更全面有效的利用历史规律。 实证结果证明周期理论与机器学习的研究方法具有不同市场的普适性基于周期理论和机器学习方法预测结果的资产配置实证显示,策略应用于全球和中国市场均有较好表现。与基准的等权配置模型相比,基于周期理论和机器学习方法的策略在年化收益、最大回撤等风险收益指标均有明显提升,充分证明了机器学习能够挖掘市场周期规律并实现更加有效的预测。 周期理论和机器学习方法可以相互结合,挖掘市场周期规律,并实现更加有效的资产收益预测。该方法可以应用于全球股债资产配置,取得良好的投资回报。 风险提示:本文基于华泰金工周期系列研究对全球各类经济金融指标长达近百年样本的实证检验结果,确定周期长度。然而市场存在短期波动与政策冲击,就每轮周期而言,暂无法判断具体长度。周期长度只是估计值,可能存在偏差;历史规律存在失效风险。
2026-01-22 23:23:47 1.15MB 量化金融
1
本文详细介绍了BIM轻量化的流程,特别是通过revit导出GLTF格式的模型文件。文章首先分析了市面上主流的轻量化工具和技术方向,如广联达BIMFace、葛兰岱尔的GLWebGLBIMEngine等,并指出threejs是实现轻量化的主流技术。接着,文章详细阐述了revit的分类结构、编码规则以及插件开发的环境搭建和数据提取方法。重点介绍了GLTF格式的优势及其在revit中的导出实现,包括文件格式定义和导出步骤。最后,文章提到了通过Draco等工具对模型文件进行优化的方法,显著减小了文件大小。整体而言,本文为BIM轻量化和GLTF导出提供了全面的技术指导和实践参考。 BIM(建筑信息模型)作为建筑行业重要的数字化工具,其轻量化处理对于提高工作效率和促进项目协作具有重要意义。本文深入探讨了BIM轻量化流程及其与GLTF导出的相关技术细节。文章分析了市场上流行的轻量化工具和技术路线,其中广联达BIMFace和葛兰岱尔的GLWebGLBIMEngine作为典型案例被提出。这些工具通过优化BIM模型的加载和显示效率,为工程人员提供了更为便捷的操作体验。 文章深入介绍了Three.js技术,它是实现BIM轻量化的一个关键技术。Three.js作为一个开源的WebGL库,使得在浏览器中进行3D渲染成为可能,它的轻量级特性和灵活的接口对BIM轻量化起到了极大的推动作用。文章详细解析了revit软件的分类结构和编码规则,这对于理解BIM模型的组织方式和数据构成至关重要。文章还涉及了revit插件开发的环境搭建步骤和如何高效地从revit中提取所需数据。 紧接着,文章重点介绍了GLTF格式的优势和其在revit中的导出实现。GLTF(GL Transmission Format)是一种开放标准的3D传输格式,它支持将3D模型直接传输到Web应用程序中,无需任何插件。GLTF格式文件的定义、结构以及导出步骤在这部分得到了全面的阐述,为BIM模型的Web化和轻量化提供了直接的技术支持。 除了介绍技术本身,文章还提出了一些模型优化的实用方法,比如利用Draco压缩算法。通过这种压缩技术,可以有效地减小模型文件的大小,而不损失太多的视觉和几何细节,这对于提升模型在网络中的传输效率至关重要。 本文不仅从技术层面详细介绍了BIM轻量化和GLTF导出的流程,而且为相关领域的技术人员提供了实践中的操作指南,无论是对于BIM初学者还是有经验的工程师,都是一份宝贵的学习和参考资料。
2026-01-22 18:59:51 17KB 软件开发 源码
1
基于Python+YOLO姿态估计模型+Deepseek开发的一套能够贴合真实训练场景、提供量化评估与个性化语言指导的“智能羽球教练”系统(源码+模型) 系统攻克“多动作连续分析”这一技术难点,融合YOLOv8姿态估计、多动作分段识别算法与生成式AI,开发一套能够贴合真实训练场景、提供量化评估与个性化语言指导的“智能羽球教练”系统,探索人工智能技术在体育科学领域深度应用的新范式。 实现功能: 从羽毛球训练视频中提取运动员人体关键点(姿态识别 / Pose Estimation)。 计算关键技术指标(如:击球时刻身体姿态、步伐移动距离、手臂/膝盖角度等)。 将这些量化指标组织成结构化描述,发送给 DeepSeek 大模型 API,生成中文自然语言评价与改进建议。 在视频或单帧图像上可视化(骨架、关键角度、评分)。
2026-01-14 11:13:51 5.96MB Python
1
内容概要:SM7算法由中国国家密码管理局于2012年公布,是国产密码算法系列之一,旨在提供高安全性、低计算复杂度的数据加密服务。它遵循GB/T 33928-2017标准,采用128位分组长度和密钥长度,经过11轮加密/解密。核心结构基于线性反馈移位寄存器和仿射变换,包括初始轮密钥扩展、字节代换、行移位、列混淆和轮密钥加等步骤。S-Box表用于非线性替换,基于有限域GF(2^8)的仿射变换,增强了抗差分分析能力。SM7具有良好的抗攻击性和轻量化特点,适用于物联网通信、移动支付和身份认证等场景。; 适合人群:从事信息安全、密码学研究或开发的人员,特别是关注国产密码算法的研究者和技术开发者。; 使用场景及目标:①物联网通信中设备间数据加密;②移动支付交易信息的机密性与完整性保护;③用户身份凭证的安全存储与传输。; 阅读建议:读者应重点关注SM7算法的设计目标、核心结构及其安全特性,了解其相对于其他算法的优势,特别是在资源受限环境下的应用。同时,建议参考提供的优化建议,以更好地理解和实现该算法。
1
卷积神经网络(Convolutional Neural Networks, CNNs 或 ConvNets)是一类深度神经网络,特别擅长处理图像相关的机器学习和深度学习任务。它们的名称来源于网络中使用了一种叫做卷积的数学运算。以下是卷积神经网络的一些关键组件和特性: 卷积层(Convolutional Layer): 卷积层是CNN的核心组件。它们通过一组可学习的滤波器(或称为卷积核、卷积器)在输入图像(或上一层的输出特征图)上滑动来工作。 滤波器和图像之间的卷积操作生成输出特征图,该特征图反映了滤波器所捕捉的局部图像特性(如边缘、角点等)。 通过使用多个滤波器,卷积层可以提取输入图像中的多种特征。 激活函数(Activation Function): 在卷积操作之后,通常会应用一个激活函数(如ReLU、Sigmoid或tanh)来增加网络的非线性。 池化层(Pooling Layer): 池化层通常位于卷积层之后,用于降低特征图的维度(空间尺寸),减少计算量和参数数量,同时保持特征的空间层次结构。 常见的池化操作包括最大池化(Max Pooling)和平均池化(Average Pooling)。 全连接层(Fully Connected Layer): 在CNN的末端,通常会有几层全连接层(也称为密集层或线性层)。这些层中的每个神经元都与前一层的所有神经元连接。 全连接层通常用于对提取的特征进行分类或回归。 训练过程: CNN的训练过程与其他深度学习模型类似,通过反向传播算法和梯度下降(或其变种)来优化网络参数(如滤波器权重和偏置)。 训练数据通常被分为多个批次(mini-batches),并在每个批次上迭代更新网络参数。 应用: CNN在计算机视觉领域有着广泛的应用,包括图像分类、目标检测、图像分割、人脸识别等。 它们也已被扩展到处理其他类型的数据,如文本(通过卷积一维序列)和音频(通过卷积时间序列)。 随着深度学习技术的发展,卷积神经网络的结构和设计也在不断演变,出现了许多新的变体和改进,如残差网络(ResNet)、深度卷积生成对抗网络(DCGAN)等。
2025-12-29 16:43:02 5KB
1
本文介绍了如何通过同花顺交易软件获取股票数据,并将其转换为适合量化交易的DataFrame格式。首先,通过同花顺软件的“历史成交”功能导出股票日线交易数据,并将其保存为CSV格式。随后,使用Python的pandas模块将CSV数据转换为DataFrame格式,详细说明了两种方法:一种是直接使用pandas的read_csv函数,另一种是通过CSV模块的DictReader函数读取并转换为DataFrame。此外,文章还介绍了如何处理数据中的时间列,将其作为索引,并去除日期中的星期几信息。最后,展示了如何将处理后的数据保存为CSV文件。本文为量化交易初学者提供了一种经济便捷的数据获取和处理方法。
2025-12-10 14:41:16 13KB 量化交易 Python数据处理
1
内容概要:本文档提供了一段用于股票市场技术分析的副图指标公式代码。该代码通过一系列复杂的数学计算定义了多个变量(如VAR1到VAR8等),并基于这些变量绘制了不同类型的图形元素,包括文字、柱状图、线条等。特别是定义了“拉升”这一关键指标,用以标识股票可能存在的快速上涨趋势。文档还设置了三条参考线:“主升线”、“拉升线”和“地平线”,以及买卖信号提示。整个公式旨在帮助投资者识别股票的主升浪阶段,为交易决策提供参考。 适合人群:对技术分析感兴趣的股票投资者或交易员,尤其是那些希望利用量化工具辅助判断股票走势的人士。 使用场景及目标:①用于股票交易的技术分析,特别是在寻找潜在的股票主升浪期间;②辅助投资者制定买入或卖出策略,提高交易成功率。 阅读建议:由于该公式涉及较多的技术术语和复杂的数学运算,建议读者先掌握基本的技术分析理论和常用指标含义,同时结合实际行情进行验证和调整,确保其适应特定市场的特点。
1