首页 💰 Web3掘金 日入千刀之路(9):AI量化之DeepSeek用于BTC价格预测可行性分析

日入千刀之路(9):AI量化之DeepSeek用于BTC价格预测可行性分析

日入千刀之路(9):AI量化之DeepSeek用于BTC价格预测可行性分析

上上篇,《日入千刀之路(7):AI量化策略之DeepSeek R1满血版能炒股么》,我们得出一个重大的结论:DeepSeek等Transformer模型有潜力完全替代LSTM等传统机器学习模型来预测金融市场K线走势,且大家均处在探索前期。

对于此话题,我进行了更加深入的实操性方案研究。

以下结论经由DeepSeek R1以及Claude Sonet 3.7数十轮对话总结得出。

1、DeepSeek、GPT、Llama等模型主要设计用于文本推理任务,而非金融时间序列预测。

2、DeepSeek等能处理文本数据(新闻、事件),而将数值市场数据(K线、指标)转换为模型能有效利用的模式需要大量工程工作。

3、金融市场,特别是加密货币,受众多不可预测因素影响。

金融理论中的"有效市场假说"和"随机游走理论"表明价格走势在很大程度上是不可预测的。

4、将市场数据(K线、指标)转换为大语言模型可用的格式确实是可行的。

方法1:结构化文本描述转换,将K线形态、趋势转换为文字描述
方法2:表格化数据输入,将数据以表格或JSON格式提供给模型

5、从理论上讲,如果存在价格数据中的某种模式,一个强大的语言模型可能能够"学习"这些模式。

LLM在文本中能够识别复杂的模式和结构,理论上,它们也可能在数值序列中识别模式(如趋势、循环、支撑/阻力水平)。

如果模型接受足够的训练,它可能学会关联某些价格序列与后续价格走势。

模型可能学会识别数值之间的相对关系(上升、下降、波动幅度等)。

6、实际上:原始价格数据缺乏结构化的特征,使模型难以提取有用信息;金融市场数据含有大量噪音;直接使用原始价格数据进行训练,实际效果可能非常有限,不如使用预处理数据和结构化特征。

相比学习预先计算好的技术指标,从原始数据"悟出"规律需要指数级更多的计算资源。

7、更有效的替代方法:提供预计算的技术指标,各种移动平均线、RSI、MACD、波动率指标等,将这些作为结构化输入提供给模型。

8、预估使用技术指标数据进行LLM训练的可能效果:技术指标可能使模型更容易识别市场状态,指标之间的相互关系(例如RSI超买同时MACD出现背离)可能会被模型捕捉。

预测能力:技术指标已经被设计为有预测意义的信号,模型可能学会关联某些指标组合与后续价格走势的统计关系。

9、基于分析,可以做出以下训练效果预估
市场状态识别:模型可能学会识别典型的市场状态(超买/超卖、趋势/盘整)
预估准确率:65-75%

技术形态识别:可能学会识别头肩顶/底、双顶/双底、三角形整理等经典形态
预估准确率:60-70%

指标组合分析:可能捕捉到多个指标协同确认的信号(如RSI超买同时MACD背离)
这种复合信号的识别准确率可能达到60-65%

10、如果使用这种结构化的技术指标数据进行AI模型微调,是否可以训练模型输出同样结构化的JSON格式数据,从而实现某种预测效果?

完全可行。将模型训练为接收技术指标JSON并输出预测性JSON是一种常见且有效的实现方式。
例如:
"情景分析": [
{"情景": "乐观", "价格目标": 36500, "概率": 35},
{"情景": "中性", "价格目标": 35800, "概率": 50},
{"情景": "谨慎", "价格目标": 34500, "概率": 15}
]

这种JSON输出格式模型确实可以实现一定的预测效果,特别适合作为量化交易系统的决策辅助组件或技术分析师的参考工具。

(意味着完全可以为量化策略的应用训练一个专用的预测模型。)

11、如果训练数据包含当天的技术指标数据以及未来14天的价格,能否使AI自己发掘技术指标与未来价格变动之间的关系?

结论:是的,这种训练方式可以起到有效果。

让AI从纯技术指标数据自行发掘与未来价格关系是机器学习的核心优势之一,特别适用于此类问题。

实际上,这种方法已在量化交易中广泛应用:

  • 对冲基金采用类似方法构建中频交易系统
  • 成功案例表明这种方法能捕捉短期市场低效率
  • 典型应用是预测未来1-5天的价格走势,而非更长期预测

12、DeepSeek类模型的微调通常需要输入部分、思维链部分、输出部分。但我们只有价格和技术指标数据,没有现成的"思维链"和"输出",怎么办?

即使只有技术指标和价格数据,我们仍然可以构建有效的CoT训练数据集,良好的数据集设计可以让模型学习技术指标与价格变动之间的潜在关系,通过思维链提高分析深度和可解释性,最终形成一个能提供合理价格预测和交易建议的专业化模型

13、训练目标:让AI自己从数据中学习技术指标与未来价格之间的关系,这个需求实际上更接近于传统的机器学习任务,即从输入到输出的映射关系学习,而不是透过人工构造的推理过程。然而,基于DeepSeek R1的微调通常依赖于带有思维链的训练数据。不过仍有解决方案,我们可以想出多种方法实现让模型真正从数据中学习规律,而非简单模仿人类分析师的表达方式,实现了"自行悟道"目标。

14、总结中的总结:

  • 这是个工程问题,需要大量工作。
  • 可行性取决于训练目标,如果训练目标是让模型自行发掘指标与未来价格数据之间的联系,完全可行。
  • 这也就是使用transfomer模型替代传统机器学习模型的趋势,也是我们的实践之路。
  • 关于训练方法,里面的门道非常深,需要多种方法并用。
  • 最重要的是,需要堆钱。

若有大佬感兴趣,可以探讨。

关于作者: 苏江

热门文章

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注