模型训练

从金融角度看,模型训练是利用历史数据,通过特定算法构建并优化数学模型的过程。其目的是揭示隐藏在海量数据中的规律,并预测未来趋势。在金融风险评估、投资策略制定、市场预测等核心领域,模型训练发挥着至关重要的作用。它能够将复杂的金融现象转化为可量化、可操作的数学表达,帮助决策者规避风险,发现价值投资机会,以及把握市场动态。随着数据量和计算能力的不断提升,模型训练在金融领域的应用将越来越广泛,成为推动金融行业创新和发展的重要驱动力。

kd_gld的作业

今日作业:

\

1、请用自己的话解释什么是量化投资

答:

量化分几步

1 数据分析与挖掘:

  • 分析挖掘价格信息 与 其他信息( 比如 交易信息,基本面信息, 宏观信息等) 之间单维或者多维的关系。
  • 关系可能是线性的,非线性的,时间序列的,横截面的等。
  • 关系的具体化可以是指标(macd, rsi, art等),因子(小市值,高股息等),机器学习模型(lightgbm,stockranker等),深度学习模型(deepseek交易员等),多智能体(TradingAgent等)。


2 交易策略建立以及回测:

  • 根据挖掘的关系,建立交易策略。

更新时间:2025-08-14 13:49

kr_gld的作业

数据获取思路:

1 用with , 将sql 分成三步 data_base,data_normalized ,以及features ,label 定义

2 data_base 获取初始字段,data_normalized 标准化, 以及pck_rank_by,获取横截面因子,m_leg 避免未来函数


模型fit

1 取 50天 训练数据,10 天测试数据

2 用线性回顾计算(xgboost 计算时间太长。。)

2 打印 r2

[https://bigquant.com/codesharev3/bc775119-ade8-4d25-ad2b-78ea8beee677]

更新时间:2025-08-14 13:49

Liujunze_作业

一、作业结论:

1、作业任务:通过将dai 函数喂给模型,让模型按照里面的算式构建因子,会形成越来越复杂的因子

2、作业结果:通过很普通的话术,一步步训练“模型”形成的因子,一步步走向构建复杂因子的方向,一步步从极大负收益可以调试到接近正收益。

二、作业过程:

1、先是按照老师的方法,在genimi上输入“喂养的“信息,然后开始训练,整个过程比较顺利。

2、然后计划将方法在本地的VScode中实验,用了Gemini 模型,过程和1差不多;但是有个问题是,每次输出信息的时间需要很久。

三、作业总结:

1、作业训练得出了4个因子,都是越来越复杂的,后面可以继续再尝试(开始输入的信息,

更新时间:2025-08-14 06:01

猫见愁Terry_作业

折腾了几天,终于把3个模型的训练和比较都弄完了,走了很多弯路,训练模型也耗费了大量的时间,虽然作业完成得慢一些,但是在做的过程中得到了很大的提高,主要有以下几点心得:

1、对整个AIStudio工作环境更加了解,各个功能也都再熟悉了一遍,操作更顺手了

2、在完成作业过程中遇到过很多不明白的问题,通过站内查询和询问AI,基本都得到了解决,特别是AI,帮助特别大,对于一个写了10年程序,但也有15年没碰过程序的过气程序员来说,再次写代码还是有些困难的,但有了AI,比我之前到处百度和谷歌强太多了,效率高太多了

3、对BigTrader和DAI的了解更深了,很多不知道的类、方法、函数,都通过这几

更新时间:2025-08-12 07:17

bqzzgc5a

直接取了小市值作为因子,训练了因子与未来10天收益率的关系。代码水平和时间有限,仅到能运行的程度,后续还需要很多时间继续优化。

https://bigquant.com/codesharev3/dcd2ef10-85d6-46fa-ba73-1ada53f6f300

\

更新时间:2025-08-11 12:58

Liujunze_作业

一、作业结论:

本次作业采用了线性回归和xgboost两种模型:

年收益分别是:线性回归30%、xgboost 52%。

二、作业过程:

1、搭建模型的框架

(1)框架的模型是按照“滚动训练策略”搭建起来的

(感受:原本自己在结合AI 搭建的,后来因为处理各种各样的错误花了很多时间,所以就直接借用了)

(2)策略搭建后直接测试线性回归,然后替换框架内的模型测试xgboost模型

(感受:搭建框架后相对简单多了,就是替换对应模型的代码,更多的是需要等待模型的训练)

2、加入因子进行训练

(1)用的都是“滚动训练策略”,有些经过微改

更新时间:2025-08-11 12:00

喜澄的作业

按照本次作业要求,我根据笑宇老师的讲解及给的模版,借住AI编程,分了几个步骤,完成作业如下:

1、先根据之前老师的讲解,选择小市值因子、换手率因子等有效因子,构建策略因子组合,时间关系选了4个,后续可以用老师讲解的因子分析表替换可能的有效因子\n2、基于笑宇老师给的模版,运用AI完成线性回归策略,几经周折,跑通策略;\n3、将策略打包成模块,将可用的3个模型作为参数,构建多因子多模型策略,跑通;\n4、将策略输出用图表展示出来。前后整了3天,修改了10几个版本才成型,累得够呛,但最终跑通还是欣慰的\n\n学习心得:\n1、因子重要还是模型重要?\n我的理解是二者都很重要,但因子相对更重要。从

更新时间:2025-08-11 08:58

【其他】为什么loss值是nan啊?

更新时间:2025-05-08 10:27

LSTM+CNN深度学习预测股价

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

策略案例

https://bigquant.com/experimentshare/c13d6baefe5d4c75bb87eea9364b0f75

\

更新时间:2025-04-15 07:19

如何计算板块收益率构造模型训练标注和模型过滤

问题

如何计算板块收益率构造模型训练标注和模型过滤

视频

[https://www.bilibili.com/video/BV1p8411t7LH/?vd_source=ecd29bbd04cbefdfa426167c55241973&t=0.3](https://www.bilibili.com/video/BV1p8411t7LH/?vd_source=ecd29bbd04cbefdfa426167c55241973&

更新时间:2025-04-15 07:19

如何在全连接层中自定义swish激活函数

问题

如何在全连接模块中自定义swish激活函数的代码

\

视频

https://www.bilibili.com/video/BV1DL4y1w7sb?share_source=copy_web

策略源码

[https://bigquant.com/experimentshare/9f1dae69e055429c9922b4f5d038361a](https://bigquant.com/experimentshare/9f1d

更新时间:2025-04-15 07:19

深度学习在期货高频上的应用

8月19日Meetup问题模板:

https://bigquant.com/experimentshare/f58dbfb388454407b8a2b99eb14cf1ea

\

更新时间:2025-04-15 07:19

深度学习在期货高频上的应用

问题

深度学习在期货高频上的应用

策略源码

8月19日Meetup问题模板:

https://bigquant.com/experimentshare/f58dbfb388454407b8a2b99eb14cf1ea

\

更新时间:2025-04-15 07:19

【平台使用】用户自定义机器学习模型如何接入有文档教程吗

如题,目前平台可用的模型较少,仅有随机森林一种,如果不想使用平台的机器学习模板,打算自己实现一个类似时间序列的模型,包含模型训练、模型评估等,目前有文档参考如何操作吗

更新时间:2025-02-24 08:38

【平台使用】用财务因子怎么构建机器学习策略?

\

更新时间:2025-02-16 02:18

【指标定制】神经网络dnn模型sql标签怎么写,预测的时候总是维度不匹配,因为多了标签列

/* 使用DAI SQL为量化模型预测生成标签数据。标签反映了未来5日的收益率,并且被离散化为20个桶,每个桶代表一个收益率范围。这样,我们就可以训练模型来预测未来的收益率范围,而不仅仅是具体的收益率值。

  1. 首先定义了一个名为label_data的临时表,用于计算和存储未来5日收益率,其1%和99%分位数,以及离散化后的收益率(被分为20个桶,每个桶代表一个收益率范围)。
  2. 对未来5日收益率进行了截断处理,只保留在1%和99%分位数之间的值。
  3. 选择了标签值不为空,并且非涨跌停(未来一天的最高价不等于最低价)的数据
  4. 从这个临时表中选择了日期、股票代码和标签字段,以供进模

更新时间:2025-02-16 01:51

【平台使用】如何基于平台的xgboost,自定义目标函数呢?

自己通过import xgboost可以实现自定义目标函数,但是和平台的xgboost模块相比,自己的import xgboost比平台的xgboost模块慢了很多,时间花费几乎是30倍差距。

那么,如何基于平台的xgboost,实现自定义目标函数的定义呢?


\

更新时间:2025-02-16 01:08

【平台使用】请教dl中一些问题

问题

  1. 如何设置训练步长,在训练模块中没有这个选项
  2. 如何设置验证集,并打印loss、mae等,按照模板智能看训练集的

{w:100}{w:100}

验证集通过这个端口传入,构造方法和训练集一样。只需要设定开始和结束的日期。

步长可以通过

![{w:100}{w:100}](/wiki/api/attachments.redirect?id=276f2f17-0d2e

更新时间:2025-02-16 01:06

【其他】三种构建大盘风控指标的方法关于策略代码能否提供?谢谢

三种构建大盘风控指标的方法关于LSTM+CNN的模型进行大盘风控的策略代码未找到,能否提供一下,谢谢。

https://bigquant.com/wiki/doc/dapan-zhibiao-fangfa-MoB3kNcAMG

更新时间:2025-02-15 15:09

【其他】为什么LightGBM不能输出特征重要性

后面会报错

https://bigquant.com/experimentshare/16f3f6c7fa904475ac8a131e2345ab0a

\

更新时间:2025-02-15 15:04

【代码报错】keras调用失败

{w:100}说是有:

https://bigquant.com/wiki/doc/mokuai-aBcAf1yeFo

更新时间:2025-02-15 14:24

【代码报错】"模型训练报错 Segmentation fault"

{w:100}麻烦工程师兄弟看一下

更新时间:2025-02-15 14:06

【其他】预测下跌要怎么打标签

/* 使用DAI SQL为量化模型预测生成标签数据。标签反映了未来5日的收益率,并且被离散化为20个桶,每个桶代表一个收益率范围。这样,我们就可以训练模型来预测未来的收益率范围,而不仅仅是具体的收益率值。

  1. 首先定义了一个名为label_data的临时表,用于计算和存储未来5日收益率,其1%和99%分位数,以及离散化后的收益率(被分为20个桶,每个桶代表一个收益率范围)。
  2. 对未来5日收益率进行了截断处理,只保留在1%和99%分位数之间的值。
  3. 选择了标签值不为空,并且非涨跌停(未来一天的最高价不等于最低价)的数据
  4. 从这个临时表中选择了日期、股票代码和标签字段,以供进模

更新时间:2025-02-15 12:01

【代码报错】已解决:stockranker训练到第9轮报错

https://bigquant.com/codesharev2/8a7c55c5-b437-4d23-9f53-47d0f41fbd98

\

更新时间:2025-02-15 10:58

【平台使用】两个问题求解

1,训练和回测用同样的时间段,得到的结果依然很差?

2,在训练模式中,用回归选项就报错?

\

更新时间:2025-02-14 10:43

分页第1页第2页第3页第4页
{link}