最近想做个炒股辅助决策系统,请大家帮我捋一捋思路

C
CRH1235
楼主 (未名空间)
就是自动提示买入卖出点的,对时间要求不高,更新频率最高一小时一次。做中长期投资辅助决策用的。可以放在自己的小server上分享给亲戚朋友。纯属业余爱好,准不准的都是其次。还望版上各位AI大牛数据狂人给点意见。

数据源:
Pandas自带的上证指数(日线级别的的有,不知道小时级别的有没有,没有去哪里找?)。

训练数据:包括OHLC价格,成交量,各种常见指标等feature的时间序列数据。还有什
么feature可以用?

Label(买入卖出点):历史数据里找拐点,这个估计可以自定义一些规则很容易筛出
来,自动标记。

训练方法:用LSTM或者XGBoost之类的流行方法,试过才知道

工具:Tensorflow+Keras / XGBoost / Jupyter notebook / Pandas / Bokeh (还有什么
简单易用的好工具可以试试?)
j
jtms
2 楼
你别看不起linear model嘛,上来就用deep learning,会死的很惨
f
fuweidavid
3 楼
我教你个简单的,就是大师割肉你买入,大师买入你做空。大师嚎叫你关注!不需要任何技术绝对赚钱
s
squash
4 楼
你要考虑是上纯supervised还是reinforcement。

如果是纯supervised,哪些feature做输入,哪些做输出?
输入仅仅包括TA(股价,成交量,各种TA指标)?还是也考虑FA,行业整体评价,行业内平均,各种financial数据?
股价若干时间后的变化是输出?
个人意见是仅仅靠日线,靠TA是做不出来啥东西的。如果有每一次交易的成交记录可能会好很多。

至于是用deep learning还是传统的classification/regression倒是其次的。
估计你动手试一试才更有思路。

如果是reinforcement learning,你需要试不同的policy, value function。可以盲选,可以基于supervised的结果选,可以基于网上高手们发的成功交易来选。

【 在 CRH1235 (江左没狼) 的大作中提到: 】
: 就是自动提示买入卖出点的,对时间要求不高,更新频率最高一小时一次。做中长期投
: 资辅助决策用的。可以放在自己的小server上分享给亲戚朋友。纯属业余爱好,准不准
: 的都是其次。还望版上各位AI大牛数据狂人给点意见。
: 数据源:
: Pandas自带的上证指数(日线级别的的有,不知道小时级别的有没有,没有去哪里找?
: )。
: 训练数据:包括OHLC价格,成交量,各种常见指标等feature的时间序列数据。还有什
: 么feature可以用?
: Label(买入卖出点):历史数据里找拐点,这个估计可以自定义一些规则很容易筛出
: 来,自动标记。
: ...................
C
CRH1235
5 楼
谢谢!等我做一段时间有体会了再来答大牛的问题

【 在 squash (南瓜之夭夭) 的大作中提到: 】
: 你要考虑是上纯supervised还是reinforcement。
: 如果是纯supervised,哪些feature做输入,哪些做输出?
: 输入仅仅包括TA(股价,成交量,各种TA指标)?还是也考虑FA,行业整体评价,行业内
: 平均,各种financial数据?
: 股价若干时间后的变化是输出?
: 个人意见是仅仅靠日线,靠TA是做不出来啥东西的。如果有每一次交易的成交记录可能
: 会好很多。
: 至于是用deep learning还是传统的classification/regression倒是其次的。
: 估计你动手试一试才更有思路。
: 如果是reinforcement learning,你需要试不同的policy, value function。可以盲选
: ...................
c
cashmier02
6 楼
找点事干挺好的,省得天天在这pump nvda,
C
CRH1235
7 楼
pump NVDA搞不好是积德行善

【 在 cashmier02 (默默的灌水) 的大作中提到: 】
: 找点事干挺好的,省得天天在这pump nvda,
l
lyf586888
8 楼
第一反应。
凑足10个字。

【 在 cashmier02(默默的灌水) 的大作中提到: 】

: 找点事干挺好的,省得天天在这pump nvda,
n
noregrets
9 楼
我曾经也想写一篇论吴清源十盘棋中的妙恶手来着, 后来发现无论是棋还是市场我充
其量只能感受到风动而已, 但是也正因为这个, 机器了我对市场的超级兴趣。
C
CRH1235
10 楼
主要是只做日线级别的数据量就不大了。总共才几千个数据点。很容易over fitting。靠谱的小时线,分钟线的数据貌似不好找。免费的多半有错。

【 在 jtms (jtms) 的大作中提到: 】
: 你别看不起linear model嘛,上来就用deep learning,会死的很惨
j
jtms
11 楼
数据越少,越需要用简单的模型防止overfitting啊
想要增加数据点,可以把上证的成分股加进来,或者去淘宝买更精细的数据
跟你nvda赚的钱相比,买数据花不了几个钱

【 在 CRH1235 (江左没狼) 的大作中提到: 】
: 主要是只做日线级别的数据量就不大了。总共才几千个数据点。很容易over fitting。
: 靠谱的小时线,分钟线的数据貌似不好找。免费的多半有错。
C
CRH1235
12 楼
我是同意你的说法的呀。我是说数据少,用DL容易over fitting。

【 在 jtms (jtms) 的大作中提到: 】
: 数据越少,越需要用简单的模型防止overfitting啊
: 想要增加数据点,可以把上证的成分股加进来,或者去淘宝买更精细的数据
: 跟你nvda赚的钱相比,买数据花不了几个钱
s
squash
13 楼
别抬举我了。

瞎说几句而已。

【 在 CRH1235 (江左没狼) 的大作中提到: 】
: 谢谢!等我做一段时间有体会了再来答大牛的问题
j
jtms
14 楼
给你个题目练练手吧https://www.kaggle.com/c/two-sigma-financial-modeling

【 在 CRH1235 (江左没狼) 的大作中提到: 】
: 我是同意你的说法的呀。我是说数据少,用DL容易over fitting。
n
nz5000
15 楼
编程高手一定中赚大钱啊。
C
CRH1235
16 楼
谢谢

【 在 jtms (jtms) 的大作中提到: 】
: 给你个题目练练手吧https://www.kaggle.com/c/two-sigma-financial-modeling