第三天的特点避免应用high是因为练习的目标y是big_wave,之所以可以应用当天的low是因为比特币市场的特点为24小时交易,即没有明白的一天的概念,也即没有明白一天中的最低,实盘应用即人工对当缁ゎ低根据24小时最低进行猜测,或直接应用24小时最低,或者应用当前的最新价格都可,构成数据后应用模型进行决定计划,决定计划的结不雅即为将来数小时内是否会有大年夜的波动,实际上最终大年夜波动的决定计划成立,须要其它很多模型合谋生效,比如外盘的走势决定计划等等。
- btc_train0 = btc_siblings_df(btc_train_raw)
- btc_train0.tail()

如上所示如许我们只能获得454条练习集数据,但因为每3条持续交易日数据组合成一个特点,只要向前跳一条数据进行特点组合采取即可以获得另一组新特点,下面分别跳过第一个,第二个数据,采取btc_train1,btc_train2:
- btc_train1 = btc_siblings_df(btc_train_raw[1:])
- btc_train2 = btc_siblings_df(btc_train_raw[2:])
下面将前面保存切割的60条测试数据进行特点采取组合,方法和采取练习集时一样,代码如下所示:
下面把膳绫擎的3组特点连起来,然后把周几这个特点应用pd.get_dummies进行离散化处理,使得所有特点值典范围都在0-1之间,最终的特点如下btc_train所示:
2. abu中内置机械进修模块的应用
下面应用abupy中内置机械进修对象AbuML对特点数据进行封装,代码如下所示,下面的y值等于big_wave列:
- train_matrix = btc_train.as_matrix()
- y = train_matrix[:, 0]
- x = train_matrix[:, 1:]
- btc_ml = AbuML(x, y, btc_train)
AbuML会根据数据特点主动内部选择应用分类器或者回归器,下面进行特指最优分类器操作,比如特指应用随机丛林做为分类器,履行random_forest_classifier_best会在内部对n_estimators参数和练习集数据进行grid search拟合,寻找最合适的参数最终做为内部分类器:
- RandomForestClassifier(bootstrap=True, class_weight=None, criterion='gini',
- max_depth=None, max_features='auto', max_leaf_nodes=None,
- min_impurity_split=1e-07, min_samples_leaf=1,
- min_samples_split=2, min_weight_fraction_leaf=0.0,
- n_estimators=260, n_jobs=1, oob_score=False, random_state=None,
- verbose=0, warm_start=False)
所有best函数中寻找最优参数内部只根据进修器的特灯揭捉?找起码量的参数设置,如不雅须要自定义参数范围可应用如下所示:
- param_grid = {'max_features': ['sqrt', 'log2'
推荐阅读
瞬息万变的经济情况、难以捉摸的零售业发卖情况、日益冷僻典大年夜型卖场–这一切都给本土零售业带来了重重艰苦。然则,我们也在黑阴郁看到了一线曙光。进入数字时代,技巧和数据的有>>>详细阅读
本文标题:关于机器学习与比特币的示例
地址:http://www.17bianji.com/lsqh/37053.html
1/2 1