目的

プロジェクトS という題目で、ラズパイにインストールしたPythonで株価を予想してみようと思います。 今回は前回とは別のサイトを参照に、Python技術や株価予想の知見を取得していこうと思います。 前回はコチラ 前回の手法は使えないと考えたので、別の方法を検索してみました。

参照サイト

参照するサイトは以下にしました。 ストックドッグ Pythonで機械学習を使った株価予測のコードを書こう 2年前の記事となり、古いのでデータ収集の部分でできない箇所があります。 ただ、プログラムの解説の掲載していただいてくださっていて、初心者の自分としてはかなり魅力的なサイトです。  

データを収集する

株式投資メモ コチラよりデータを集めます。 参考サイトと同じく4307 (株)野村総合研究所のデータと指標用のETFデータを取得します。 上記サイトから取得できたETFは以下となりました。

1309 (NEXT FUNDS)ChinaAMC・中国株式・上証50
1313 サムスンKODEX200上場指数投資信託
1322 上場インデックス中国A株 E FUND CSI300
1326 SPDRゴールド・シェア
1343 (NEXT FUNDS)東証REIT指数連動型上場投信
1543 純パラジウム上場信託(現物国内保管型)
1551 JASDAQ-TOP20上場投信
1633 (NEXT FUNDS)不動産上場投信
1678 (NEXT FUNDS)インド株式指数上場投信
1681 上場インデックスファンド海外新興国株式
1682 (NEXT FUNDS)日経・東商取白金指数上場投信
1698 上場インデックスファンド日本高配当
  • RandomForestClassifierはランダムフォレストという機械学習手法
  • ランダムフォレストは複数の決定木を作って、決定木の結果から平均や多数決で答えを出す。
  • 決定木とは、質問にYES・NOで答えていき結果を導き出すもの
  • YES・NOがツリー構造のようなので木と言われるよう
  • ランダムフォレストはこの木の集まり
  • 決定木については同じようなものだとあまりいい結果にならない
  • いろんな質問の決定木を集めたほうが良い結果になる
  • この記事についてはETFのデータが決定木になる
  • 質問については、今回は前日より高いかのYES・NOで結果を導きだいている
  • 多数決か平均かは不明だが、ETFデータの結果より、対象の株価の予想をしている

次回

[ラズパイ]プロジェクトS – No.3

世界一やさしい 株の練習帖1年生