目的

プロジェクトS という題目で、ラズパイにインストールしたPythonで株価を予想してみようと思います。

今回は前回とは別のサイトを参照に、Python技術や株価予想の知見を取得していこうと思います。
前回はコチラ

前回の手法は使えないと考えたので、別の方法を検索してみました。


参照サイト

参照するサイトは以下にしました。
ストックドッグ Pythonで機械学習を使った株価予測のコードを書こう
2年前の記事となり、古いのでデータ収集の部分でできない箇所があります。
ただ、プログラムの解説の掲載していただいてくださっていて、初心者の自分としてはかなり魅力的なサイトです。


 

データを収集する

株式投資メモ
コチラよりデータを集めます。
参考サイトと同じく4307 (株)野村総合研究所のデータと指標用のETFデータを取得します。
上記サイトから取得できたETFは以下となりました。

1309 (NEXT FUNDS)ChinaAMC・中国株式・上証50
1313 サムスンKODEX200上場指数投資信託
1322 上場インデックス中国A株 E FUND CSI300
1326 SPDRゴールド・シェア
1343 (NEXT FUNDS)東証REIT指数連動型上場投信
1543 純パラジウム上場信託(現物国内保管型)
1551 JASDAQ-TOP20上場投信
1633 (NEXT FUNDS)不動産上場投信
1678 (NEXT FUNDS)インド株式指数上場投信
1681 上場インデックスファンド海外新興国株式
1682 (NEXT FUNDS)日経・東商取白金指数上場投信
1698 上場インデックスファンド日本高配当



記載されているプログラムについて

ある程度解説されているので、ここで詳細は書きませんが、
locilocについてと
RandomForestClassifierについては解説されていないですが、重要だと思うので書きます。

locilocについては以下。
[その他]pythonのlocとilocのちょい攻略

RandomForestClassifierについて。
ネットをあさって、自分なりに考えたことを記載します。記載が異なっていたらスミマセン。
かつ、なんでこの手法が株価の判定に使えるかは今でも不明。

・RandomForestClassifierはランダムフォレストという機械学習手法
・ランダムフォレストは複数の決定木を作って、決定木の結果から平均や多数決で答えを出す。
・決定木とは、質問にYES・NOで答えていき結果を導き出すもの
・YES・NOがツリー構造のようなので木と言われるよう
・ということで、ランダムフォレストはこの木の集まり
・決定木については同じようなものだとあまりいい結果にならない
・いろんな質問の決定木を集めたほうが良い結果になる
・この記事についてはETFのデータが決定木になる
・質問については、今回は前日より高いかのYES・NOで結果を導きだいている
・多数決か平均かは不明だが、ETFデータの結果より、対象の株価の予想をしている
・ということは、どの株価を選んでも同じような結果となると思うけど、そこはちゃんと計算してる!?



実行後の所感

一応、プログラム自体は動くようにして、結果を得ることができましたが、
本当にうまく動いているかは不明・不安です。

そしてここからどうするかも決めかねてます。