検証システム 第9回 株価指数データのダウンロードとデータベースへの格納

イメージ 1

イメージ 2

イメージ 3

イメージ 4

イメージ 5

イメージ 6

今回は、景気循環と株価の関係を分析する準備として、株価指数データをダウンロードして、データベースに格納します。


ダウンロードするデータは、米国の代表的な株価指数であるS&P500指数です。

図1 ダウンロード先サイト

EconStatsというサイトを開きます。

図2 CSVデータに変換後(Excel形式)

まず、上記のサイトの左の上側にある『Day』をクリックして、日次のデータを表示します。
次に、その『Day』の右側にある『X』マーク(Excelマーク)をクリックして、データをCSVに変換します。
さらに、そのデータをブラウザのファイルメニューを使って、一旦、自分のPCにダウンロードしてください。

図3 不要部分削除後のCSVデータ

ダウンロードしたデータをExcelなどを開いて、以下のように編集します。
1.左側から1列目の日付と6列目のClose for Day(終値)の列のデータのみが必要なので、それ以外の列のデータを削除します。
2.上側から1行目から17行目のコメント行は不要なので削除します。
3.CSVデータを更新します。

図4 Accessテーブル定義

S&P500データを格納する先のAccessテーブルを新規に作成します。
名称は『S&P500』として以下の2項目を定義します。
1.取引日・・・日付/時刻型
2.指数・・・数値型。フィールドサイズは単精度浮動小数点型。

図5 不要データ削除クエリ

上記で作成した『S&P500テーブル』にCSVデータをインポートします。
その時に、指数に数値以外のデータが入っているレコードがあるので、エラーでも強制的にインポートを続けてください。
インポート後、削除クエリを作成・実行して、指数がNullとなっている不要データを削除します。

図6 S&P500テーブルの中身

最終的に、S&P500テーブルには、1950年1月5日から現在までの、毎日の終値での指数が格納されます。
データ件数は、約1万5千件あります。

次回は、このデータを使って、景気循環と株価の関係を調べます。