価格予測: Python を使用したティッカーとナスダックの価格相関
決定は、1 つの変数に対する 1 つのバリアント、または複数の変数に対する 1 つのバリアントによって影響を受ける可能性があります。機械は数学に基づいて決定を下します。そこでこの記事では、株式ティッカーとナスダック価格の相関関係の間の価格予測スコアを生成する方法について説明します。 Python と Scikit 線形回帰モデルを使用した方法を示します。
決定は、1 つの変数に対する 1 つのバリアント、または複数の変数に対する 1 つのバリアントによって影響を受ける可能性があります。機械は数学に基づいて決定を下します。そこでこの記事では、株式ティッカーとナスダック価格の相関関係の間の価格予測スコアを生成する方法について説明します。 Python と Scikit の線形回帰モデルを使用した方法を示します。
目次: Python と Scikit 線形回帰モデルを使用した株価と NASDAQ 価格の予測の相関関係
- 必要なライブラリとデータセットをインポートする
- データの前処理
- 線形回帰モデルのデータのトレーニングとテスト
- Model.fit() を実行してスコアを生成する
- 散布図の視覚化とテスト用の 10 セットの相関関係
- 株価ティッカーとナスダック価格予測スコアの相関関係の完全な Python スクリプト
- データ サイエンスと機械学習 Couresa コースの推奨事項
- よくある質問
必要なデータセットとライブラリをインポートする
価格予測スコアをカウントするために、プロジェクトを開始する前にインポートする必要がある Python ライブラリを次に示します。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
次に、過去 7 年間の Apple 株価と Nasdaq をデータセット サンプルとして取り上げます。
cbar 視覚化を作成する目的で、Apple 株価と Nasdaq 価格の間の価格比率を作成します。これは、Apple 価格の過去の日次価格を Nasdaq の過去の日次価格で割ったものです。
データの前処理
一般的な機械学習プロセスと同様に、データの前処理は、データ型とデータ サイズの一貫性を確保するために重要です。
このプロジェクトには、Apple ティッカー、Nasdaq、およびそれらの比率の 3 つのデータセットがあります。生のデータセットは各データセット間で同じ日付範囲を共有しているため、再形成して各データセットのデータ ディメンションが同じであることを確認するだけで済みます。
apple_price = dataSet [ 'AAPL' ]
appl_price = np.array ( apple_price ) .reshape ( -1 , 1 )
indexQ_price = dataSet [ 'NASDAQ' ]
index_price = np.array ( indexQ_price ) .reshape ( -1 , 1 )
price1_ratio = dataSet [ 'Ratio' ]
比率については、私の個人的な好みから、形状を変更しない方がプロットの視覚化でより多くのコントラストが表示されることがわかりました。形を変えることもできると言われています。ただし、この記事では、カラー マップを表示するためなので、元の形状を使用します。
線形回帰モデルのデータのトレーニングとテスト
スコア結果がデータ サンプルのサイズに影響を受けるかどうかをテストするには、まず Scikit Learn を利用してデータセットを分割する必要があります。これは 3 つのデータセットを持つこのプロジェクトのコード サンプルです。
apple_train , apple_test , nasdaq_train , nasdaq_test , priceRatio_train , priceRatio_test = train_test_split (
appl_price , index_price , price1_ratio , test_size= 0.5 )
Test_size のオン/オフを調整して、どちらのスコア結果が互いに近いか、コントラストが大きいかを確認できます。実際のアプリケーションでは、適切なスコアはプロジェクトの目標に大きく依存します。場合によっては、スコアが低いことが自動化の良いシグナルとなることがあります。
Model.fit() を実行してスコアを生成する
これで、線形回帰モデルを追加する準備が整いました。このセクションは、Google Collab などのクラウド コーディング プラットフォームで実行することをお勧めします。通常、より高いハードウェア仕様要件が必要になるためです。データセットが大きすぎると、場合によってはラップトップがクラッシュする可能性があります。
その後、 test_size
を調整すると、スコア結果が異なる場合があります。ここに私が生成した 1 つの結果を示します。テストのいくつかの部分を試してみましたが、結果は互いに非常に近いものでした。
model = LinearRegression ()
model.fit ( apple_train , nasdaq_train )
print ( model.score ( apple_test , nasdaq_test ))
散布図の視覚化とテスト用の 10 セットの相関関係
Matplotlib を使用してデータセットを散布図で視覚化する方法について詳しく説明するつもりはありません。詳細に興味がある場合は、次のセクションに従って、完全なスクリプトを入手するために購読してください。
逆に、あなたが取り組んでいるであろう 3 つの専門分野における 10 組の相関関係を共有したいと思います。それらは、株式投資、電子商取引販売、Google 検索広告です。所有するデータセットを収集するか、Kaggle にアクセスしてデータセットを検索し、予測スコアをテストすることができます。
株式投資
- 株価と出来高の相関関係
- 株価と市場指数(例:S&P 500)の相関関係
- 株価と金利の相関関係
- 株価と一株当たり利益(EPS)の相関関係
- 株価と配当利回りの相関関係
- 株価と株価収益率(PER)の相関関係
- 株価と時価総額の相関関係
- 株価とセクター別指数(例:テクノロジーセクター指数)との相関関係
- 株価とアナリストの推奨事項(買い、売り、ホールドなど)との相関関係
- 株価と経済指標(GDP成長率、インフレ率など)の相関関係
eコマース販売
- 製品価格と販売数量の相関関係
- 製品の評価と販売量の相関関係
- 商品レビュー数と販売量の相関関係
- 商品の割引率と販売量の相関関係
- 商品のプロモーション期間と販売量の相関関係
- 製品の入手可能性と販売量の相関関係
- 商品の出荷時期と販売量の相関関係
- 商品説明の長さと販売量の相関関係
- 商品の画質と販売数量の相関関係
- 商品カテゴリーと販売数量の相関関係
Google検索広告
- 広告の掲載順位とクリック率 (CTR) の相関関係
- 広告コピーの長さと CTR の相関関係
- 広告見出しキーワードと CTR の相関関係
- 広告説明キーワードと CTR の相関関係
- 広告表示URLとCTRの相関関係
- 広告の関連性とCTRの相関関係
- 広告ランディング ページの品質とコンバージョン率の相関関係
- 広告入札戦略とクリック単価 (CPC) の相関関係
- 広告ターゲティング設定(場所、人口統計)とコンバージョン率の相関関係
- 広告のスケジュールとコンバージョン率の相関関係
機能重要度ジェネレーターの完全な Python スクリプト
Python と Scikit 線形回帰モデルを使用したティッカー価格とナスダック価格予測の相関関係に興味がある場合は、 「散布図 + 価格予測」というメッセージを追加してニュースレターを購読してください。 。スクリプトはすぐにあなたのメールボックスに送信されます。
「Python と Scikit 線形回帰モデルを使用したティッカー価格と NASDAQ 価格予測の相関関係」を楽しんで読んでいただければ幸いです。もしそうなら、以下にリストされているいずれかの方法で私たちをサポートしてください。それは常に私たちのチャンネルに役立ちます。
- PayPal ( paypal.me/Easy2digital ) を通じて私たちのチャンネルをサポートし、寄付してください。
- 私のチャンネルを購読し、 Easy2Digital Youtube チャンネルの通知ベルをオンにしてください。
- Easy2Digital Facebook ページをフォローして「いいね!」してください
- ハッシュタグ #easy2digital を付けて記事をソーシャル ネットワークで共有してください
- Easy2Digital の最新記事、ビデオ、割引コードを受け取るには、毎週のニュースレターに登録してください。
- Patreon を通じて月額メンバーシップに登録すると、限定特典をお楽しみいただけます ( www.patreon.com/louisludigital )
データ サイエンスと機械学習 Couresa コースの推奨事項
よくある質問:
Q1: Pythonとは何ですか?
A: Pythonはプログラミング言語の一種であり、シンプルで読みやすい文法が特徴です。
Q2: Pythonを学ぶにはどうすればいいですか?
A: Pythonを学ぶにはオンラインのチュートリアルや書籍を利用することがおすすめです。
Q3: Pythonの主な用途は何ですか?
A: Pythonはウェブ開発、データ分析、人工知能など多岐にわたる用途に使われています。
Q4: Pythonの最新バージョンは何ですか?
A: 現在の最新バージョンはPython 3です。
Q5: Pythonでのデータの取り扱い方法はありますか?
A: PythonではNumPyやPandasなどのライブラリを使用してデータを効率的に取り扱うことができます。
Q6: Pythonのインストール方法は何ですか?
A: Pythonの公式ウェブサイトからインストーラーをダウンロードし、指示に従ってインストールしてください。
Q7: Pythonの開発環境はどうすれば構築できますか?
A: Pythonの開発環境を構築するには、IDE(統合開発環境)やテキストエディタを使用することが一般的です。代表的なIDEとしてはPyCharmやVisual Studio Codeがあります。
Q8: Pythonでのエラーメッセージの解決方法はありますか?
A: エラーメッセージを理解し、問題の原因を特定することが重要です。Pythonのコミュニティやオンラインのフォーラムで質問することも有効です。
Q9: Pythonでの関数の作成方法はありますか?
A: Pythonではdefキーワードを使用して関数を作成します。関数名、引数、処理内容を定義することで、独自の関数を作成することができます。
Q10: Pythonのライブラリとは何ですか?
A: ライブラリは再利用可能なコードの集合であり、Pythonの機能拡張やタスクの効率化に役立ちます。代表的なライブラリにはNumPy、Pandas、Matplotlibなどがあります。