blog details
author


blog detail

测定可能受到一个变量的一种变体或多个变量的一种变体的影响。机器根据数学做出决策。因此,在本文中,我将介绍如何在股票代码和纳斯达克价格相关性之间生成价格预测分数。我将展示使用 Python 和 Scikit 线性回归模型的方法。

目录:使用 Python 和 Scikit 线性回归模型预测股票价格与纳斯达克价格之间的相关性

导入所需的数据集和库

为了计算价格预测分数,以下是我们在项目开始之前需要导入的 Python 库。

 import numpy as np
 import pandas as pd
 import matplotlib.pyplot as plt
 from sklearn.model_selection import train_test_split
 from sklearn.linear_model import LinearRegression

然后,我以过去7年的苹果股价和纳斯达克作为数据集样本

为了创建 cbar 可视化目的,我创建了 Apple 股票价格和纳斯达克价格之间的价格比,即 Apple 价格历史每日价格除以纳斯达克历史每日价格。

数据预处理

除了常见的机器学习过程之外,数据预处理也至关重要,因为它确保数据类型和数据大小一致。

在这个项目中,我们有 3 个数据集,分别是 Apple 股票代码、Nasdaq 及其比率。由于原始数据集在每个数据集中共享相同的日期范围,因此我们只需重塑并确保每个数据集具有相同的数据维度。

 apple_price = dataSet [ 'AAPL' ]
 appl_price = np.array ( apple_price ) .reshape ( -1 , 1 )
 indexQ_price = dataSet [ 'NASDAQ' ]
 index_price = np.array ( indexQ_price ) .reshape ( -1 , 1 )
 price1_ratio = dataSet [ 'Ratio' ]

对于比率,从我个人的喜好来看,我了解到,如果不进行重塑,则在绘图可视化中会显示出更多的对比度。据说你也可以重塑它。但在本文中,我将使用原始形状,因为它用于显示颜色图。

线性回归模型数据训练与测试

为了测试评分结果是否会受到数据样本大小的影响,我们需要先利用 S. cikit Learn 来分割数据集。这是该项目的代码示例,其中包含三个数据集

apple_train , apple_test , nasdaq_train , nasdaq_test , priceRatio_train , priceRatio_test = train_test_split (
 appl_price , index_price , price1_ratio , test_size= 0.5 )

test_size可以打开和关闭调整,以检查哪个分数结果彼此接近或对比度更大。在实际应用中,适当的分数很大程度上取决于项目目标。有时,较低的分数可能是自动化的良好信号。

Model.fit() 并生成分数

现在已准备好添加线性回归模型。我建议您在云编码平台(例如 Google Collab)上运行本部分。因为它通常需要更高的硬件规格要求。有时,如果您的数据集太大,您的笔记本电脑可能会崩溃。

然后,随着test_size的调整,分数结果可能会有所不同。这里显示了我生成的一个结果。我尝试了几个部分的测试,结果彼此非常接近。

 model = LinearRegression ()
 model.fit ( apple_train , nasdaq_train )
 print ( model.score ( apple_test , nasdaq_test ))

散点图可视化和 10 组相关性供您测试

我不会深入阐述如何使用 Matplotlib 在散点图中可视化数据集。如果您对详细信息感兴趣,请按照下一部分进行操作并订阅以获取完整脚本。

相反,我想与您分享您可能从事的三个专业领域的 10 组相关性。它们是股票投资、电子商务销售和 Google 搜索广告。您可以收集自己拥有的数据集或去Kaggle相应查找来测试预测分数。

股票投资

  1. 股价与交易量的相关性
  2. 股票价格与市场指数(例如S&P 500)之间的相关性
  3. 股价与利率的相关性
  4. 股价与每股收益 (EPS) 之间的相关性
  5. 股价与股息率的相关性
  6. 股价与市盈率 (P/E) 之间的相关性
  7. 股价与市值的相关性
  8. 股票价格与特定行业指数(例如科技行业指数)之间的相关性
  9. 股票价格与分析师建议(例如买入、卖出、持有)之间的相关性
  10. 股票价格与经济指标(例如GDP增长、通货膨胀率)之间的相关性

电商销售

  1. 产品价格与销量的相关性
  2. 产品评分与销量之间的相关性
  3. 产品评论数与销量之间的相关性
  4. 产品折扣与销量之间的相关性
  5. 产品促销时长与销量的相关性
  6. 产品可用性与销量之间的相关性
  7. 产品运输时间与销量之间的相关性
  8. 产品描述长度与销量的相关性
  9. 产品形象质量与销量的相关性
  10. 产品类别与销量的相关性

谷歌搜索广告

  1. 广告排名与点击率 (CTR) 之间的相关性
  2. 广告文案长度与点击率之间的相关性
  3. 广告标题关键词与点击率的相关性
  4. 广告描述关键字与点击率之间的相关性
  5. 广告显示 URL 与点击率之间的相关性
  6. 广告相关性与点击率之间的相关性
  7. 广告着陆页质量与转化率之间的相关性
  8. 广告出价策略与每次点击费用 (CPC) 之间的相关性
  9. 广告定位设置(位置、人口统计数据)与转化率之间的相关性
  10. 广告投放时间与转化率之间的相关性

特征重要性生成器的完整 Python 脚本

如果您对使用 Python 和 Scikit 线性回归模型进行股票价格与纳斯达克价格预测之间的相关性感兴趣,请添加消息“散点图+价格预测”来订阅我们的新闻通讯。我们会立即将脚本发送到您的邮箱。

我希望您喜欢阅读使用 Python 和 Scikit 线性回归模型预测股票价格和纳斯达克价格之间的相关性。如果您这样做了,请通过执行下列操作之一来支持我们,因为这总是对我们的频道有所帮助。

数据科学与机器学习 Coursera 课程推荐


分享文章

目前没有留言...

shape shape

免费订阅最新内容更新

获取独家自动样式内容更新和优惠