💠学习日记|Day18:Python Prior 机器学习和数据可视化
00 分钟
2023-5-9
2023-8-26
type
status
slug
summary
date
tags
category
password
Text
AI summary
AI custom autofill
Multi-select
Status
URL
hashtag
勘误
标签
标题
类型
贴文
🪄
icon
 
这篇学习日记介绍了 Python 中机器学习的编程过程,并针对数据可视化和图表类型进行了详细解释。通过使用 Matplotlib 和 Seaborn 这两个可视化工具,本文逐一介绍了线图、直方图、散点图以及小提琴图等常见图表的绘制方法和应用场景。数据可视化是机器学习中 ETL 过程的重要步骤,它可以帮助您查看数据的分布和异常值,并为您提供数据的洞察力。如果您正在学习 Python 机器学习,本文可以帮助您更好地了解数据可视化的重要性以及如何使用 Matplotlib 和 Seaborn 这两个常见工具进行数据可视化。
 

Matplotlib和Seaborn简要解释和比较

介绍

机器学习是不同文化的结合。主要包括:
统计学
编程
微积分
现在,在那个简短的课程中,我试图向你们解释Python中机器学习的编码过程。
在Python中,我将该过程分为四个部分。
数据可视化-Matplotlib & Seaborn
数据分析-Pandas
熟悉数据类型-Numpy
构建模型- Scikit-learn
此外,我将模型类型分为三种,分别为:
回归
分类
聚类
聚类文章即将到来*
现在,数据可视化和图表类型确实有很大的变化,但我决定向您解释最常见的那些,因为这是一篇简要说明文章。
而且我将在Matplotlib和Seaborn中编写此图表,它们是Python中最常见的可视化工具。

线图

线图用于观察时间中的变化情况。

Matplotlib

首先,通过加载和seaborn并使用load_dataset方法下载数据。
然后删除分类列并相应地绘制图形。
notion image

Seaborn

就像在后面的代码中,
  • 通过加载和seaborn下载数据
  • 使用load_dataset方法,删除分类列并
  • 通过选择x和y绘制折线图。
notion image

动态线图

如果您想查看动画图表;
  • 加载库
  • 对值进行排序
  • 设置png数量的大小,将创建您的动态线图的gif。
  • 写一个循环。
  • 保存您的gif。
notion image

直方图

查看数据的密度和分布的重要图表。

Matplotlib

现在让我们逐步解释
  • 下载和加载数据
  • 定义fig和ax。
  • 定义直方图和列。
  • 设置标题,x和y标签
  • 定义阈值,并相应地绘制线条。
  • 有关更多参数,请参见此处
notion image

Seaborn

这是*distplot的源*。
  • 导入库。
  • 加载数据集
  • 定义列名
  • kde- 绘制高斯核密度或否。
  • bins- 直方图宽度
notion image

散点图

将数据点视为文字点,散点图是一种有用的图表类型。

Matplotlib

  • 下载必要的库和数据集。
  • 设置标题和网格选项
  • 有关matplotlib中散点图的更多信息,请参见此处

Seaborn

  • 下载必要的库和数据集。
  • 设置图例等,更多内容请参见此处
notion image

小提琴图

这是关于小提琴图的快速总结。
notion image

Matplotlib

  • 加载库和下载数据
  • 选择鸢尾花萼长度列并观察。
  • 有关更多信息,请参见此处
notion image

Seaborn

  • 导入Seaborn和数据集。
  • 选择前100列以比较setosa和versicolor。
  • 选择萼片和花瓣长度。
notion image

结论

现在,您可以看到有很多不同的方法来可视化您的数据。
数据可视化是机器学习中ETL过程的重要步骤。
它可以帮助您查看数据的分布和异常值,并为您提供数据的洞察力。
实际上,它用不同的语言与您交流,更好地了解这种语言可以帮助您成为机器学习中的真正机器。
 
 

作者:Gencay I

评论