type
status
slug
summary
date
tags
category
password
Multi-select
Status
URL
勘误
标签
类型
icon
Publishe Date
贴文
🪄
这篇学习日记介绍了 Python 中机器学习的编程过程,并针对数据可视化和图表类型进行了详细解释。通过使用 Matplotlib 和 Seaborn 这两个可视化工具,本文逐一介绍了线图、直方图、散点图以及小提琴图等常见图表的绘制方法和应用场景。数据可视化是机器学习中 ETL 过程的重要步骤,它可以帮助您查看数据的分布和异常值,并为您提供数据的洞察力。如果您正在学习 Python 机器学习,本文可以帮助您更好地了解数据可视化的重要性以及如何使用 Matplotlib 和 Seaborn 这两个常见工具进行数据可视化。
Matplotlib和Seaborn简要解释和比较
介绍
机器学习是不同文化的结合。主要包括:
统计学
编程
微积分
现在,在那个简短的课程中,我试图向你们解释Python中机器学习的编码过程。
在Python中,我将该过程分为四个部分。
数据可视化-Matplotlib & Seaborn
数据分析-Pandas
熟悉数据类型-Numpy
构建模型- Scikit-learn
此外,我将模型类型分为三种,分别为:
回归
分类
聚类
聚类文章即将到来*
现在,数据可视化和图表类型确实有很大的变化,但我决定向您解释最常见的那些,因为这是一篇简要说明文章。
而且我将在Matplotlib和Seaborn中编写此图表,它们是Python中最常见的可视化工具。
线图
线图用于观察时间中的变化情况。
Matplotlib
首先,通过加载和seaborn并使用load_dataset方法下载数据。
然后删除分类列并相应地绘制图形。
Seaborn
就像在后面的代码中,
- 通过加载和seaborn下载数据
- 使用load_dataset方法,删除分类列并
- 通过选择x和y绘制折线图。
动态线图
如果您想查看动画图表;
- 加载库
- 对值进行排序
- 设置png数量的大小,将创建您的动态线图的gif。
- 写一个循环。
- 保存您的gif。
直方图
查看数据的密度和分布的重要图表。
Matplotlib
现在让我们逐步解释
- 下载和加载数据
- 定义fig和ax。
- 定义直方图和列。
- 设置标题,x和y标签
- 定义阈值,并相应地绘制线条。
- 有关更多参数,请参见此处。
Seaborn
这是*distplot的源*。
- 导入库。
- 加载数据集
- 定义列名
- kde- 绘制高斯核密度或否。
- bins- 直方图宽度
散点图
将数据点视为文字点,散点图是一种有用的图表类型。
Matplotlib
- 下载必要的库和数据集。
- 设置标题和网格选项
- 有关matplotlib中散点图的更多信息,请参见此处。
Seaborn
- 下载必要的库和数据集。
- 设置背景style。
- 设置图例等,更多内容请参见此处
小提琴图
这是关于小提琴图的快速总结。
Matplotlib
- 加载库和下载数据
- 选择鸢尾花萼长度列并观察。
- 有关更多信息,请参见此处。
Seaborn
- 导入Seaborn和数据集。
- 选择前100列以比较setosa和versicolor。
- 选择萼片和花瓣长度。
结论
现在,您可以看到有很多不同的方法来可视化您的数据。
数据可视化是机器学习中ETL过程的重要步骤。
它可以帮助您查看数据的分布和异常值,并为您提供数据的洞察力。
实际上,它用不同的语言与您交流,更好地了解这种语言可以帮助您成为机器学习中的真正机器。
作者:Gencay I
- 作者:Inevitable AI
- 链接:https://www.Inevitableai.ltd/article/day18
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。