Python学习数据分析画图
?网格格子,图中虚线,True表示网格
?点Markers:代表点的形状。
有三种基本的视觉元素:点、线和柱。分析一下下面必须画哪个图?
学生花在特定课程上的时间与考试成绩之间的关系,并查看两者之间的相关性。 ? ?某个区域的振动怎么样?添加随机数 y
散点图绘图
.
子图 2.
情况 2:条形图
条形图,也称为条形图,是以矩形的长度为变量的统计图。矩形的长度与其对应的变量值成正比。一份。假设男性和女性购买饮用水偏好的调查结果如下
表:
竖条图
import matplotlib.pyplot as plt
# 1. 创建figure
fig = ()
# 2. 创建子图(1行2列)
ax1 = (1, 2, 1)
(‘男生购买饮用水情况的调查结果‘)
ax2 = (1, 2, 2)
(‘女生购买饮用水情况的调查结果‘)
# ***********中文乱码如何解决
[‘‘] = [‘SimHei‘]
# 3. 加载数据信息
waters = [‘碳酸饮料‘, ‘绿茶‘, ‘矿泉水‘, ‘其它‘, ‘果汁‘]
boy_buy_num = [6, 7, 6, 2, 1]
girl_buy_num = [9, 4, 4, 6, 5]
# 4. 绘制条形图
bar_width = 0.4
ax1.bar(waters, boy_buy_num, bar_width, color=‘orange‘)
(waters, girl_buy_num, bar_width, color=‘g‘)
# 5. 保存图片到本地
# ()
(‘‘)
横条图 2
侧面- by-Side Bar Chart:如果你想画两张条形图来展示男生和特鲁姆普的调查,可以使用两次条形图,
并调整条形图位置坐标和适当的比例允许两组条形图并列
平行条形图绘制
import matplotlib.pyplot as plt
import numpy as np
# ***********中文乱码如何解决
[‘‘] = [‘SimHei‘]
# 加载数据信息
waters = [‘碳酸饮料‘, ‘绿茶‘, ‘矿泉水‘, ‘其它‘, ‘果汁‘]
boy_buy_num = [6, 7, 6, 2, 1]
girl_buy_num = [9, 4, 4, 6, 5]
# 调整条形图的横坐标
bar_width = 0.4
boy_index = np.arange(len(waters)) # [0, 1, 2, 3, 4]
girl_index = boy_index + bar_width # numpy传播机制, [0.4, 1.4, 2.4, 3.4, 4.4]
# 绘制条形图
(boy_index, boy_buy_num, bar_width, color=‘orange‘, label=‘男生‘)
(girl_index, girl_buy_num, bar_width, color=‘g‘, label=‘女生‘)
# 修改无意义的横坐标为有意义的横坐标
(boy_index + bar_width / 2, waters)
("购买量")
("购买饮水情况的调查表")
()
# 保存图片到本地
# ()
(‘‘)
K 最近邻算法分类可视化分析 Neighbor-Gor K 最近邻算法:在朱 靠近墨迹的为红色,而接近墨水的为黑色。谁距离新数据点(一个或多个邻居点)最近,就属于同一类别

K 最近邻算法数据集
Skilit-learn 内置了几个玩具数据集(toy) ,鉴于还有一些API可以自己生成数据集,如下代码所示:

K近邻算法分类
我们生成了一系列数据集作为机器学习训练数据集,接下来就是
基于KNN算法寻找模型,然后根据模型对未知数据进行分类。

K近邻算法回归可视化分析
K近邻算法回归原理
K近邻算法,原理也可以用于回归,是同一个类。当计算每个数据点的预测值时,模型会选择与
数据点最接近的几个点,对它们的y值进行平均,并将其作为新数据点
K 最近的预测值邻居分类算法
from sklearn.datasets import make_blobs
from sklearn.neighbors import KNeighborsClassifier
import matplotlib.pyplot as plt
# 生成数据集, eg: x=(花瓣长度, 花茎的长度), y=(第一种花: 鸢尾花1). 训练集
X, y = make_blobs(n_samples=200, n_features=2, centers=2, random_state=8)
# 如何去寻找一个模型,并最终根据模型预判新的测试数据所属的分类?
# 机器学习: 寻找一个函数/模型的过程. f(x)=‘xxxxxxx‘, f(image)=‘cat‘, f(alpha-go)=5x5, f(‘对话‘)=‘对话’
clf = KNeighborsClassifier()
(X, y) # 拟合(找模型的过程)
test_data = [6, 3] # 测试集: 测试模型好坏/正确率的数据集
class_name = ([test_data])
print("新数据点的分类是: ", class_name)
# # 给定一个新的特征信息, 分析属于哪一类?
# test_data = [6, 3]
#
# # 通过绘制散点图, 清楚的看到分为2类
# (X[:, 0], X[:, 1], edgecolors=‘orange‘, color=‘white‘)
# (test_data[0], test_data[1], marker=‘*‘, color=‘r‘)
# ()
k 最近邻回归算法
import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets import make_regression
from sklearn.neighbors import KNeighborsRegressor
#产生回归的数据集(训练集)
X, y = make_regression(n_samples=100, n_features=1, n_informative=1,
noise=50, random_state=8)
#通过K近邻的回归器, 拟合/寻找模型
reg = KNeighborsRegressor()
(X, y)
#给定一些新的数据(测试集),预测y值
"""
一维数组: [1, 2, 3, 4, 5]
n*1数组: rwshape(-1, 1)
([[1], [2]]) # 预测市需要传递的信息
"""
test_x = (-3, 3, 100).reshape(-1, 1)
test_y = (test_x)
#print("模型的准确度: ", (X, y))
#***********中文乱码如何解决
[‘‘] = [‘SimHei‘]
[‘‘] = False
#绘制图形
(X, y, marker=‘*‘, color=‘orange‘, edgecolors=‘orange‘, label=‘训练集‘)
(test_x, test_y, color=‘black‘, label=‘测试集‘)
(‘KNN Regressor‘)
()
()
Seaborn 库
官网:
https://seaborn.pydata.org/introduction
Seaborn 总共提供 5 种主题风格,即 Darkgrid、Whitegrid 、深色、白色和蜱虫。
使用 set() 和 set_style() 两个函数控制整体风格
设置子图风格
使用不同子图的关键字
Seorn Amhalter style
设置照片中的内容,包括线条颜色、魔鬼和比例等。
版权声明
本文仅代表作者观点,不代表Code前端网立场。
本文系作者Code前端网发表,如需转载,请注明页面地址。
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。