Python学习数据分析画图

terry 3年前 (2023-09-25) 阅读数 169 #后端开发

？网格格子，图中虚线，True表示网格
？点Markers：代表点的形状。

有三种基本的视觉元素：点、线和柱。分析一下下面必须画哪个图？
学生花在特定课程上的时间与考试成绩之间的关系，并查看两者之间的相关性。？？某个区域的振动怎么样？添加随机数 y

散点图绘图

.
子图 2.

情况 2：条形图
条形图，也称为条形图，是以矩形的长度为变量的统计图。矩形的长度与其对应的变量值成正比。一份。假设男性和女性购买饮用水偏好的调查结果如下
表：

竖条图

import matplotlib.pyplot as plt
# 1. 创建figure
fig = ()
# 2. 创建子图(1行2列)
ax1 = (1, 2, 1)
(‘男生购买饮用水情况的调查结果‘)
ax2 = (1, 2, 2)
(‘女生购买饮用水情况的调查结果‘)
# ***********中文乱码如何解决
[‘‘] = [‘SimHei‘]
# 3. 加载数据信息
waters = [‘碳酸饮料‘, ‘绿茶‘, ‘矿泉水‘, ‘其它‘, ‘果汁‘]
boy_buy_num = [6, 7, 6, 2, 1]
girl_buy_num = [9, 4, 4, 6, 5]
# 4. 绘制条形图
bar_width = 0.4
ax1.bar(waters, boy_buy_num, bar_width, color=‘orange‘)
(waters, girl_buy_num, bar_width, color=‘g‘)
# 5. 保存图片到本地
# ()
(‘‘)

横条图 2
侧面- by-Side Bar Chart：如果你想画两张条形图来展示男生和特鲁姆普的调查，可以使用两次条形图，
并调整条形图位置坐标和适当的比例允许两组条形图并列

平行条形图绘制

import matplotlib.pyplot as plt
import numpy as np
# ***********中文乱码如何解决
[‘‘] = [‘SimHei‘]
# 加载数据信息
waters = [‘碳酸饮料‘, ‘绿茶‘, ‘矿泉水‘, ‘其它‘, ‘果汁‘]
boy_buy_num = [6, 7, 6, 2, 1]
girl_buy_num = [9, 4, 4, 6, 5]
# 调整条形图的横坐标
bar_width = 0.4
boy_index = np.arange(len(waters))  # [0, 1, 2, 3, 4]
girl_index = boy_index + bar_width  # numpy传播机制， [0.4, 1.4, 2.4, 3.4, 4.4]
# 绘制条形图
(boy_index, boy_buy_num, bar_width, color=‘orange‘, label=‘男生‘)
(girl_index, girl_buy_num, bar_width, color=‘g‘, label=‘女生‘)
# 修改无意义的横坐标为有意义的横坐标
(boy_index + bar_width / 2, waters)
("购买量")
("购买饮水情况的调查表")
()
# 保存图片到本地
# ()
(‘‘)

K 最近邻算法分类可视化分析 Neighbor-Gor K 最近邻算法：在朱靠近墨迹的为红色，而接近墨水的为黑色。谁距离新数据点（一个或多个邻居点）最近，就属于同一类别

K 最近邻算法数据集
Skilit-learn 内置了几个玩具数据集（toy），鉴于还有一些API可以自己生成数据集，如下代码所示：

K近邻算法分类
我们生成了一系列数据集作为机器学习训练数据集，接下来就是
基于KNN算法寻找模型，然后根据模型对未知数据进行分类。

K近邻算法回归可视化分析
K近邻算法回归原理
K近邻算法，原理也可以用于回归，是同一个类。当计算每个数据点的预测值时，模型会选择与
数据点最接近的几个点，对它们的y值进行平均，并将其作为新数据点

K 最近的预测值邻居分类算法

from sklearn.datasets import  make_blobs
from sklearn.neighbors import  KNeighborsClassifier
import  matplotlib.pyplot as plt
# 生成数据集， eg: x=(花瓣长度， 花茎的长度), y=(第一种花: 鸢尾花1). 训练集
X, y = make_blobs(n_samples=200, n_features=2, centers=2, random_state=8)
# 如何去寻找一个模型，并最终根据模型预判新的测试数据所属的分类?
# 机器学习: 寻找一个函数/模型的过程. f(x)=‘xxxxxxx‘, f(image)=‘cat‘, f(alpha-go)=5x5, f(‘对话‘)=‘对话’
clf = KNeighborsClassifier()
(X, y)       # 拟合(找模型的过程)
test_data = [6, 3]  # 测试集： 测试模型好坏/正确率的数据集
class_name = ([test_data])
print("新数据点的分类是: ", class_name)
# # 给定一个新的特征信息， 分析属于哪一类?
# test_data = [6, 3]
#
# # 通过绘制散点图， 清楚的看到分为2类
# (X[:, 0], X[:, 1], edgecolors=‘orange‘, color=‘white‘)
# (test_data[0], test_data[1], marker=‘*‘, color=‘r‘)
# ()

k 最近邻回归算法

import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets import make_regression
from sklearn.neighbors import KNeighborsRegressor
#产生回归的数据集(训练集)
X, y = make_regression(n_samples=100, n_features=1, n_informative=1,
noise=50, random_state=8)
#通过K近邻的回归器， 拟合/寻找模型
reg = KNeighborsRegressor()
(X, y)
#给定一些新的数据(测试集)，预测y值
"""
一维数组:  [1, 2, 3, 4, 5]
n*1数组: rwshape(-1, 1)
([[1], [2]])  # 预测市需要传递的信息
"""
test_x = (-3, 3, 100).reshape(-1, 1)
test_y = (test_x)
#print("模型的准确度: ", (X, y))
#***********中文乱码如何解决
[‘‘] = [‘SimHei‘]
[‘‘] = False
#绘制图形
(X, y, marker=‘*‘, color=‘orange‘, edgecolors=‘orange‘, label=‘训练集‘)
(test_x, test_y, color=‘black‘, label=‘测试集‘)
(‘KNN Regressor‘)
()
()

Seaborn 库

官网：
https://seaborn.pydata.org/introduction
Seaborn 总共提供 5 种主题风格，即 Darkgrid、Whitegrid 、深色、白色和蜱虫。
使用 set() 和 set_style() 两个函数控制整体风格

设置子图风格
使用不同子图的关键字

python学习之数据分析绘图
Seorn Amhalter style
设置照片中的内容，包括线条颜色、魔鬼和比例等。