Python数据可视化 箱线图

作者&投稿:盈陈 (若有异议请与网页底部的电邮联系)
~ Python数据可视化:箱线图
一、箱线图概念
箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。
计算过程:

(1)计算上四分位数(Q3),中位数,下四分位数(Q1)
(2)计算上四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range)Q3-Q1
(3)绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数。在箱子内部中位数的位置绘制横线。
(4)大于上四分位数1.5倍四分位数差的值,或者小于下四分位数1.5倍四分位数差的值,划为异常值(outliers)。
(5)异常值之外,最靠近上边缘和下边缘的两个值处,画横线,作为箱线图的触须。
(6)极端异常值,即超出四分位数差3倍距离的异常值,用实心点表示;较为温和的异常值,即处于1.5倍-3倍四分位数差之间的异常值,用空心点表示。
(7)为箱线图添加名称,数轴等

二、四分位数的计算

分位数根据其将数列等分的形式不同可以分为中位数,四分位数,十分位数、百分位数等等。四分位数作为分位数的一种形式,在统计中有着十分重要的意义和作用,而大多数的统计学原理教材只介绍其基本含义,对其具体计算,尤其是由组距数列计算都不作介绍,成为统计学原理教材中的空白。那么,如何根据数列计算四分位数呢?一般来讲,视资料是否分组而定。

1、根据未分组的资料计算四分位数

第一步:确定四分位数的位置

四分位数是将数列等分成四个部分的数,一个数列有三个四分位数,设下分位数、中分位数和上分位式中n表示资料的项数

第二步:根据第一步所确定的四分位数的位置,确定其相应的四分位数。
例1:某车间某月份的工人生产某产品的数量分别为13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4、15.7公斤,则三个四分位数的位置分别为:

即变量数列中的第三个、第六个、第九个工人的某种产品产量分别为下四分位数、中位 数和上四分位数。即:
Q1 =13.8公斤、Q2=14.6公斤、Q3=15.2公斤
上例中(n+1)恰好为4的倍数,所以确定四分数较简单,如果(n+1)不为4的整数倍数,按上述分式计算出来的四分位数位置就带有小数,这时,有关的四分位数就应该是与该小数相邻的两个整数位置上的标志值的平均数,权数的大小取决于两个整数位置距离的远近,距离越近,权数越大,距离越远,权数越小,权数之和等于1。
例2:某车间某月份的工人生产某产品的数量分别为13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4公斤,则三个四分位数的位置分别为:

即变量数列中的第2.75项、第5.5项、第8.25项工人的某种产品产量分别为下四分位 数、中位数和上四分位数。即:

在实际资料中,由于标志值序列中的相邻标志值往往是相同的,因而不一定要通过计算才能得到有关的四分位数。

2、由组距式数列确定四分位数

第一步,向上或向下累计次数.
第二步,根据累计次数确定四分位数的位置.
(1)、当采用向上累计次数的资料确定四分位数时,四分位数位置的公式是:

(2)、当采用向下累计次数的资料确定四分位数时,四分位数位置的公式是:

第三步,根据四分位数的位置算出各四分位数.
(1)、当累计次数是向上累计时,按下限公式计算各四分位数.

(2)、当累计次数是向下累计时,按上限公式计算各四分位数.

例3:某企业职工按月工资的分组资料如下:

根据上述资料确定某企业职工的月工资的三个四分位数如下:
(1)、采用向上累计职工人数的资料得月工资四分位数的位置为:
(2)、采用向下累计职工人数的资料得月工资四分位数的位置为:

3、异常值

异常值:限制线以外的数据全部为异常值
三、画图

# Python
import plotly.plotly
import plotly.graph_objs as go

data = [
go.Box(
y=[0, 1, 1, 2, 3, 5, 8, 13, 21] # 9个数据
)
]
plotly.offline.plot(data) # 离线绘图


【python】matplotlib数据可视化(7)——图中图
方法一:灵活调整figure与axes首先,我们从基础开始。创建一个figure对象,然后使用fig.add_axes方法添加小图。在下面的代码中,我们创建了一个大图(big axes):import numpy as npimport matplotlib.pyplot as pltfig = plt.figure()x = [1, 2, 3, 4, 5, 6, 7]y = [1, 3, 4, 2, 9...

数据可视化分析工具有哪些
2. **Tableau**:Tableau是一款流行的数据可视化工具,它具有快速、易用、灵活等特点。Tableau可以轻松创建各种图表类型,支持多维度数据分析和数据挖掘。它还提供了丰富的交互功能,如数据筛选、筛选提示、切片等。3.**Python的Matplotlib库**:Python是一种高级编程语言,Matplotlib是Python中最常用的数据...

数据可视化可以使用的工具有哪些
3. **Power BI**:Power BI 是一款商业智能工具,它可以将数据转化为丰富、动态且交互式的数据可视化报告。Power BI 提供了一系列预制的模板和可视化元素,可以轻松创建各种报告和演示文稿。4. **Python 的数据可视化库**:Python 的数据可视化库如 Matplotlib、Seaborn 和 Plotly 非常受欢迎。这些库...

怎样用python进行数据可视化
用python进行数据可视化的方法:可以利用可视化的专属库matplotlib和seaborn来实现。基于python的绘图库为matplotlib提供了完整的2D和有限3D图形支持。我们只需借助可视化的两个专属库(libraries),俗称matplotlib和seaborn即可。(推荐教程:Python入门教程)下面我们来详细介绍下:Matplotlib:基于Python的绘图库为m...

为什么选择python做数据分析
许多数据科学会议和培训也使用Python作为主要的教学语言,这进一步证明了Python在数据分析中的地位和影响力。总的来说,Python的易学易用、生态系统、广泛的库支持、强大的数据处理能力、广泛的数据可视化能力、兼容性和开源性都是选择Python进行数据分析的重要原因。这些因素使得Python成为数据分析的理想选择。

python中有哪些好的数据分析可视化包
Pvthon。bpython- 界面丰富的 Python 解析器。ptpython-高级交互式Python解析器,构建于python-prompt-toolkit 上.Dash 比较新的软件包,它是用纯Pvthon构建数据可视 化app的理想选择,因此特别适合处理数据的 任何人。Dash 是 Flask , Plotly.js 和React.is的混合体 opencv opencv 是一个跨平台计算机...

python数据分析要学哪些东西
2.数据处理与清洗:数据分析的第一步是数据处理与清洗,因此需要学习如何使用Python中的相关库(如Pandas)对数据进行加载、处理和清洗。你需要学会读取不同格式的数据文件、处理缺失值和异常值,并进行数据转换和合并等操作。3.数据可视化:数据可视化是数据分析中重要的环节,帮助我们更好地理解和展示数据。

如何让python可视化
在 Python 中,将数据可视化有多种选择,正是因为这种多样性,何时选用何种方案才变得极具挑战性。本文包含了一些较为流行的工具以及如何使用它们来创建简单的条形图,我将使用下面几种工具来完成绘图示例:Pandas Seaborn ggplot Bokeh pygal Plotly 在示例中,我将使用 pandas 处理数据并将数据可视化。大...

Python中数据可视化的两个库!
1. Matplotlib:是Python中众多数据可视化库的鼻祖,其设计风格与20世纪80年代的商业化程序语言MATLAB十分相似,具有很多强大且复杂的可视化功能;还包含了多种类型的API,可以采用多种方式绘制图标并对图标进行定制。2. Seaborn:是基于Matplotlib进行高级封装的可视化库,支持交互式界面,使绘制图表功能变得简单...

Python 数据可视化:Altair 使用全解析
https:\/\/github.com\/altair-viz\/altair 什么是图形语法呢? 图形语法听起来有点像一个抽象的功能,值得注意的是,它是 Altair 和其他 Python 可视化库之间最主要的区别。Altair 符合我们人类可视化数据的方式和习惯,Altair 只需要三个主要的参数:基于以上三个参数,Altair 将会选择合理的默认值来显示...

庆元县13245265585: 如何在python中根据数据库中数据画出可视化统计图 -
赞婉再克: 如何在python中根据数据库中数据画出可视化统计图 一:数据格式: 2015-04-02 DXX006 Type1 1 2015-04-02 DXXB11 Type2 1 2010-10-12 DXX001 Other 1

庆元县13245265585: 如何评价利用python制作数据采集,计算,可视化界面 -
赞婉再克: 如何评价利用2113python制作数据采集,计算,可视化界面1、为什么用Python做数据分析 首先因为Python可以轻松地集成C、C++、Fortran代码,一些底层用C写的算法封装在python包里后性能非常高效.并且Python与Ruby都有大量的Web框...

庆元县13245265585: 如何让python可视化 -
赞婉再克: 简介 在 Python 中,将数据可视化有多种选择,正是因为这种多样性,何时选用何种方案才变得极具挑战性.本文包含了一些较为流行的工具以及如何使用它们来创建简单的条形图,我将使用下面几种工具来完成绘图示例:...

庆元县13245265585: 一般Python都用什么可视化开发工具平台 -
赞婉再克: 常见的Python可视化库有哪些? Matplotlib Matplotlib是一个Python 2维绘图库,已经成为Python中公认的数据可视化工具,通过Matplotlib你可以很轻松地画一些或简单或复杂地图形,几行代码即可生成线图、直方图、功率谱、条形图、错误图、...

庆元县13245265585: python 怎样数据可视化 3d -
赞婉再克: 准备工作基本来讲,我们仍然需要创建一个图表并把想要的坐标轴添加到上面.但不同的是我们为图表指定的是3D视图,并且添加的坐标轴是Axes3D.现在,我们可以使用几乎相同的函数来绘图了.当然,函数的参数是不同的,需要为3个...

庆元县13245265585: python箱线图为什么没有了 -
赞婉再克: 要用到matplotlib:from matplotlib import pyplot as plta=range(1,10) plt.boxplot((a,a),labels=('Mon','Tue')) plt.show()1234

庆元县13245265585: python数据分析有什么用? -
赞婉再克: 原发布者:最佳男主角之星数据分析有什么作用?很多人会问数据分析是干什么?有什么作用呢?下面就来看看西线学院是怎么看待数据分析的作用.数据分析的作用单纯的谈数据分析的作用其实意义并不大,所以在谈论作用之前我们首先的...

庆元县13245265585: 如何用Python制作优美且功能强大的数据可视 -
赞婉再克: 1 2 3 4 5 6 7 8 9 10 11 12 13 14主要方法,用于添加图表的数据和设置各种配置项 print_echarts_options() 打印输出图表的所有配置项 render() 默认将会在根目录下生成一个 render.html 的文件,支持 path 参数,设置文件保存位置,如 ...

庆元县13245265585: python爬出来的数据怎么进行可视化 -
赞婉再克: 准确的来说是做统计数据的可视化,一般的数据可视化都是js生成的,这点跟后端语言没啥关系.R的最大优点就是有一些优秀的可视化包,比如ggplot2

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网