Python 绘图 - Bokeh 堆叠柱状图(stacked bar)

Posted:   March 07, 2020

Edited:   March 07, 2020

Status:   Completed

Tags :   Python

Categories :   Python

Were equations, pictures or diagrams not properly rendered, please refresh the page. If the problem persists, you can contact me.

背景

Bokeh 初探之后,学习使用它来做个图

目标

做一个柱状图,支持多个 y 数据源,即有堆叠效果的柱状图 stacked bar

实现

单数据源 简单的柱状图

参考 Handling Categorical Data — Bokeh 1.4.0 documentation

from bokeh.io import show, output_file
from bokeh.plotting import figure

output_file("bars.html")

fruits = ['Apples', 'Pears', 'Nectarines', 'Plums', 'Grapes', 'Strawberries']
counts = [5, 3, 4, 2, 4, 6]

p = figure(x_range=fruits, plot_height=250, title="Fruit Counts", toolbar_location=None, tools="")

p.vbar(x=fruits, top=counts, width=0.9)

p.xgrid.grid_line_color = None
p.y_range.start = 0

show(p)

效果图见上述参考

增加一个 y 数据源,做堆叠效果

这样的话,需要考虑:

  • 数据源:不能是单一的列表了,得能容纳多组数据。用字典。
fruits = ['Apples', 'Pears', 'Nectarines', 'Plums', 'Grapes', 'Strawberries']
years = ["2015", "2016", "2017"]

data = {'fruits' : fruits,
        '2015'   : [2, 1, 4, 3, 2, 4],
        '2016'   : [5, 3, 4, 2, 4, 6],
        '2017'   : [3, 2, 4, 4, 5, 3]}
  • 颜色:区分不同的数据源

colors = ["green", "#718dbf", "#e84d60","#e84d20","#e84361"]

配色是个问题,一不小心就会很丑,后面会提到用调色板 palette

  • 画图:上面的vbar不支持堆叠
    p.vbar_stack(years, x='fruits', width=0.9, color=colors, source=data,legend_label=years)
    

导出为文件

Exporting Plots — Bokeh 1.4.0 documentation

  • html,这个非常方便

output_file(“file.html”)

  • png,这个需要添加 selenium 等重型依赖,因为它得在 html 基础上用 headless 浏览器解析再内存截屏。。。可以考虑用 svg 替代

  • npm install selenium phantomjs
  • npm install -g phantomjs-prebuilt
  • pip install bokeh

然后 from bokeh.io import export_png

  • svg,
plot.output_backend = "svg"
export_svgs(plot, filename="fi.svg")

数据源: 从 .csv 文件读取数据

我试过两种方式,现在用的是第二种 pandas

  • numpy 的 genfromtxt

但是我遇到很多问题,包括不同的 dtype参数,names参数等,返回不同的数据类型的 array,感觉很不方便(如排序等),所以后来弃用了,当然也是因为我不太熟。

from numpy import genfromtxt
    my_data = genfromtxt("data.csv", delimiter=',', dtype=None, encoding="utf8")
  • pandas

还是这个方便,读取文件 :

df = pd.read_csv("data.csv",header=0)

取前 7 行df = df.head(n=7)

取某一列df['col1']

几列求和df['col1'] + df['col2'] + df['col3']

排序df = df.sort_values(by='col1', ascending=False)

x axis 旋转

Styling Visual Attributes — Bokeh 1.4.0 documentation

比如左斜 旋转 45 度:

    p.xaxis.major_label_orientation = 360-45

调色板

前面我们用 colors = ["green", "#718dbf", "#e84d60","#e84d20","#e84361"] 人工配色,会很丑不专业,bokeh 有自带的调色板,倒是很方便,还好看。

>>> from bokeh.palettes import brewer
>>> colors = brewer["Blues"][6]
>>> colors
['#08519c', '#3182bd', '#6baed6', '#9ecae1', '#c6dbef', '#eff3ff']

具体列表参考:

分类数据处理

如果 x 数据只是数字 如[1,2,3],上面demo 中的 p.figure足以处理

但如果 x 或 y 坐标是一些分类数据如["apple","orange"] ,则需要再添加 x_range,或 y_range

fruits = ['Apples', 'Pears', 'Nectarines', 'Plums', 'Grapes', 'Strawberries']
p = figure(x_range=fruits, ... )
p.vbar(x=x, top=y, legend_label="Temp.", width=0.9)

参考 Handling Categorical Data — Bokeh 1.4.0 documentation

References

ChangeLog

  • 2020-03-29 添加输出到 svg
  • 2020-03-07 init

Comments


Be the first one to comment on this page!
You can use extended GitHub flavored markdown in your comment. Commenting FAQs & Guidelines