我在使用plotnine时遇到了麻烦:我无法使用3个类进行图形处理(以颜色分隔)。
将pandas导入为pd导入numpy为np
来自plotnine进口*
path =’/ home / punkproger / workspace / …
抱歉,我无法下载您的数据,但这里是模拟数据的解决方案。
import numpy as np import pandas as pd from plotnine import * np.random.seed(0) df = pd.DataFrame({'x': np.hstack(( np.random.normal(size=1000), np.random.normal(10, 2, size=1000), np.random.normal(-10, 2, size=1000))), 'c': [0]*1000 + [1]*1000 + [2]*1000}) (ggplot(df, aes('x', color='c', fill='c')) + geom_density(alpha=0.7))
收益率:
取前1000行(对应于 c == 0 ):
c == 0
(ggplot(df[:1000], aes('x', color='c', fill='c')) + geom_density(alpha=0.7))
现在创建一个分类变量:
df['cat'] = df['c'].astype('category') (ggplot(df, aes('x', color='cat', fill='cat')) + geom_density(alpha=0.7))