python - 如何将数据框行分组到 Pandas groupby 中的列表中

我有一个 Pandas 数据框 df 像:

a b
A 1
A 2
B 5
B 5
B 4
C 6

我想按第一列分组并将第二列作为行中的列表:

A [1,2]
B [5,5,4]
C [6]

是否可以使用 pandas groupby 做类似的事情?

最佳答案

您可以使用 groupby 对感兴趣的列进行分组,然后 apply list 到每个组:

In [1]: df = pd.DataFrame( {'a':['A','A','B','B','B','C'], 'b':[1,2,5,5,4,6]})
        df

Out[1]: 
   a  b
0  A  1
1  A  2
2  B  5
3  B  5
4  B  4
5  C  6

In [2]: df.groupby('a')['b'].apply(list)
Out[2]: 
a
A       [1, 2]
B    [5, 5, 4]
C          [6]
Name: b, dtype: object

In [3]: df1 = df.groupby('a')['b'].apply(list).reset_index(name='new')
        df1
Out[3]: 
   a        new
0  A     [1, 2]
1  B  [5, 5, 4]
2  C        [6]

关于python - 如何将数据框行分组到 Pandas groupby 中的列表中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22219004/

相关文章:

regex - 用 grep 匹配一行中的两个字符串

linux - 保持 SSH session 处于事件状态

linux - 在 Unix 中,我可以在一个目录中运行 'make' 而不先 cd'ing 到那个

python - 字典和默认值

python - 如何从 Python 中的函数返回两个值?

python - numpy.random.seed(0) 做什么?

python - 省略号 [...] 在列表中是什么意思?

linux - 如何为 wget 设置代理?

python - 安装 python 时在 $PATH 中找不到可接受的 C 编译器

linux - grep 不显示路径/文件 :line