根据您的评论:
有大约20个不同的值,范围从1000到9999,所以我想使用每1000个作为一个类别
从严格意义上说,这并不是真正的规范化。但是,要做到这一点,您可以轻松使用地板划分( // ):
//
df['new_column'] = df['values']//1000
例如:
>>> df values 0 2021 1 8093 2 9870 3 4508 4 2645 5 1441 6 8888 7 8921 8 7292 9 8571 df['new_column'] = df['values']//1000 >>> df values new_column 0 2021 2 1 8093 8 2 9870 9 3 4508 4 4 2645 2 5 1441 1 6 8888 8 7 8921 8 8 7292 7 9 8571 8