pandas把dataframe平均分割成多份

阅读: 评论:0

pandas把dataframe平均分割成多份

pandas把dataframe平均分割成多份

场景

这个需求感觉比较常见,例如我想对一个比较大的df做多线程,把处理时间从23小时降为1小时,需要把这个dataframe平均分割成20份喂到每个线程中,但在网上搜索了下没有找到合适的代码,故记录下来。

输入输出都比较明确,所以直接贴代码吧

import math
import pandas as pd
from tqdm import tqdmdef cut_df(file_name, n):df = pd.read_csv(file_name)df_num = len(df)every_epoch_num = nath.floor((df_num/n))for index in tqdm(range(n)):file_name = f'./XXX_{index}.csv'if index < n-1:df_tem = df[every_epoch_num * index: every_epoch_num * (index + 1)]else:df_tem = df[every_epoch_num * index:]_csv(file_name, index=False)

其中file_name是你要切割的文件名,我这边是设置的csv,如果你的是excel吧读取函数改一下就行,n是要切成的份数

感谢DXZE发现错误,少了条from tqdm import tqdm,已经补上了

本文发布于:2024-01-29 12:30:07,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170650260915296.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:多份   平均   pandas   dataframe
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23