- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

pandas将list数据拆分成行或列的实现

泽宇-Li 发表于 2020/12/13 19:27:08 2020/12/13

【摘要】数据1234567 import numpy as npimport pandas as pd data = [{'Name': '小明', 'Chinese': [70, 80], 'Math': [90, 80]}, {'Name': '小红', 'Chinese': [70, 80, 90], 'Math': [90, 80, 70]}]data = pd.DataFrame(d...

数据

 
         import numpy as np
        
         import pandas as pd
        
         data = [{'Name': '小明', 'Chinese': [70, 80], 'Math': [90, 80]},
        
             {'Name': '小红', 'Chinese': [70, 80, 90], 'Math': [90, 80, 70]}]
        
         data = pd.DataFrame(data)
        
         data

拆分成行

 
         def split_row(data, column):
        
           '''拆分成行
        
           :param data: 原始数据
        
           :param column: 拆分的列名
        
           :type data: pandas.core.frame.DataFrame
        
           :type column: str
        
           '''
        
           row_len = list(map(len, data[column].values))
        
           rows = []
        
           for i in data.columns:
        
             if i == column:
        
               row = np.concatenate(data[i].values)
        
             else:
        
               row = np.repeat(data[i].values, row_len)
        
             rows.append(row)
        
           return pd.DataFrame(np.dstack(tuple(rows))[0], columns=data.columns)
        
         split_row(data, column='Chinese')

拆分成列

 
         from copy import deepcopy
        
         def split_col(data, column):
        
           '''拆分成列
        
           :param data: 原始数据
        
           :param column: 拆分的列名
        
           :type data: pandas.core.frame.DataFrame
        
           :type column: str
        
           '''
        
           data = deepcopy(data)
        
           max_len = max(list(map(len, data[column].values))) # 最大长度
        
           new_col = data[column].apply(lambda x: x + [None]*(max_len - len(x))) # 补空值，None可换成np.nan
        
           new_col = np.array(new_col.tolist()).T # 转置
        
           for i, j in enumerate(new_col):
        
             data[column + str(i)] = j
        
           return data
        
         split_col(data, column='Chinese')

其他情况

1. 批量处理+不要原列

 
         def split_col(data, columns):
        
           '''拆分成列
        
           :param data: 原始数据
        
           :param columns: 拆分的列名
        
           :type data: pandas.core.frame.DataFrame
        
           :type columns: list
        
           '''
        
           for c in columns:
        
             new_col = data.pop(c)
        
             max_len = max(list(map(len, new_col.values))) # 最大长度
        
             new_col = new_col.apply(lambda x: x + [None]*(max_len - len(x))) # 补空值，None可换成np.nan
        
             new_col = np.array(new_col.tolist()).T # 转置
        
             for i, j in enumerate(new_col):
        
               data[c + str(i)] = j
        
         split_col(data, columns=['Chinese','Math'])
        
         data

2. 带int和list数据

转成这样：

 
         import numpy as np
        
         import pandas as pd
        
         data = [{'Name': '小爱', 'Chinese': 70, 'Math': 90},
        
             {'Name': '小明', 'Chinese': [70, 80], 'Math': [90, 80]},
        
             {'Name': '小红', 'Chinese': [70, 80, 90], 'Math': [90, 80, 70]}]
        
         data = pd.DataFrame(data)
        
         def split_col(data, columns):
        
           '''拆分成列
        
           :param data: 原始数据
        
           :param columns: 拆分的列名
        
           :type data: pandas.core.frame.DataFrame
        
           :type columns: list
        
           '''
        
           for c in columns:
        
             new_col = data.pop(c)
        
             max_len = max(list(map(lambda x:len(x) if isinstance(x, list) else 1, new_col.values))) # 最大长度
        
             new_col = new_col.apply(lambda x: x+[None]*(max_len - len(x)) if isinstance(x, list) else [x]+[None]*(max_len - 1)) # 补空值，None可换成np.nan
        
             new_col = np.array(new_col.tolist()).T # 转置
        
             for i, j in enumerate(new_col):
        
               data[c + str(i)] = j
        
         split_col(data, columns=['Chinese','Math'])
        
         data

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

pandas将list数据拆分成行或列的实现

数据

拆分成行

拆分成列

其他情况

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

pandas将list数据拆分成行或列的实现

数据

拆分成行

拆分成列

其他情况

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品