python pandas Series str属性的使用

举报
lu_zhishen 发表于 2021/04/14 15:56:37 2021/04/14
【摘要】 使用pandas对excel的数据进行操作时,可以使用Series 对象的str属性,完成各种操作,比如以下str对应的函数df["姓名"].str.cat(df["家庭住址"],sep='-'*3)df["家庭住址"].str.contains("广")df["姓名"].str.startswith("黄") df["英文名"].str.endswith("e")df["电话号码"].st...

使用pandas对excel的数据进行操作时,可以使用Series 对象的str属性,完成各种操作,比如以下str对应的函数

df["姓名"].str.cat(df["家庭住址"],sep='-'*3)

df["家庭住址"].str.contains("广")

df["姓名"].str.startswith("黄") 

df["英文名"].str.endswith("e")

df["电话号码"].str.count("3")

df["姓名"].str.get(-1)
df["身高"].str.split(":")
df["身高"].str.split(":").str.get(0)

df["性别"].str.len()

df["英文名"].str.upper()
df["英文名"].str.lower()

df["家庭住址"].str.pad(10,fillchar="*")      # 相当于ljust()
df["家庭住址"].str.pad(10,side="right",fillchar="*")    # 相当于rjust()
df["家庭住址"].str.center(10,fillchar="*")

df["性别"].str.repeat(3)

df["电话号码"].str.slice_replace(4,8,"*"*4)

df["身高"].str.replace(":","-")

df["收入"].str.replace("\d+\.\d+","正则")

df["身高"].str.split(":")
# split方法,搭配expand参数
df[["身高描述","final身高"]] = df["身高"].str.split(":",expand=True)
df
# split方法搭配join方法
df["身高"].str.split(":").str.join("?"*5)

df["姓名"].str.len()
df["姓名"] = df["姓名"].str.strip()
df["姓名"].str.len()

df["身高"]
df["身高"].str.findall("[a-zA-Z]+")

df["身高"].str.extract("([a-zA-Z]+)")
# extractall提取得到复合索引
df["身高"].str.extractall("([a-zA-Z]+)")
# extract搭配expand参数
df["身高"].str.extract("([a-zA-Z]+).*?([a-zA-Z]+)",expand=True)

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。