python笔记
这篇保存一些pandas常用的命令,字符串获取的方法,以及字典列表的一些实用方法
Pandas
1.pandas读取
1 | import pandas as pd |
2.pandas创建
1 | ##字典嵌套列表创建 |
3.pandas列索引操作
1 | ##列索引 |
4.pandas行索引操作
1 | ##可以将行标签传递给 loc 函数,来选取数据 |
名称 | 属性&方法描述 |
---|---|
T | 行和列转置。 |
axes | 返回一个仅以行轴标签和列轴标签为成员的列表。 |
dtypes | 返回每列数据的数据类型。 |
empty | DataFrame中没有数据或者任意坐标轴的长度为0,则返回True。 |
ndim | 轴的数量,也指数组的维数。 |
shape | 返回一个元组,表示了 DataFrame 维度。 |
size | DataFrame中的元素数量。 |
values | 使用 numpy 数组表示 DataFrame 中的元素值。 |
head() | 返回前 n 行数据。 |
tail() | 返回后 n 行数据。 |
shift() | 将行或列移动指定的步幅长度 |
String
1.通用类
- replace(old, new [, max]),把 将字符串中的 old 替换成 new, max 为可选参数,若指定 max ,则替换 max 次
1 | double_str = "my name is kele kele" |
- split(str="", num=string.count(str)),以 str
为分隔符截取字符串,默认为所有的空字符,包括空格、换行
\n
、制表符\t
等。若指定 num ,则截取出 num+1 个子字符串,返回包含所有字符串的列表。
1 | # 用法一:不指定 num ,截取所有 |
- splitlines([keepends]),按照行('', '', ')分隔,返回一个包含各行作为元素的列表,参数 keepends 默认为 False,不包含换行符,如果为 True,则保留换行符。
1 | # 用法一:不指定 keepends,默认为 False |
- find(str, beg=0, end=len(string)),检测 str 是否包含在字符串中,若指定 beg 和 end ,则在指定范围内检测,若包含则返回第一次出现的索引值,否则返回 -1。
1 | double_str = "my name is kele" |
rfind 与find类似,从右边开始找,返回最后一次出现的索引值
index(str, beg=0, end=len(string)),与 find() 函数类似,但如果 str 不在字符串中会报错
rindex与index类似,从右边找
count(str, beg= 0,end=len(string)),返回 str 在 string 中出现的次数,若指定 beg 或者 end 参数,则返回在指定范围内 str 出现的次数。
1 | double_str = "my name is kele" |
- lstrip([chars]),只处理字符串句首的空格或指定字符,其他位置忽略。
1 | # 处理句首空格 |
rstrip([chars]),处理字符串末尾的空格或指定字符,其他位置忽略.。
strip([chars]), 处理字符串两端的空格或指定字符,可视为 lstrip() 和 rstrip() 的效果叠加。
1 | # 处理两端的指定字符 |
- center(width, fillchar),fillchar 为填充的字符,默认使用空格填充,返回指定宽度 width、原字符串居中、使用 fillchar 填充后的字符串。
1 | # 指定填充字符 【*】 |
ljust,右侧填充
rjust,左侧填充
join(seq),以指定字符串作为拼接字符,将 seq 中所有的元素(必须是字符串类型),拼接为一个新的字符串。如果拼接对象不是字符会报错。
1 | # 用法一:不指定拼接字符,默认使用空字符 |
2.单词类
- capitalize(),将字符串的首字母转换为大写。
- title(),将字符串中所有单词的首字母转换为大写。
- upper(),将字符串中的小写字母全部转换为大写。
- lower(),将字符串中所有大写字母转换为小写。
- swapcase(),将字符串中的大写字母转换为小写,小写字母转换为大写。
- max(str),返回字符串 str 中最大的字母。
- min(str),返回字符串 str 中最小的字母。
3.判断类
- startswith(substr, beg=0,end=len(string)),判断字符串是否是以指定子字符串 substr 开头,是则返回 True,否则返回 False。若指定 beg 和 end 值,则在指定范围内判断。
1 | double_str = "my name is kele" |
- endswith(suffix, beg=0, end=len(string)),判断字符串是否以指定子字符串 suffix 结束,是则返回 True,否则返回 False。若指定 beg 和 end 值,则在指定范围内判断。
1 | 用法一:不指定范围 |
isdigit(),判断字符串是否只包含数字,是则返回 True, 否则返回 False。
isalnum(),判断字符串是否至少有一个字符并且只包含字母、数字或字母和数字,是则返回 True,否则返回 False。
isalpha(),判断字符串是否至少有一个字符,并且全为字母,是则返回 True, 否则返回 False,中文也被视为字母字符。
islower(),判断字符串是否至少包含一个字母,并且字母全为小写,是则返回 True,否则返回 False。
isupper(),判断字符串是否至少包含一个字母,并且字母全为大写,是则返回 True,否则返回 False。
istitle(),判断字符串中所有英文单词的首字母是全为大写,其他字母全为小写,是则返回 True,否则返回 False。
isnumeric(),判断字符串是否只包含数字,是则返回 True,否则返回 False。数字可以是: Unicode 数字,全角数字(双字节),罗马数字,汉字数字。
isdecimal(),判断字符串是否只包含十进制数字,是则返回 True,否则返回 False。
isspace(),判断字符串是否只包含空白字符,是则返回 True,否则返回 False。
4.编码类
- encode(encoding='UTF-8',errors='strict'),以 encoding 指定的编码格式编码字符串,默认为utf-8,如果出错默认报一个ValueError 的异常,除非 errors 指定的是 ignore 或者 replace。
1 | ##utf8 |
- bytes.decode(encoding="utf-8", errors="strict"),处理使用指定编码格式编码后的字符串,其中 bytes可通过字符串编码 str.encode() 来获取。
1 | double_str = "utf-8编码" |
Dictionary
之后再填