soarli

pandas学习笔记
导入pandasimport pandas as pdpandas中一个dataframe相当于excel中的一个...
扫描右侧二维码阅读全文
15
2022/03

pandas学习笔记

导入pandas

import pandas as pd

pandas中一个dataframe相当于excel中的一个sheet

创建数据表并写入数据

默认情况下会生成0,1,2...索引

import pandas as pd

df = pd.DataFrame({'ID':[1,2,3],'Name':['soarli','Robin','Pony']})
df.to_excel('test.xlsx')
print('Done!')

image-20220315021127278

直接使用ID作为索引

import pandas as pd

df = pd.DataFrame({'ID':[1,2,3],'Name':['soarli','Robin','Pony']})
df = df.set_index('ID')
df.to_excel('test.xlsx')
print('Done!')

image-20220315022525039

df可以直接print

image-20220315022645395

读取表格文件

输出行列数

import pandas as pd

space = pd.read_excel('longzihu.xlsx')
print(space.shape)

image-20220315023214621

输出所有列名

print(space.columns)
# Index(['校区', '楼名', '楼层'], dtype='object')

输出最前面一部分信息

print(space.head())

image-20220315023623522

上述方法默认输出前5行,可以手动指定行数:

print(space.head(3))

image-20220315023724938

输出最后面一部分信息

print(space.tail(3))

image-20220315023850370

从第3行开始读取

space = pd.read_excel('longzihu.xlsx',header=2) # Excel中的第3行对应py里的2

注意:若前两行为空行则不用这样强调(空行会自动跳过)

文件中没有写入header

space = pd.read_excel('longzihu.xlsx',header=None) # 若不在下方指定,则会生成0,1,2,3,4,5作为columns(列名)
space.columns = ['campus','building','floor'] # 指定header为列表元素

此外,在打开文件时,若已知某一列为index(如“ID”),则应当按照下述方式读取(否则会再生成一列索引,如下图左):

df = pd.read_excel('test.xlsx',index_col='ID')
df.to_excel('test2.xlsx')
print('Done!')

image-20220315030038104

未完待续...

参考资料:

https://www.pypandas.cn/docs/

https://www.jianshu.com/p/840ba135df30

https://www.bilibili.com/video/BV1hk4y1C73S

https://www.bilibili.com/video/BV1UJ411A7Fs

最后修改:2022 年 03 月 15 日 03 : 27 AM

发表评论