导入pandas
import pandas as pd
pandas
中一个dataframe
相当于excel
中的一个sheet
创建数据表并写入数据
默认情况下会生成0,1,2...
索引
import pandas as pd
df = pd.DataFrame({'ID':[1,2,3],'Name':['soarli','Robin','Pony']})
df.to_excel('test.xlsx')
print('Done!')
直接使用ID作为索引
import pandas as pd
df = pd.DataFrame({'ID':[1,2,3],'Name':['soarli','Robin','Pony']})
df = df.set_index('ID')
df.to_excel('test.xlsx')
print('Done!')
df可以直接print
读取表格文件
输出行列数
import pandas as pd
space = pd.read_excel('longzihu.xlsx')
print(space.shape)
输出所有列名
print(space.columns)
# Index(['校区', '楼名', '楼层'], dtype='object')
输出最前面一部分信息
print(space.head())
上述方法默认输出前5行,可以手动指定行数:
print(space.head(3))
输出最后面一部分信息
print(space.tail(3))
从第3行开始读取
space = pd.read_excel('longzihu.xlsx',header=2) # Excel中的第3行对应py里的2
注意:若前两行为空行则不用这样强调(空行会自动跳过)
文件中没有写入header
space = pd.read_excel('longzihu.xlsx',header=None) # 若不在下方指定,则会生成0,1,2,3,4,5作为columns(列名)
space.columns = ['campus','building','floor'] # 指定header为列表元素
此外,在打开文件时,若已知某一列为index(如“ID”),则应当按照下述方式读取(否则会再生成一列索引,如下图左):
df = pd.read_excel('test.xlsx',index_col='ID')
df.to_excel('test2.xlsx')
print('Done!')
未完待续...
参考资料:
https://www.jianshu.com/p/840ba135df30
https://www.bilibili.com/video/BV1hk4y1C73S
https://www.bilibili.com/video/BV1UJ411A7Fs
版权属于:soarli
本文链接:https://blog.soarli.top/archives/640.html
转载时须注明出处及本声明。