目录
前言:
如果你使用的是Anaconda中的Jupyter,则不需要下载Pands和Numpy库;如果你使用的是pycharm或其他集成环境,则需要Pands和Numpy库
一·Numpy库中操作文件
1.操作csv文件
import numpy as np a=np.random.randint(0,10,size=(3,4)) np.savetext(\"score.csv\",a,deliminter=\",\")
a:自己随便创建的数组,deliminter:分隔符,score:要读取的文件名
或者
import numpy as np data=np.loadtxt(\"score.csv\",delimiter=\",\",skiprows=1,dtype=str)
skiprows:跳过第一行,dtype:数据读出的类型为字符型
2.在pycharm中操作csv文件
import csv with open(\"score.csv\",\'r\')as fp: reader=csv.reader(fp) for x in reader: print(x)
reader:迭代器
3.其他情况(.npy类型文件)
import numpy as np c=np.random.randint(0,10,size=(2,3)) np.save(\"文件名\",c) c1=np.load(\"文件名.npy\")
二·Pandas库中操作文件
1.操作csv文件
import pandas as pd df=pd.read_csv(\"exl.csv\")
或者
import pandas as pd pd.read_table(\"exl.csv\",sep=\',\')
sep:分隔符
2.从剪贴板上复制数据
import pandas as pd BS=pd.read_clipboard
3.读取excel或xlsx文件
import pandas as pd df=read_excel(\"exl.xlsx\")
三·补充
1.常用
import osos.chdir()
chdir()中写上你想读取文件的目录,表示将目录转化到你想读取文件的目录.
2.pandas中读取文件的函数
read_csv 从文件,URL,文件型对象中加载带分隔符的数据。默认分隔符为逗号
read_table 同上,但默认分隔符为制表符(“t”)
read_fwf 读取定宽列格式数据(无分隔符)
read_clipboard 读取剪贴板中的数据
read_excel 从Excel 或xlsx文件中读取表格数据
read_hdf 读取pandas写的HDF5文件
read_html 读取html文档中的所以表格
read_json 读取json字符串中的数据
read_msgpack 二进制格式编码的pandas数据
read_pickle 读取python pickle 格式中存储的任意对象
read_sas 读取存储于SAS系统自定义存储格式为SAS数据集
read_sql 读取SQL查询结果为pandas的DataFrame
read_stata 读取stata文件格式的数据集
暂无评论内容