Python数据分析之pandas读取数据-偶像资源网

一、三种数据文件的读取

二、csv、tsv、txt 文件读取

1）CSV文件读取：

语法格式：pandas.read_csv(文件路径)
CSV文件内容如下：

import pandas as pd
file_path = \"e:\\\\pandas_study\\\\test.csv\"
content = pd.read_csv(file_path)

content.head()  # 默认返回前5行数据
content.head(3)  # 返回前3行数据
content.shape  # 返回一个元组（总行数，总列数），总行数不包括标题行

content.index    #    返回索引，是一个可迭代的对象<class \'pandas.core.indexes.range.RangeIndex\'>

content.column    #  返回所有的列名 Index([\'姓名\', \'年龄\', \'籍贯\'], dtype=\'object\')

content.dtypes  #  返回的是每列的数据类型
姓名    object
年龄     int64
籍贯    object
dtype: object

2）CSV文件读取：

语法格式：pandas.read_csv(文件路径)
CSV文件内容如下：

import pandas as pd
file_path = \"e:\\\\pandas_study\\\\test2.txt\"

content = pd.read_csv(file_path,sep=\'\\t\',header = None ,names= [\'name\',\'age\',\'adress\'])
#参数说明：
# header = None 表示没有标题行
# sep=\'\\t\'  表示去除分割符中的空格
# names= [\'name\',\'age\',\'adress\'] ，列名依次自定义为\'name\',\'age\',\'adress\'

content.head()  # 默认返回前5行数据
content.head(3)  # 返回前3行数据
content.shape  # 返回一个元组（总行数，总列数），总行数不包括标题行

content.index    #    返回索引，是一个可迭代的对象<class \'pandas.core.indexes.range.RangeIndex\'>

content.column    #  返回所有的列名 Index([\'姓名\', \'年龄\', \'籍贯\'], dtype=\'object\')

content.dtypes  #  返回的是每列的数据类型

三、excel文件读取

import pandas as pd
file_path = \"e:\\\\pandas_study\\\\test3.xlsx\"
content = pd.read_excel(file_path)

content.head()  # 默认返回前5行数据
content.head(3)  # 返回前3行数据
content.shape  # 返回一个元组（总行数，总列数），总行数不包括标题行

content.index    #    返回索引，是一个可迭代的对象<class \'pandas.core.indexes.range.RangeIndex\'>

content.column    #  返回所有的列名 Index([\'姓名\', \'年龄\', \'籍贯\'], dtype=\'object\')

content.dtypes  #  返回的是每列的数据类型
姓名    object
年龄     int64
籍贯    object
dtype: object

四、数据库表格读取

语法： pandas.read_sql(sql语句,数据库连接对象)
数据对象的创建，可以根据pymysql,cx_oracle等模块连接mysql或者oracle。

版权声明 1 本网站名称：偶像资源网
2 本站永久网址：https://www.ox520.com
3 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长 QQ593098775进行删除处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6 本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END