首页 > 其他分享 >17-18.导入csv

17-18.导入csv

时间:2022-11-18 23:00:21浏览次数:40  
标签:17 encoding df 18 header 导入 pd csv

*导入CSV文件.
pd.read_csv(filepath_or_buffer,sep=',header,encoding=None)

常用参数说明.
#  filepath_or_buffer:字符串、文件路径,也可以是URL链接
#  sep:字符串、分隔符.
#  header:指定作为列名的行,默认值为0,即取第一行的值为列名。数据为除列名以外的数据,若数据不包含列表,则设置header=None

#  encoding:字符串,默认值为None.文件的编码格式

#导入txt文件 
import pandas as pd 
pd.set_option('display.unicode.east_asian_width',True) # 规整格式
df=pd.read_csv('rating.txt', sep='\t', encoding= 'gbk',header=None)  #没有标题栏加header=None
print (df.head())    #head() 默认输出5条数据
#导入CSV文件   文件中分割符号为,
import pandas as pd 
df=pd. read_csv('评论数据. csv', sep=',', encoding=' gbk') 
print (df.head())

导入txt文件

          pd.read_csv(filepath_or_buffer,sep='t',header,encoding=None) .
导入HTML网页

       pd.read_html(io,match='.+',flavor,header,encoding)

      参数说明

         io:字符串、文件路径,了可以是URL链接,网址不接受https

         match:正则表达式 .
         flavor:解释器默认为'Ixml'

          header:指定列标题所在的行

          encoding:文件的编码格式

#导入HTM 
import pandas as pd 
url=' http://www. espn. com/nba/salaries' 

df=pd. DataFrame () # 创建一个空的DataFrame对象

# DataFrame添加数据 
df=df. append (pd.read_html(url)) 
print (df)
#保存成CSV文件 
df.to_csv(' nbasalary. csv', index=False)  #index=False 是指不输出隐式索引0,1,2.....

#网页含有table标签的才能读取

标签:17,encoding,df,18,header,导入,pd,csv
From: https://www.cnblogs.com/988MQ/p/16905196.html

相关文章

  • 2022-11-18 Acwing每日一题
    本系列所有题目均为Acwing课的内容,发表博客既是为了学习总结,加深自己的印象,同时也是为了以后回过头来看时,不会感叹虚度光阴罢了,因此如果出现错误,欢迎大家能够指出错误,我......
  • 18.正则表达式
    正则表达式认识正则正则表达式,又称规则表达式,(RegularExpression,在代码中常简写为regex、regexp或RE),是一种文本模式,包括普通字符(例如,a到z之间的字母)和特殊字符(称为"......
  • 11.18 解题报告
    A考场用时:\(1\)h期望得分:\(100\)pts实际得分:\(100\)pts不难推出:总代价即为所有逆序对的差的绝对值之和,这个直接树状数组维护就行了。#include<bits/stdc++.h>#def......
  • 11.18 解题报告
    总的来说没挂分,因为没啥分可以挂了。预计得分:60+0+20+20实际得分:60+0+15+20A预计得分:60实际得分:60写了n^2的暴力+特殊性质特殊性质用暴力来......
  • 2022-11-18学习内容
    1.案例-购物车-清空购物车1.1ShoppingCartActivity.javapackagecom.example.chapter06;importandroidx.appcompat.app.AppCompatActivity;importandroid.app.Ale......
  • 17.bs4
    bs4解析​ 下载--pipinstallbs4示例代码-爱丽丝漫游仙境html_doc="""<html><head><title>TheDormouse'sstory</title></head><body><pclass=......
  • 11.18
    今日内容1.同步异步与阻塞非阻塞2.创建进程的多种方式3.进程间数据隔离4.进程的join方法5.IPC机制6.生产者消费者模型7.进程对象的多种方法8.守护进程9.僵尸进程......
  • 【2022-11-18】luffy项目实战(十一)
    一、课程列表页之前端views/Course.vue<template><divclass="course"><Header></Header><divclass="main"><!--筛选条件-->......
  • 【流水】2022.11.18
    跟Kaguya讨论了一下要不要看看大母神崇拜里面的那个番,要看的,一致意见是要看的。为什么都在用Vim,不是很理解。兴许真的很好用罢。我个人的意见是:在我会盲打和正则......
  • 2022-2023-1 20221318 《计算机基础和程序设计》第十二周学习总结
    作业信息这个作业属于那个班级https://edu.cnblogs.com/campus/besti/2022-2023-1-CFAP作业要求https://www.cnblogs.com/rocedu/p/9577842.html#WEEK12作业目标学习......