首页 > 其他分享 >17.爬取天天基金中万家精选混合A (519185)的净值数据

17.爬取天天基金中万家精选混合A (519185)的净值数据

时间:2023-02-03 22:56:35浏览次数:50  
标签:17 df 数据 list 爬取 519185 print data

 1 # 爬虫
 2 # 该项目是爬取天天基金网某只基金的净值数据
 3 
 4 # 1.引入包
 5 # 网络请求
 6 import json
 7 
 8 import requests
 9 # 正则
10 import re
11 # 数据分析工具
12 import pandas as pd
13 
14 # 定义一个空的列表,存放每一页的数据
15 df_list = []
16 # for循环用来获取不同页码的数据,这里循环10次
17 for index in range(1, 10):
18     # 2.请求的url地址或者接口,页面数使用花括号占位
19     url = "http://api.fund.eastmoney.com/f10/lsjz?callback=jQuery18306600264369919882_1675428357095&fundCode=519185&pageIndex={}&pageSize=20&startDate=&endDate=&_=1675428744359".format(index)
20 
21     # 3.请求所需要的请求头内容
22     headers = {
23         "Host":"api.fund.eastmoney.com",
24         # 防盗链   确定访问来路是否非法
25         "Referer":"http://fundf10.eastmoney.com/",
26         # 身份验证,模拟浏览器发出
27         "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36 Edg/108.0.1462.76"
28     }
29 
30     # 4.发送请求
31     resp = requests.get(url, headers=headers)
32 
33     # 5.打印获取的数据
34     data = resp.text
35     print(data)
36 
37 
38     # 6.通过正则表达式获取只想要的数据
39     data = re.findall("\((.*?)\)", data)
40     print(data)
41 
42     # 7.将数据转换成json格式
43     data = json.loads(data[0])["Data"]["LSJZList"]
44     print(data)
45 
46     # 8.使用pandas格式化数据
47     df = pd.DataFrame(data)
48     # print(df)
49 
50     # 9.将每一页数据添加到列表中
51     df_list.append(df)
52 
53 # 10.打印列表中的所有数据
54 # print(df_list)
55 
56 # 11.合并列表中的数据
57 df_data = pd.concat(df_list)
58 print(df_data)
59 
60 # 12.将数据保存到csv中,行号不保存
61 df_data.to_csv("万家精选混合A (519185).csv",index=False)

csv保存后的样子:

 

标签:17,df,数据,list,爬取,519185,print,data
From: https://www.cnblogs.com/mxx520/p/17090650.html

相关文章

  • 每日一道思维题——CF1772D - Absolute Sorting
    题意:给定一个长度为n的数组,求出是否存在一个数x使得,由|ai-x|构成的数组bi满足(bi <=bi+1)思路:对于任意两个数a1,a2求|ai-x|有以下几种情况1.x<(a1,a2)/2:  新......
  • POJ 1733 Parity game (路径压缩并查集+离散化)
    DescriptionNowandthenyouplaythefollowinggamewithyourfriend.Yourfriendwritesdownasequenceconsistingofzeroesandones.Youchooseacontinuous......
  • 2019年8月17日训练日记
    昨天没有看书,感觉知识点有点消化不完了,就随便找了两套题,上午刷了一套,还是比较简单的,一上午出来四个题。下午的就比较难了,看了一下好像是山东理工几个18级在做,开始了一个小时......
  • FMC子卡设计资料:FMC177-基于AD9361的双收双发射频FMC子卡
    FMC177-基于AD9361的双收双发射频FMC子卡     一、板卡介绍       FMC177射频模块分别包含两个接收通道与发射通道,其频率可覆盖达到70MHz......
  • UVA 11754 code feat (中国剩余定理+暴力枚举)
    题意:给出C,SC,SC,S,......
  • CF1707E Replace
    CF1707EReplace完全没想到从这种角度考虑性质。一开始的思路是把每种区间表示为一个节点建树,然后答案就是深度,但是很显然节点数是平方级别的,所以就寄了。尝试使用数据结......
  • java(17)io流
    JavaIO流详解1.什么是IOJava中I/O操作主要是指使用Java进行输入,输出操作.Java所有的I/O机制都是基于数据流进行输入输出,这些数据流表示了字符或者字节数据的流动序列。......
  • 17-三态门(TSL)
    三态门(TSL)普通的逻辑电路只有两个状态,还有一个高阻态。EN是高电平1A,B,EN之间的关系是与的关系,当EN为1得时候,EN就不起作用了,输入由A,B决定。EN端为高电平,所以二极管D2截止......
  • 洛谷 P3750 [六省联考 2017] 分手是祝愿
    洛谷传送门考虑先求出哪些点一定要按,然后dp。设\(f_i\)为当前还有\(i\)个点要按的期望步数。转移就是\(f_i=\dfrac{i}{n}f_{i-1}+\dfrac{n-i}{n}f_{i+1}\),初......
  • 【题解】P3750 [六省联考 2017] 分手是祝愿
    出题老哥收收味吧,阿米奈!记一下几个常用的手段。昨晚CF的D是差不多的思路吧,不然不会来做。思路期望dp.先做一些准备工作,求一下逆元和每个数的因数,复杂度\(O(n\l......