首页 > 其他分享 >beautifulSoup找不到元素

beautifulSoup找不到元素

时间:2023-06-15 16:34:35浏览次数:44  
标签:元素 driver beautifulSoup 不到 iframe xmSoup 页面 find xmInfo

问题:页面F12可以定位元素,但把网页下载到本地,无法定位

2种原因:

1、内容在一个标签中,放在json字符串里

 

# 内容在input里
inputInfo = soup.find_all('input')[3]['value']  #页面所有内容
xmInfo = json.loads(inputInfo)
Agency = xmInfo['author']
xmContent = xmInfo['content']
xmSoup = BeautifulSoup(xmContent,'html.parser')

 

2、内容在一个iframe标签下,并用document注释

#页面内容嵌套在iframe里
driver.switch_to.frame(driver.find_element(By.CSS_SELECTOR,'iframe'))
xmSource = driver.page_source
xmSoup = BeautifulSoup(xmSource,'html.parser')
Agency = xmSoup.find(text=re.compile(u'来源:')).text

 

标签:元素,driver,beautifulSoup,不到,iframe,xmSoup,页面,find,xmInfo
From: https://www.cnblogs.com/feifeidxl/p/17483269.html

相关文章

  • beautifulSoup查找元素常用汇总
    0、初始化:frombs4importBeautifulSouppageSource=driver.page_sourcesoup=BeautifulSoup(pageSource,'html.parser')1、标签名定位方法1:soup.body方法2:li.select('a')2、查找2.1、单个查找2.1.1、按text内容查找xmSoup.find(text=re.compile(......
  • 带重复元素的排列
    带重复元素的排列题目:描述给出一个具有重复数字的列表,找出列表所有不同的排列。样例样例1:输入:nums=[1,1]输出:[[1,1]]解释:[1,1]的不同排列只有[1,1]。样例2:输入:nums=[1,2,2]输出:[[1,2,2],[2,1,2],[2,2,1]]解题思路:首先思考如何去重,先......
  • DOM4J 工具类(以对象的方式增加和删除XML元素)
    packagenet.better_best.www.dynamicADPics.utils;importjava.io.File;importjava.io.FileWriter;importjava.io.IOException;importjava.util.ArrayList;importjava.util.Iterator;importjava.util.List;importorg.dom4j.Attribute;......
  • CSS(语义化标签、多媒体标签、新表单元素、属性选择器、结构伪类选择器、伪元素选择器
    一、HTML5新特性概述HTML5的新增特性主要是针对于以前的不足,增加了一些新的标签、新的表单和新的表单属性等。这些新特性都有兼容性问题,基本是IE9+以上版本的浏览器才支持,如果不考虑兼容性问题,可以大量使用这些新特性。1语义化标签(★★)以前布局,我们基本用div来做。di......
  • java修改Set中的元素
    java修改Set中的元素一.问题的提出在java中,有以下代码:publicclassTest{publicstaticvoidmain(String[]args){Set<Stu>set=newHashSet<>();Stus1=newStu(1);Stus2=newStu(2);set.add(s1);set.add(s2);......
  • HTML页面元素解释
    HTML代表超文本标记语言,是用于在万维网上创建网页和构建其内容的标准标记语言。HTML是Web开发的支柱,也是创建基于Web的文档的基本构建块。让我们快速看一下它是如何工作的。(更多优质内容:java567.com)HTML有什么作用?HTML的主要作用是通过使用一组标签或元素来定义网页的......
  • JavaScript 动态编辑元素某属性值(例如:元素div的class属性)
    元素<divclass="h5-box-search-itemusimglistnodisplay"id="usimglist"></div>(满足条件)动态更新div元素的class属性值://获取目标容器letusimglist=document.getElementById('usimglist');//获取其class的属性值letclassinfo=usimglist.ge......
  • 从n个不同元素中有放回的取出r个且不计顺序,有多少种不同的取法?
    从n个不同元素中有放回的取出r个且不计顺序,有多少种不同的取法?答案是:\(C_{n+r-1}^r\)解析因为是有放回地取出,所以同一个元素可能会被取多次,并且取出的元素是不计顺序的,那么如果我们设\(x_i\)为第\(i\)个元素被取出的次数,问题就被转化为:\[\begin{aligned}x_1+x_2+\cdots+x_n......
  • java开发C语言解释器:数组元素的读取和赋值
    本节技术内容难度较大,请结合视频对代码的讲解和调试来理解本节内容:用java开发编译器一个成熟的编译器或解释器,要能够解析和执行目标语言开发的逻辑复杂的程序代码,我们用java开发的C语言解释器,能够执行用C语言开发的较为复杂的程序时,才称得上是合格的,从本节开始,我们致力于C语言解......
  • 面试算法:在整形数组中构建元素之和能整除数组长度的子集
    更详细的讲解和代码调试演示过程,请参看视频如何进入google,算法面试技能全面提升指南假设A是一个整数数组,长度为n,数组中的元素可能是重复的。设计一个算法,找到一系列下标的集合I={i(0),i(1),i(2)….i(n)}.使得(A[i(0)]+A[i(1)]+…A[i(n)])modn=0.例如假定A={711......