软件测试|web自动化测试神器playwright教程（三十四）

时间：2023-08-09 18:55:57浏览次数：40

标签：web playwright text blog inner context page 软件测试

在这里插入图片描述

前言

selenium有一个爬虫特别喜欢的功能，就是driver.page_source功能，它可以打印整个html页面的内容，我们可以从整个页面的内容中提取出我们想要的内容，playwright同样支持打印整个html页面的内容。

获取完整页面html内容

playwright提供了page.content()方法来获取页面内容，示例如下：

from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch(headless=False)
    context = browser.new_context()
    page = context.new_page()

    page.goto("https://ceshiren.com/")
    print(page.content())

运行脚本，结果如下图：

在这里插入图片描述

获取部分HTML内容

page.content() 是获取整个页面的HTML,但是有时候我们不需要获取完整的HTML内容，例如下面的页面，我们只取部分的内容：

在这里插入图片描述

playwright提供了locator().inner_html()方法获取页面内容

inner_html() 获取元素的整个html源码内容
inner_text() 获取元素的文本内容

示例代码如下：

from playwright.sync_api import Playwright, sync_playwright, expect


def run(playwright: Playwright) -> None:
    browser = playwright.chromium.launch(headless=False)
    context = browser.new_context()
    page = context.new_page()
    page.goto("https://blog.csdn.net/Tester_muller?type=lately")
    # 获取某个元素的HTML
    blog = page.locator('.user-profile-head-info-r-c')
    print(blog.inner_html())
    print('-----------------------------------')
    print(blog.inner_text())

    # ---------------------
    context.close()
    browser.close()


with sync_playwright() as playwright:
    run(playwright)

----------------------------------------------
打印的inner_text如下：
119,102
总访问量
545
原创
3,577
排名
53
粉丝
0
铁粉
学习成就

获取页面文本

text_content() 用来获取某个元素内所有文本内容，包含子元素内容，隐藏元素也能获取。
inner_text() 的返回值会被格式化 ,但是text_content()的返回值不会被格式化
最重要的区别 inner_text()返回的值, 依赖于页面的显示, text_content()依赖于代码的内容

示例代码如下：

from playwright.sync_api import Playwright, sync_playwright, expect


def run(playwright: Playwright) -> None:
    browser = playwright.chromium.launch(headless=False)
    context = browser.new_context()
    page = context.new_page()
    page.goto("https://blog.csdn.net/Tester_muller?type=lately")
    # 获取某个元素的HTML
    blog = page.locator('.user-profile-head-info-r-c')
    # print(blog.inner_html())
    print('-----------------------------------')
    print(blog.inner_text())
    print('-----------------------------------')
    print(blog.text_content())

--------------------------------
输出结果如下：
119,126
总访问量
545
原创
3,577
排名
53
粉丝
0
铁粉
学习成就
-----------------------------------
博客：119,124      视频：2 119,126 总访问量  545 原创  3,577 排名  53 粉丝   0 铁粉   学习成就

all_inner_texts() 与 all_text_contents()

all_inner_texts() 和 all_text_contents() 也是用于获取页面上的文本，但是返回的是list列表，示例如下：

from playwright.sync_api import Playwright, sync_playwright, expect


def run(playwright: Playwright) -> None:
    browser = playwright.chromium.launch(headless=False)
    context = browser.new_context()
    page = context.new_page()
    page.goto("https://blog.csdn.net/Tester_muller?type=lately")
    # 获取某个元素的HTML
    blog = page.locator('.user-profile-head-info-r-c')
    print(blog.all_inner_texts())
    print('-----------------------------------')
    print(blog.all_text_contents())

    # ---------------------
    context.close()
    browser.close()
-----------------------------------------
输出结果如下：

['119,131\n总访问量\n545\n原创\n3,577\n排名\n53\n粉丝\n0\n铁粉\n学习成就']
-----------------------------------
['博客：119,129      视频：2 119,131 总访问量  545 原创  3,577 排名  53 粉丝   0 铁粉   学习成就']

总结

本文主要介绍了playwright打印页面内容的方法，playwright相比selenium的一大优点就是，playwright能够打印部分页面内容，还可以提取文本等信息，我们熟练使用playwright，能够解决一些使用selenium无法解决的问题。

标签：web,playwright,text,blog,inner,context,page,软件测试
From： https://www.cnblogs.com/hogwarts/p/17617755.html

软件测试|性能测试中常用的性能指标有哪些？
一般，我们做性能测试的目标是，在大用户量、数据量的超负荷下，获得服务器运行时的相关数据，从而分析出系统瓶颈，提高系统的稳定性。而在一份性能测试报告里，会看到以下的这些关键的数据指标：最大并发用户数，HPS（点击率）、事务响应时间、每秒事务数、每秒点击量、吞吐量、CPU使用率、物理内......
软件测试|Windows系统安装Cypress教程
前言每当提起web自动化测试，大家首先想到的就是selenium，最近这两年时间，出现了playwright和cypress这两款新的工具，不过现在应用范围还是不如selenium，之前我们介绍了playwright的使用，现在开始，我们将介绍cypress工具。cypress是一款易于使用、快速稳定、可靠性高、全面性强的自动化测试......
软件测试|Python函数参数之必传参数、默认参数、可变参数、关键字参数的详细使用
在Python中，函数参数是定义在函数头部的变量，用于接收传递给函数的数据。Python函数参数有四种类型：必传参数、默认参数、可变参数和关键字参数。每种类型都有不同的使用方式和适用场景。本文将详细介绍这四种函数参数的使用方法。Python函数参数类型必传参数：最常用的，必传确定数量的参......
Weblogic WLS Core Components 反序列化命令执行漏洞（CVE-2018-2628）
Vulhub-Docker-Composefileforvulnerabilityenvironment1、介绍名称：WeblogicWLSCoreComponents反序列化命令执行漏洞（CVE-2018-2628）编号：CVE-2018-2628原理：应用：Weblogic 版本：Weblogic10.3.6.0，Weblogic12.1.3.0，Weblogic12.2.1.2，Weblogic12.2.1.32、测试2.......
老杜 JavaWeb 讲解（二十） ——Listener监听器
(十八)Listener监听器引子：静态代码块packagecom.zwm.javaweb.servlet;/***@author猪无名*@date2023/8/81347*discription:*/publicclasstest2{//静态代码块在类加载时执行，并且只执行一次。//这个语法很简单，但什么时候用？很疑惑//假如，你希......
web后端有前途吗
1、后端工程师有前途吗?2、后端和前端哪个前景好3、后端的就业前景怎么样?4、web前端与后端工资对比是怎样的?哪个发展前景比较好?5、web前端好找工作还是后端好找工作,本人自学2个月前端了和后端了。现后端工程师有前途吗?发展前景不错，可以做模块工程师和顶层工程师，模块......
SpringBoot - Web项目起步
环境搭建开发规范1开发规范2.1开发规范2.2开发规范2.3开发流程......
Web编辑器可以如何直接复制word的图文内容到编辑器中?
如何做到ueditor批量上传word图片？1、前端引用代码<!DOCTYPE html PUBLIC "-//W3C//DTDXHTML1.0Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml"><head>......
TSINGSEE青犀视频监控汇聚平台EasyCVR视频分享页面WebRTC流地址播放不了是什么原因？
开源EasyDarwin视频监控TSINGSEE青犀视频平台EasyCVR能在复杂的网络环境中，将分散的各类视频资源进行统一汇聚、整合、集中管理，在视频监控播放上，TSINGSEE青犀视频安防监控汇聚平台可支持1、4、9、16个画面窗口播放，可同时播放多路视频流，也能支持视频定时轮播。视频监控汇聚平台EasyC......
python--web--让python提供api服务--aiohttp
aiohttp介绍官网上有这样一句话介绍：AsyncHTTPclient/serverforasyncioandPython翻译过来就是基于asyncio和Python实现的异步HTTP客户端/服务器asyncio可以实现单线程并发IO操作。也就是做异步操作。如果仅用在客户端，发挥的威力不大。如果把asyncio用在服务器端，例如Web服务器......

软件测试|web自动化测试神器playwright教程（三十四）

前言

获取完整页面html内容

获取部分HTML内容

获取页面文本

all_inner_texts() 与 all_text_contents()

总结

相关文章

赞助商

阅读排行