软件测试|web自动化测试神器playwright教程（三十四）

时间：2023-06-27 16:33:22浏览次数：61

标签：web playwright text inner context print page 软件测试

软件测试|web自动化测试神器playwright教程（三十四）_访问量

前言

selenium有一个爬虫特别喜欢的功能，就是driver.page_source功能，它可以打印整个html页面的内容，我们可以从整个页面的内容中提取出我们想要的内容，playwright同样支持打印整个html页面的内容。

获取更多技术资料，请点击！

获取完整页面html内容

playwright提供了page.content()方法来获取页面内容，示例如下：

from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch(headless=False)
    context = browser.new_context()
    page = context.new_page()

    page.goto("https://ceshiren.com/")
    print(page.content())

运行脚本，结果如下图：

软件测试|web自动化测试神器playwright教程（三十四）_Python_02

获取部分HTML内容

page.content() 是获取整个页面的HTML,但是有时候我们不需要获取完整的HTML内容，例如下面的页面，我们只取部分的内容：

软件测试|web自动化测试神器playwright教程（三十四）_访问量_03

playwright提供了locator().inner_html()方法获取页面内容

inner_html() 获取元素的整个html源码内容
inner_text() 获取元素的文本内容

示例代码如下：

from playwright.sync_api import Playwright, sync_playwright, expect


def run(playwright: Playwright) -> None:
    browser = playwright.chromium.launch(headless=False)
    context = browser.new_context()
    page = context.new_page()
    page.goto(
    # 获取某个元素的HTML
    blog = page.locator('.user-profile-head-info-r-c')
    print(blog.inner_html())
    print('-----------------------------------')
    print(blog.inner_text())

    # ---------------------
    context.close()
    browser.close()


with sync_playwright() as playwright:
    run(playwright)

----------------------------------------------
打印的inner_text如下：
119,102
总访问量
545
原创
3,577
排名
53
粉丝
0
铁粉
学习成就

获取页面文本

text_content() 用来获取某个元素内所有文本内容，包含子元素内容，隐藏元素也能获取。 inner_text() 的返回值会被格式化 ,但是text_content()的返回值不会被格式化最重要的区别 inner_text()返回的值, 依赖于页面的显示, text_content()依赖于代码的内容

示例代码如下：

from playwright.sync_api import Playwright, sync_playwright, expect


def run(playwright: Playwright) -> None:
    browser = playwright.chromium.launch(headless=False)
    context = browser.new_context()
    page = context.new_page()
    page.goto
    # 获取某个元素的HTML
    blog = page.locator('.user-profile-head-info-r-c')
    # print(blog.inner_html())
    print('-----------------------------------')
    print(blog.inner_text())
    print('-----------------------------------')
    print(blog.text_content())

--------------------------------
输出结果如下：
119,126
总访问量
545
原创
3,577
排名
53
粉丝
0
铁粉
学习成就
-----------------------------------
博客：119,124      视频：2 119,126 总访问量  545 原创  3,577 排名  53 粉丝   0 铁粉   学习成就

all_inner_texts() 与 all_text_contents()

all_inner_texts() 和 all_text_contents() 也是用于获取页面上的文本，但是返回的是list列表，示例如下：

from playwright.sync_api import Playwright, sync_playwright, expect


def run(playwright: Playwright) -> None:
    browser = playwright.chromium.launch(headless=False)
    context = browser.new_context()
    page = context.new_page()
    page.goto
    # 获取某个元素的HTML
    blog = page.locator('.user-profile-head-info-r-c')
    print(blog.all_inner_texts())
    print('-----------------------------------')
    print(blog.all_text_contents())

    # ---------------------
    context.close()
    browser.close()
-----------------------------------------
输出结果如下：

['119,131\n总访问量\n545\n原创\n3,577\n排名\n53\n粉丝\n0\n铁粉\n学习成就']
-----------------------------------
['博客：119,129      视频：2 119,131 总访问量  545 原创  3,577 排名  53 粉丝   0 铁粉   学习成就']

总结

本文主要介绍了playwright打印页面内容的方法，playwright相比selenium的一大优点就是，playwright能够打印部分页面内容，还可以提取文本等信息，我们熟练使用playwright，能够解决一些使用selenium无法解决的问题。

标签：web,playwright,text,inner,context,print,page,软件测试
From： https://blog.51cto.com/u_15649298/6563995

功能测试——web功能测试点
WEB测试方法总结-笔记一、输入框1、字符型输入框：（1）字符型输入框：英文全角、英文半角、数字、空或者空格、特殊字符“~！@#￥%……&*？[]{}”特别要注意单引号和&符号。禁止直接输入特殊字符时，使用“粘贴、拷贝”功能尝试输入。（2）长度检查：最小长度、最大长度、最小长度-1、最大长度+1、输入超......
web.xml
<?xmlversion="1.0"encoding="UTF-8"?><web-appxmlns="http://xmlns.jcp.org/xml/ns/javaee"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="http://xmlns.jcp.o......
Vite、esbuild 以及 webpack 比较
一、前言这三者的定位都有些不同，不好直接比较，但是做的事情还算类似，因此放一块拿来说说。vite是新生技术，由其快速优秀的开发体验有取代webpack的趋势，但是它并不如webpack打包工具那么灵活，vite内部的打包工具是采用的esbuild，其性能之高也来自于此。二、Vite2.0特性基于......
Design a Drum-kit web app using JavaScript Javascript设计drum-kit项目
Weallmusthaveseenadrumkitinsomeconcertorelsewhere,itisacollectionofdrums,cymbalsandotherpercussioninstruments.Buthaveyoueverimaginedmakingthatdrumkitonyourownvirtuallywiththehelpofsomescriptinglanguage?Well,so......
.NET Core WEB API中参数的模型绑定方式
.NETCoreWEBAPI中参数的模型绑定方式有以下几种：参考文献：.NETCoreWEBAPI中接口参数的模型绑定的理解-枫叶456-博客园(cnblogs.com)微软官方说明文档 FromForm：当请求属于表单提交，也就是content-type为application/x-www-form-urlencoded，则必须给参数加上From......
C# WebApi+Swagger
1、新建一个webapi项目 2、添加swagger的NuGet包 3、右键项目--》属性--》生成输出勾选：XML文档文件，如果没有自动填充好路径，需要自己填写一下，文件名可以自己取 4、打开App_Start文件夹下的SwaggerConfig.cs文件，新增一个如下方法：privatestaticstringGetXmlComm......
微信小程序连接websocket随记
微信小程序需要上报经纬度到服务器，采用workman作为Websocket服务，记录一下步骤：1、修改start_gateway.php文件//$gateway=newGateway("tcp://0.0.0.0:8282");$gateway=newGateway("websocket://0.0.0.0:8282");2、在小程序后台配置socket域名(开发-> 开发管理-> 开发设......
jmeter测试websocket接口
Jmeter测试websocket接口一．Websocket接口原理1.打开网页：从http协议，升级到websocket协议，请求简历websocket连接2.服务器返回建立成功成功3.客户端向服务端发送匹配请求4.服务端选择一个客服上线5.服务器返回客服id6.客户端向服务器发送消息7.服务器推送消息给指定的客服8.服务器向......
go:（三）web编程：socket
引用：08.1.Socket编程|第八章.Web服务|《GoWeb编程》|Go技术论坛(learnku.com)1.什么是socket： 2.socket如何通信： 3.Socket基础知识：类型：TCPSocket和UDPSocket......
webpack 工程化
前端工程化webpackhtml自动快速生成语法ul>li{这是第$个li}*91.新建项目目录，运行npminit-y初始化package.json2.npminstalljquery-s安装jquery项目中安装webpack-D代表[email protected]@4.7.2-Dwebpack的基本使用......

软件测试|web自动化测试神器playwright教程（三十四）

前言

获取完整页面html内容

获取部分HTML内容

获取页面文本

all_inner_texts() 与 all_text_contents()

总结

相关文章

赞助商

阅读排行